MNIST dataset letöltése és előkészítése

10. MNIST dataset letöltése és előkészítése saját függvénnyel

Letöltjük az MNIST datasetet, mint kiderül ez nem is olyan triviális. Megírjuk azt a függvényt, ami letölti, kicsomagolja OS függetlenül és Numpy array-be rendezi a képeket. Közben hashelünk és Big endiannal bytekódot értelmezünk, nem lesz vicces!

Ingyenes beiratkozás

Aki eddig csak library segítségével például Pytorchal töltötte le az MNIST datasetet, annak talán meglepetés lehet, hogy ez nem is annyira egyszerű. Talán elsőre furcsa - byteformátumban - vannak a képek elrejtve. Kiváló alkalom megismerkedni a byte formátummal a big és little endiannal és hogyan kezeljük ezt Pythonban. Kicsit hashelünk is, hogy átmeneti fájlnevet hozzunk létre és operációs rendszertől függetlenül megoldjuk a letöltést és kicsomagolást is. Ez a tanfolyam opcionális a deep learning útvonalhoz.

Szükséges előismeretek!

Python ismeretek szükségesek, ajánlom figyelmedbe a python tanfolyam sorozatot.
Kinek ajánljuk?

Aki szeretné teljesen keretrendszer mentesen implementálni a kézzel írt számjegyek felismerését annak, a dataset letöltését is jó ha anélkül végzi.
Mit tanulsz meg?

Byte olvasást, hashelést, fájletöltést, kicsomagolást pythonnal!

Témakörök

1
- 1. Bevezető, miről szól ez a tanfolyam?
- 2. MNIST dataset
- 3. Pytorch baseline
- 4. Requests library a letöltéshez
- 5. A letöltött dataset elmentése
- 6. Operációs rendszer független mentés
- 7. MD5 hash és UTF-8-al temp fájlnév generálás
- 8. OS szeparátorra figyeljünk
- 9. MNIST letöltése, kicsomagolása gzippel
- 10. Is file exists?
- 11. Big, Little endian byte olvasásakor
- 12. Struct a byte olvasó (unpack)
- 13. Mi a frászkarikát művelünk?
- 14. Sor és oszlopszám kiolvasása
- 15. Végre az adatok (képek) kiolvasása
- 16. Labels kiolvasása
- 17. Utils.py -ba helyezzük a kódot
- 18. MNIST dataset letöltése saját függvényünkkel
- Project letöltése

Oktató

AI expert

Péter Litkei

Engem már teljesen besszipantott a mesterséges intelligencia, pontosabban a deep learning világa. 2012-től kezdődően a legtöbb szolgáltatás használ valamiféle neurális hálót, - kép és beszédfelismerők, google translate, önvezető autók és mire te ezt olvasod valószínűleg a barátod/barátnőd is :) - a jövő egyértelműen ez.

Szükséges előismeretek!

Kinek ajánljuk?

Mit tanulsz meg?

MNIST letöltése kézzel