Aki eddig csak library segítségével például Pytorchal töltötte le az MNIST datasetet, annak talán meglepetés lehet, hogy ez nem is annyira egyszerű. Talán elsőre furcsa - byteformátumban - vannak a képek elrejtve. Kiváló alkalom megismerkedni a byte formátummal a big és little endiannal és hogyan kezeljük ezt Pythonban. Kicsit hashelünk is, hogy átmeneti fájlnevet hozzunk létre és operációs rendszertől függetlenül megoldjuk a letöltést és kicsomagolást is. Ez a tanfolyam opcionális a deep learning útvonalhoz.

  • Szükséges előismeretek!

    Python ismeretek szükségesek, ajánlom figyelmedbe a python tanfolyam sorozatot.

  • Kinek ajánljuk?

    Aki szeretné teljesen keretrendszer mentesen implementálni a kézzel írt számjegyek felismerését annak, a dataset letöltését is jó ha anélkül végzi.

  • Mit tanulsz meg?

    Byte olvasást, hashelést, fájletöltést, kicsomagolást pythonnal!

Témakörök

  1. 1
    • 1. Bevezető, miről szól ez a tanfolyam?

    • 2. MNIST dataset

    • 3. Pytorch baseline

    • 4. Requests library a letöltéshez

    • 5. A letöltött dataset elmentése

    • 6. Operációs rendszer független mentés

    • 7. MD5 hash és UTF-8-al temp fájlnév generálás

    • 8. OS szeparátorra figyeljünk

    • 9. MNIST letöltése, kicsomagolása gzippel

    • 10. Is file exists?

    • 11. Big, Little endian byte olvasásakor

    • 12. Struct a byte olvasó (unpack)

    • 13. Mi a frászkarikát művelünk?

    • 14. Sor és oszlopszám kiolvasása

    • 15. Végre az adatok (képek) kiolvasása

    • 16. Labels kiolvasása

    • 17. Utils.py -ba helyezzük a kódot

    • 18. MNIST dataset letöltése saját függvényünkkel

    • Project letöltése

Oktató

AI expert

Péter Litkei

Engem már teljesen besszipantott a mesterséges intelligencia, pontosabban a deep learning világa. 2012-től kezdődően a legtöbb szolgáltatás használ valamiféle neurális hálót, - kép és beszédfelismerők, google translate, önvezető autók és mire te ezt olvasod valószínűleg a barátod/barátnőd is :) - a jövő egyértelműen ez.