Množina údajov MNIST v Pythone - základný import a vykresľovanie

Vyskúšajte Náš Nástroj Na Odstránenie Problémov

Vitajte v tomto návode na množinu údajov MNIST. V tomto návode sa naučíme, čo je množina údajov MNIST, ako ju importovať do Pythonu a ako ju vykresliť pomocou matplotlib .

Čo je to súbor údajov MNIST?

Sada MNIST je veľká zbierka ** ručne písaných číslic. ** Je to veľmi populárny súbor údajov v oblasti spracovania obrazu. Často sa používa na porovnávanie algoritmov strojového učenia.

_MNIST _ je skratka pre ** Upravená databáza Národného ústavu pre štandardy a technológie. **



MNIST obsahuje zbierku 70 000, 28 x 28 obrázky ručne písaných číslic z 0 až 9.

Dátový súbor je už rozdelený na tréningové a testovacie sady. Uvidíme to neskôr v návode.

ako odinštalovať balík npm

Viac informácií o MNIST nájdete v jeho Stránka Wikipedia . Chystáme sa importovať množinu údajov z Kerasu.

Začnime načítaním množiny údajov do nášho prenosného počítača python.

Načítava sa MNIST z Kerasu

Najprv budeme musieť importovať množinu údajov MNIST z Tvrdý modul .

Môžeme to urobiť pomocou nasledujúceho riadku kódu:

od keras.datasets import mnist

Teraz načítame tréningové a testovacie sady do samostatných premenných.

(train_X, train_y), (test_X, test_y) = mnist.load_data()

Poďme zistiť, koľko obrázkov je v tréningových a testovacích sadách. Inými slovami, skúsme zistiť pomer rozdelenia tejto množiny údajov.

Ak sa chcete dozvedieť viac o rozdelenom pomere, pozrite si tento návod na ako rozdeliť údaje na tréningové a testovacie sady.

Aby sme našli pomer rozdelenia, vytlačíme tvary všetkých vektorov.

print``(``'X_train: ' + str``(train_X.shape))

print``(``'Y_train: ' + str``(train_y.shape))

print``(``'X_test: ' + str``(test_X.shape))

print``(``'Y_test: ' + str``(test_y.shape))

Výkon:

X_train: (``60000``, 28``, 28``)

zdieľaná poloha máp google sa neaktualizuje

Y_train: (``60000``,)

X_test: (``10000``, 28``, 28``)

Y_test: (``10000``,)

Vidíme, že existujú 60 000 obrázkov v tréningovej sade a 10 000 obrázkov v testovacej sade.

Rozmer nášho tréningového vektora je (60 000, 28, 28) , je to preto, že existuje ** 60 000 obrázkov v odtieňoch sivej ** s daným rozmerom 28 x 28.

#python pokročilý #strojové učenie

www.journaldev.com

Množina údajov MNIST v Pythone - základný import a vykresľovanie

Vitajte v tomto návode na množinu údajov MNIST. V tomto tutoriáli sa naučíme, čo je množina údajov MNIST, ako ju importovať do Pythonu a ako ju vykresliť pomocou matplotlib.

Pozri Tiež: