F
Fluffy
Guest
Hallo,
Ich bin gerade dabei mich etwas mehr mit ML auseinander zu setzen.
Nun ist ein klassisches Beispiel Nummernerkennung mittels des MNIST-Datensatzes ( http://yann.lecun.com/exdb/mnist/ ) .
Nun ist das Problem hierbei das die ihr eignes Format haben.
Ich suche hier http://archive.ics.uci.edu/ml/index.php und ich finde andere Datensaetze aber auch die sind schon vorbereitet.
Ich verstehe das das
a) Platzsparend ist
b) direkte Eingaben fuer das Neuronale Netz ist.
ABER:
Ich schaue mir gerade PyTorch an und wuerde das gerne Schritt fuer Schritt machen.
Datenaufbereitung ist nichts spannendes aber arbeitsintensiv und das ist was was ich nicht brauche, fuer ML und schon kann, notfalls wuerde ich diese Datensaetze einfach in eine 16x16 Matrix kippen und wieder in ein Bild verwandeln, aber wenn ich nicht muss, wiso sollte ich.
Nun wollte ich mal fragen ob es i.w. die originalen Bilder dafuer gibt, oder i.w. aehnliche rohen Datensaetze.
Haette eigentlich gedacht das Wissenschaftler alle ihre Datensaetze veroeffentliche, und nicht nur die die man fuer das neuronale Netz als eingabe braucht.
Cheers
Fluffy
Ich bin gerade dabei mich etwas mehr mit ML auseinander zu setzen.
Nun ist ein klassisches Beispiel Nummernerkennung mittels des MNIST-Datensatzes ( http://yann.lecun.com/exdb/mnist/ ) .
Nun ist das Problem hierbei das die ihr eignes Format haben.
Ich suche hier http://archive.ics.uci.edu/ml/index.php und ich finde andere Datensaetze aber auch die sind schon vorbereitet.
Ich verstehe das das
a) Platzsparend ist
b) direkte Eingaben fuer das Neuronale Netz ist.
ABER:
Ich schaue mir gerade PyTorch an und wuerde das gerne Schritt fuer Schritt machen.
Datenaufbereitung ist nichts spannendes aber arbeitsintensiv und das ist was was ich nicht brauche, fuer ML und schon kann, notfalls wuerde ich diese Datensaetze einfach in eine 16x16 Matrix kippen und wieder in ein Bild verwandeln, aber wenn ich nicht muss, wiso sollte ich.
Nun wollte ich mal fragen ob es i.w. die originalen Bilder dafuer gibt, oder i.w. aehnliche rohen Datensaetze.
Haette eigentlich gedacht das Wissenschaftler alle ihre Datensaetze veroeffentliche, und nicht nur die die man fuer das neuronale Netz als eingabe braucht.
Cheers
Fluffy