Software lernt Englisch, Chinesisch und "Proteinisch"

  • Themenstarter Themenstarter non
  • Beginndatum Beginndatum
N

non

Guest
Forscher aus Israel und den USA haben ein Computerprogramm entwickelt, das die Grammatik diverser Sprachen lernen kann. Das Programm kommt weitgehend ohne Lehrer aus, denn es bildet die grammatischen Regeln anhand von statistischen Mustern, die es vorher aus Texten abgeleitet hat. Wie ein Team um Shimon Edelman von der Cornell University berichtet, funktioniert das Programm nicht nur bei natürlichen und künstlichen Sprachen, sondern prinzipiell bei allen nicht-zufälligen Symbolfolgen. Also etwa auch bei Sequenzdaten aus der Biologie.

"Colorless green ideas sleep furiously." Dieser Satz, ist zwar offensichtlich sinnlos, trotzdem fällt es uns ziemlich leicht, ihn als grammatikalisch korrekt zu erkennen. Ganz im Gegensatz etwa zu: "Ideas colorless sleep furiously green." Wie Noam Chomsky 1957 in seinem Buch "Syntactic Structures" hinwies, können wir nur beim ersten Satz in kürzester Zeit ein Urteil über dessen so genannte Wohlgeformtheit abgeben, obwohl beide - sinnlosen - Wortfolgen gleich unwahrscheinlich sind. So unwahrscheinlich nämlich, dass wir vermutlich nie in unserem Leben mit ihnen konfrontiert wurden.

Chomskys Schluss daraus: Die statistischen Eigenschaften der Sprache spielen für den natürlichen Spracherwerb bestenfalls eine untergeordnete Rolle, entscheidend sind angeborene grammatische Strukturen und logisches Denken.

Neuere Forschungen zeigen allerdings, dass neben Regeln sehr wohl statistische Informationen für Erwerb und Gebrauch der Sprache wichtig sind (Science 298, 553).
Das gilt nicht nur für Menschen, sondern auch für Programme, mit deren Hilfe Computer Sprachen erlernen sollen. Ein aktuelles Beispiel dafür ist das Programm ADIOS ("automatic distillation of structure"), die von einem Team um den Psychologen Shimon Edelman entwickelt wurde.

Das Besondere daran: Der Algorithmus muss nur mit Textproben gefüttert werden, dann setzt ein selbständiger Lernprozess ein, bei dem ADIOS statistische Muster aus den verwendeten Texten extrahiert und dann zu hierarchischen Regeln verallgemeinert.

Text, Quelle und kompletter Artikel: http://science.orf.at/science/news/138559
 
Zurück
Oben