Hallo wer boggt denn da auf Latein?...
... war mein erster Gedanke heute früh als ich sah dass "Ricette Vegane per Cani" mir folgte. Das machte mich neugierig auf veganische Rezepte für Hunde in Latein.
Naja, es war nicht Latein, sondern Italienisch. Genauer der Blogg ist zweisprachig. Manches ist in Englisch, anderes in Italienisch. Und weil es auf Google+ ist, gibt es überall einen Link zum Übersetzen. Das schätze ich sehr. Ich hab es dann mal für ein veganisches Rezept für eine Hundemahlzeit ausprobiert. Schau selbst:
---- Zitat ---- Italienisch ----
Cibi Vietati: Semi e Noccioli
Nel somministrare la frutta ai nostri cani dobbiamo ricordarci di alcuni divieti:
Essi sono estremamente dannosi perché, oltre a potere causare ostruzioni intestinali, contengono cianuro che è velenoso per gli umani e per i cani. L’unica differenza è che noi umani sappiamo che essi non si mangiano, i cani no.
Inoltre,
I semi dei cachi.
Anch’essi possono causare infiammazioni e ostruzioni intestinali.
----- Automatisch in Deutsch Übersetzt ----
Verbotene Lebensmittel: Samen & Kerne
Bei der Abgabe Obst zu unseren Hunden müssen wir bedenken, Verbote
Sie sind extrem gefährlich, weil zusätzlich zu der Möglichkeit, Darmverschlüsse verursachen, enthalten Cyanid, was für Menschen giftig und Hunde. Der einzige Unterschied ist, dass wir Menschen wissen, dass sie nicht essen, tun Hunde nicht.
Ferner
Die Samen der Kaki.
Auch sie kann dazu führen, Entzündungen und Darmverschlüsse.
------- Zitat Ende ----
Ein deutsch-sprachiger Veganer der weder Latein noch Italienisch gelernt hat - so wie ich - der wird die Deutsche Übersetzung zu schätzen wissen. Aber interessant ist auch was scheinbar perfekt übersetzt ist und wo die Übersetzung hapert.
Der weise Mann [xy] war dem System bekannt, und irgendwann wird es auch den Lehrer Tom kennen.
Naja, es war nicht Latein, sondern Italienisch. Genauer der Blogg ist zweisprachig. Manches ist in Englisch, anderes in Italienisch. Und weil es auf Google+ ist, gibt es überall einen Link zum Übersetzen. Das schätze ich sehr. Ich hab es dann mal für ein veganisches Rezept für eine Hundemahlzeit ausprobiert. Schau selbst:
---- Zitat ---- Italienisch ----
Cibi Vietati: Semi e Noccioli
Nel somministrare la frutta ai nostri cani dobbiamo ricordarci di alcuni divieti:
- Semi della mela.
- Nocciolo della pesca.
- Nocciolo della ciliegia.
- Nocciolo della prugna.
- Nocciolo dell’albicocca.
Essi sono estremamente dannosi perché, oltre a potere causare ostruzioni intestinali, contengono cianuro che è velenoso per gli umani e per i cani. L’unica differenza è che noi umani sappiamo che essi non si mangiano, i cani no.
Inoltre,
I semi dei cachi.
Anch’essi possono causare infiammazioni e ostruzioni intestinali.
----- Automatisch in Deutsch Übersetzt ----
Verbotene Lebensmittel: Samen & Kerne
Bei der Abgabe Obst zu unseren Hunden müssen wir bedenken, Verbote
- Apple-Samen.
- Peach Kernel.
- Fact der Kirsche.
- Fact der Pflaume.
- Apricot Kernel.
Sie sind extrem gefährlich, weil zusätzlich zu der Möglichkeit, Darmverschlüsse verursachen, enthalten Cyanid, was für Menschen giftig und Hunde. Der einzige Unterschied ist, dass wir Menschen wissen, dass sie nicht essen, tun Hunde nicht.
Ferner
Die Samen der Kaki.
Auch sie kann dazu führen, Entzündungen und Darmverschlüsse.
------- Zitat Ende ----
Ein deutsch-sprachiger Veganer der weder Latein noch Italienisch gelernt hat - so wie ich - der wird die Deutsche Übersetzung zu schätzen wissen. Aber interessant ist auch was scheinbar perfekt übersetzt ist und wo die Übersetzung hapert.
- die Überschrift - perfekt
- die Liste der Verbotenen Lebensmittel-Bestandteile - perfekt
- Inoltre, ein Wort in einer Zeile - perfekt
- "Die Samen der Kaki." - perfekt
Kurzum: Alles was lexikalisch 1:1 übersetzt werden kann funktioniert in der automatischen Übersetzung perfekt. Sobald Syntax und Grammatik im Spiel sind hapert die Übersetzung.
Woran liegt es?
Gehen wir mal davon aus, dass Google eine Art der statistischen Analyse zum Aufbau seiner Lexika benutzt. Im einfachsten Fall analysiert der Algorithmus die Häufigkeit einzelner Worte aus einer bestimmten Quelle mit der Häufigkeit anderer Worte aus der korrekten Übersetzung dieser Quelle. Das führt dann ziemlich schnell zu brauchbaren Wörterbüchern, die nicht nur lexikalisch übersetzen können, sondern auch zur Rechtschreibkorrektur taugen. Eindeutig eine nützliche Big-Data Anwendung.
Ein ausgefeilterer Algorithmus könnte nun nach Phrasen und einfachen Sätzen suchen. Die gleiche Methode, die zuvor genutzt wurde um Wörterbücher aufzubauen wird nun benutzt um Sammlungen von Phrasen zu erstellen.
- Schau das ist der Lehrer Tom.
- Schau das ist die kluge Marie.
- Schau das ist die Differenzialgleichung zum Strömungsverhalten von Vanille Pudding.
Am letzten Eintrag in der Liste scheitert die automatische Rechtschreibkorrektur am Wort "Strömungsverhalten". Was macht der Google Übersetzer aus der Liste. Wir erinnern uns, die Liste mit Rezept-Zutaten (bzw. verbotenen Ingredienzien zur Hunde-Futter-Herstellung) war fehlerfrei!
- Show that the teacher is Tom.
- Look this is the wise Marie.
- Look this is the differential equation for the flow behavior of custard.
Ein einfacher Satz wie "Schau das ist der Lehrer Tom." wird falsch übersetzt, während eine grammatikalisch gleichwertige Komposition aus Phrasen, wie sie in Wissenschaftlichen Texten verwendet werden perfekt übersetzt wird. Die Phrase "Schau das ist..." ist eine Pseudo-Phrase, weil sie in geschriebenen Texten, die Google vorliegen, kaum vorkommt und somit nicht als Phrase vom Algorithmus erkannt wurde. Die "kluge Marie" und die "Diffrenzialgleichung zum Strömungsverhalten von" [ xy ] war dem System schon bekannt. Probieren wir:
- der weise Mann Tom
- Schau das ist der weise Mann Tom
Das Ergebnis:
- the wise man Tom
- Look this is the wise man Tom
Probleme?
Na klar. Du kannst dir bei dieser Methode nicht sicher sein, das eine scheinbar korrekte Übersetzung wirklich eine korrekte Übersetzung ist. Eine Phrase wie "Schau das ist" wird erst als Phrase erkannt wenn eine andere Phrase "der weise Mann", "Differenzialgleichung zum Strömungsverhalten" usw. erkannt wurden. Die einfachste Ebene auf der das System korrekt arbeitet ist das Wörterbuch. Scheinbar korrekte Ergebnisse werden für Phrasen-Kombinationen erzeugt. Dort wo eine Kombination "Phrase / Wörterbuch" gefragt ist, scheitert das System, wenn die Phrase nicht als solche erkannt wird und das System auf eine lexikalische Übersetzung zurückfällt.
Phrasen sind in diesem Zusammenhang nichts weiter als aufgebohrte Wörterbücher. Von einer grammatikalischen Analyse, die prinzipiell möglich wäre, ist das System noch weit entfernt.
Fazit
Ich habe "Ricette Vegane per Cani" in meine Liste der zu folgenden Blogger aufgenommen auch wenn Google die Rezepte nur zum Hausgebrauch und auf dem Niveau "zur dringenden Überarbeitung" übersetzt. Raubtiere vegan zu ernähren finde ich interessant.
allgemeinverständliche Literatur zu BigData