Website übersetzen

Hi, ich hab vor Teile einer Website zu übersetzen, möchte aber die Website an sich mitsamt den Skripten etc. intakt lassen. Meine erste Idee dazu war folgendes:


PHP:
<?php
$html = file_get_contents('http://www.google.de');

$html = ereg_replace("Google","Zoozle",$html);

echo $html;
?>

Dieses einfache Skript ändert alle Google's in Zoozle's um - also genau das was ich machen möchte... Problem dabei ist, dass dann die Bilder nichtmehr angezeigt werden und auch die ganzen Links auf der Seite nicht mehr funktionieren - logisch, da sie ja auf /irgendwas verweisen und nicht auf www.google.de/irgendwas und ich so auf www.meinserver.de/irgendwas lande.

Irgendeine Idee was ich machen kann damit die Website an und für sich intakt bleibt, ich nur den Text verändern kann? Ich wüsste jetzt spontan nicht wie ich ne Abfrage dafür schreiben müsste damit alle Links funktionieren, die Bilder angezeigt werden, Variablen per Get und Post richtig verschickt werden (und ich denke da wirds kompliziert) etc....
hoffe jemand kann mir weiterhelfen :)

mfg,
crack

edit: Naja ums mal etwas genauer zu machen - das was ich übersetzen will ist ein Intelligenztest auf Englisch. Da werden halt so schön Bildchen gezeigt und Fragen gestellt die man mit Radiobuttons richtig oder eben falsch anklicken muss. Der Test besteht aus mehreren Seiten, über die die Antworten per Post-Daten weitergeleitet werden - und schließlich auf der letzten Seite ausgewertet werden :) Wie stell ich das also an das ich mir auch über diese Seiten weiterhangeln kann, ohne das die Daten verloren gehen... ich also nur die Ausgabe zum Browser manipuliere aber nix dadurch verpfusche. Doof ausgedrückt alles, ich weiß...^^

mfg,
crack
 
du wirst nicht darum herum kommen, den html/javascript teil zu parsen und z.B. mit regex wichtige Elemente von deiner Übersetzung zu bewahren.

Evtl. wäre ein sauberer Neuaufbau schneller als einen Parser, der die HTML Syntax richtig interpertiert, zu schreiben. Evtl. gibts ja sowas schon? Würde mal nach sowas suchen :)
 
Original von 90nop
Evtl. wäre ein sauberer Neuaufbau schneller als einen Parser, der die HTML Syntax richtig interpertiert, zu schreiben. Evtl. gibts ja sowas schon? Würde mal nach sowas suchen :)

Ich verstehe nicht ganz... was verstehst du unter einem "sauberen Neuaufbau"? Die Seite komplett "kopieren" und nur die entsprechenden Teile anpassen? Wäre das überhaupt möglich? (zwecks Weiterleitung der Daten, bin mir da grad nich so sicher ob sich das mit den Postdaten vereinbaren lässt)

Ansonsten würde mich aber generell die Idee eine Seite per PHP zu parsen und zu manipulieren reizen^^ Weiß nur leider nicht wie ich das "Patentrezept" dafür finden kann, meiner Überlegung nach müsste man ja nach den entsprechenden Teilen suchen, also z.B. Slashes und davor den Seitennamen einfügen sodass aus /irgendwas www.server.de/irgendwas wird... aber das auch nicht bei JEDEM Slash sondern nur welche vor denen nichts oder " stehen oder so^^

waah, wird schon wieder so kompliziert :P
Aber naja, verrat mir mal deinen Gedanken zum Neuaufbau^^


mfg,
crack
 
Mit Neuaufbau meine ich, dass du sämtliche Texte, die ausgegeben werden durch Variabeln ersetzt und diese durch z.B. Sprach Tabellen gefüllt sind.

Das heist, die Websites müssen mit PHP dynamisch generiert werden, wobei dann einfach je nach eingestellter Sprache der Text ausgegeben wird.

Schlüsselwörter und Bezeichnungen die der User nicht sieht, lässt du so wie sie sind, daher werden die Skripte auch weiterhin funktionieren.

Was das Parsen angeht; Stichwort Regular Expressions:
http://de.wikipedia.org/wiki/Regulärer_Ausdruck
http://www.regular-expressions.info/
http://www.infos24.de/phpe/handbuch/6_php_regular_expression.htm

Zum reinkommen etwas mühsam, wenn du sie aber mal geschnallt hast, kannst du diese Ausdrücke in fast jeder Programmier und Skriptsrache nutzen.

So kann man sehr angehnem gewisse Textstellen suchen, andere ausschliessen usw.RegEx ausdrücke sind sehr mächtig, und können hunderte instr() strmid() substr und was es alles so gibt ersetzen - mit einem einzigen Statement.

Lies dich eifnach darin ein.


Einen Parser für HTML zu schreiebn dürfte aber auch damit recht aufwendig sein. Must dich also schon etwas reinhängen :)
 
Wenn das Eingangsformat wenigstens gültiges XHTML ist, kann man die XML-Funktionen von PHP benutzen, um wenigstens nur im CDATA rumzuwurschteln. Dann muss man nicht drauf achten, dass man die Pfade oder sonstwas "mitübersetzt", die eigentlich außen vor bleiben sollten.
 
Vielleicht kommst auch zum Erfolg wenn du der Seite die du manipulieren willst das HTML-Tag base irgendwie unterschmuggelst.
Keine Ahnung ob das geht. Nur so eine Idee.

Gruß odigo
 
Original von odigo
Vielleicht kommst auch zum Erfolg wenn du der Seite die du manipulieren willst das HTML-Tag base irgendwie unterschmuggelst.
Keine Ahnung ob das geht. Nur so eine Idee.

Gruß odigo

Gute Idee! Das werd ich mal ausprobieren!

der Intelligenztest ist übrigens auf der Seite
http://web.tickle.com/first/quizzes/show/3001
zu finden, und nebenbei bemerkt finde ich dass es der beste ist den es so "frei" im Internet gibt. Früher gabs den auch mal auf deutsch, wenn ihr bei google einfach nur "tickle" eingebt (oder auch de.tickle.com) werdet ihr ziemlich viele Verweise darauf finden (also speziell auf de.tickle.com, für die Deutschen). Irgendwie haben die allerdings die deutschsprachige Variante entfernt und so kam ich überhaupt erst auf die Idee dazu ;)

Danke schonmal für die Hilfestellungen, falls jetzt Jemand noch nen Tipp speziell zu der Seite hat kann er das ja gerne nochmal hinzufügen, ich werd mich aufjedenfall die Tage mal an sonem Parser versuchen - mal sehen wie weit ich komme :)

mfg,
crack
 
Zurück
Oben