bitmuncher
Senior-Nerd
Klingt spannend, oder?
Ist es aber nicht... Ich suche ein Tool, das den Content einer Website in seine Bestandteile zerlegen kann. Dabei sollte es optimalerweise möglich sein zu definieren welche Tag-IDs/Namen relevant sind. Beispiel: Ich habe eine HTML-Datei die aus diversen DIVs besteht, die alle eindeutig benannt sind. Ich möchte nun aus bestimmten DIVs den Content extrahieren und in eine Datenbank schreiben oder in einer XML-Struktur abspeichern.
Kennt jemand was passendes oder ein OSS-Tool, das man entsprechend modifizieren kann, so dass es die gewünschte Aufgabe übernehmen kann?
Kennt jemand was passendes oder ein OSS-Tool, das man entsprechend modifizieren kann, so dass es die gewünschte Aufgabe übernehmen kann?