Wie sucht Google?

@Elderan:
Wie erklärst du dir dann die volltextsuche? die funktioniert genauso schnell wir die suche nach schlagwörtern und diese funktioniert nicht mit einzelnen wörtern, sondern bekanntlich mit zusammenhängenden strukturen, wozu es schon notwendig ist das ganze dokument zu durchsuchen..
 
Hallo,
Original von :::Lük:::
Was meinst du mit Schlagworten? Wenn du damit z.B. nur Hauptwörter meinst, dann wäre ja eine Suche nach z.B. "to" hinfällig oder verstehe ich das falsch?
naja, es gibt Wörter die besonders oft gesucht werden und solche Wörter ordnet google einer Seite zu.

Wenn der Googlebot das HaBo mal wieder inspeziert, wird dieser Domain/Seite die Schlagwörter 'Hackerboard', 'Hacker', 'Security' usw. zugeordnet und in die entsprechenden Indizes eingepfelgt.

Der Googlebot versucht zu ermitteln, worum es auf jeder Seite geht, welche Wörter besonders dominant sind usw. und nimmt dich dann ggf. unter diesen Wörter in den Index auf.
Nur weil ein Wort auf deiner Seite erwähnt wird, heißt dies noch lange nicht, dass du auch in den entsprechenden Index landest.

Ich kenn ein paar doch recht große PHP Seiten, die irgendwelche Tutorials, Scripts oder was auch immer enthalten, teilweise auch mit sehr vielen Besuchern, dennoch sind diese nicht unter den ersten 1000 Treffern wenn man nach 'PHP' sucht, obwohl dieses Wort ein dutzend mal auf der Seite auftaucht, teilweise in der Domain auftaucht, im Title steht usw.

Sucht man dann nach einer Kombination, z.B. php tutorial, php script oder was auch immer, belegen diese Seiten einen Platz unter den Top 10 Ergebnissen.

Dies ist schon etwas merkwürdig, wenn man sich mal die letzten Suchergebnisse so anguckt, und erfolgreiche Seite bzgl. PHP, auch mit akzeptablen Page Rank, werden nicht aufgelistet.
Diese tauchen dann eben nicht in dem Index auf.


Edit:
@end4win: Dies kommt vorallem, also das besonders Seiten die 'to' im Namen tragen, weil der Domainname mit am stärksten gewichtet wird.
Wenn eine Seite teebeutel.de heißt, dann wird es auf dieser Seite wohl um Teebeutel gehen, also wird diese automatisch stark gewichtet.

@MorbZ!!!: Wenn du die Volltextsuche verwendest, wird nicht jedes Dokument per Volltextsuche durchsucht, sondern die Seiten werden sehr stark eingeschränkt.
Ich denke mal, die Wörter werden zuerst einmal aus der Suchanfrage extrahiert und es wird in den Indizes nachgeguckt, welche Seiten so ein Wort überhaupt mal aufführen.
In diesen paar Seiten, die in allen für die Suchanfrage relevanten Indizes auftauchen, wird dann eine Volltextsuche durchgeführt.

Außerdem, steht dort ja immer:
Ergebnisse 1 - 10 von ungefähr 11.520.000.000 für to.

Ebenso bei einer Volltextsuche, wenn du für ungefährt 1 Mio. Ergebnisse bekommst, heißt dies nicht, dass diesen Text auch 1 Mio. Seiten exakt so haben.
Dies ist dann die Anzahl der Seiten, die in Frage kommen.

Hat Google erstmal die potenziellen Seiten ermittelt, die diese Pharse enthalten könnte, wird nach der Wichtigkeit der Suchergebnisse vorgegangen und sobald 10 Ergebnisse gefunden wurden, werden diese auch ausgegeben, denke ich mal.


Wie gesagt, einfach mal die obigen Links durchlesen, diese sollten deutlich weiterhelfen
 
Original von end4win
@lük

mach es doch mal und du wirst sehen das dein "to" Bestandteil einer URL oder
ein Eigennamens ist.

Gruss

Wie meinst du das? Ich finde "to" auch in ganz normalen Texten.

@Elderan: Das will mir immer noch nicht ganz einleuchten. Bleiben wir einfach mal bei dem Beispiel mit der Suche nach "to".
Z.B. auf der 33. Seite [2. Ergebniss] finde ich ein Ergebniss, auf dem das Wort "to" genau einmal vorkommen zu scheint. Trotzdem hat Google dieses "to" als Schlagwort angesehen? Das kann ich mir iwie nicht vorstellen.
 
Hallo,
oO, Seite 33 ;)
Naja Schlagwörter sind nicht nur Wörter auf der gefunden Seite. Google beurteil die gesamte Seite.
Beim Beispiel PHP, wer sucht schon nach to..., wenn auf der gesamten Seite sehr oft und immer wieder das Wort PHP auftaucht, dann wird die Seite unter Umständen dennoch gut gelistet, obwohl evt. die verlinkte Seite das Wort nur 1 oder 2 mal enthält.

Aber auch wenn es gar nicht auftaucht (das Suchwort), kannst du z.B. auf dem ersten Platz landen.
Wenn man früher nach miserable failure gesucht hat, war der erste Suchtreffer die Seite von George Bush:
Klick mich für's Foto
Allerdings kam auf der Seite kein einziges mal diese Wort vor, einfach nur weil entsprechend viele Links mit dem Linktext 'miserable failure' auf diese Seite verwiesen hat.
Mittlerweile ist der Eintrag, vermutlich händisch, gelöscht worden.


Edit
So nun mit richtigen img Tag
369539947_e3f05b50e5.jpg
 
Ok ich merk schon, das grenzt schon wieder an die Frage, wie Google bei der Gewichtung der Ergebnisse vorgeht und darüber die lässt sich ja bekanntlich nur spekulieren.

Original von Elderan
PS:
Wieso funktioniert der img Tag nicht richtig:
369539947_e3f05b50e5.jpg

Gute Frage ;)
 
Hallo,
Original von :::Lük:::
Ok ich merk schon, das grenzt schon wieder an die Frage, wie Google bei der Gewichtung der Ergebnisse vorgeht und darüber die lässt sich ja bekanntlich nur spekulieren.
Das hält Google recht geheim, aber Tutorials über Suchmaschinenoptimierung liefern sehr gute Einblicke, zumindest für den Anfang.

Persönlich finde ich Abakus ganz gut
 
Zurück
Oben