Hackerboard Wiki HaboBlog
Hackerboard bei Facebook Hackerboard bei Google+ Hackerboard bei Twitter

[HaBo]

 
Internet Allgemein Flatrates, Webspace, Protokolle und alles rund ums Internet hier rein.

Wie sucht Google?

Diskussion: Wie sucht Google? im Forum Internet Allgemein, in der Kategorie Web, Network & Multimedia Palace; Anzeige Hallo HaBo, Der Titel mag wohl etwas verwirrend sein aber mir fiel nichts passenderes ein. Das ist auch der ...

Antwort
Alt 05.03.08, 20:43   #1 (permalink)
 
Registriert seit: 17.10.06
:::Lük::: Leistung: Facit NTK
:::Lük::: eine Nachricht über ICQ schicken
Likes: 0
Smile Wie sucht Google?

Anzeige

Hallo HaBo,

Der Titel mag wohl etwas verwirrend sein aber mir fiel nichts passenderes ein. Das ist auch der Grund, warum ich per googlen nicht viel erfahren habe.
Natürlich weis ich, dass Google den Suchalgorythmus streng geheim hält. Mir geht es aber auch gar nicht um die Frage, nach welchen Kriterien sich Google bei der Suche richtet, sondern um die Logistik die dahinter stecken muss.
Wie schafft es Google, bei einer Suche nach einem häufgen und kurzen Wort wie z.B. "to", die Ergebnisse innerhalb 0,03 Sekunden anzuzeigen? Immerhin müssen 7 Milliarden Webseiten im Index durchsucht und die Ergebnissplatzierung von über 11 Mio Ergebnissen in dieser kurzen Zeit berechnet werden. Dazu kommt, dass Google in der Sekunde mehrere tausend Anfragen hat. Ich habe gelesen, dass Google weltweit und ständig Systeme aufkauft, um die Rechenleistung zu erhöhen. Trotzdem wundere ich mich über so eine enorme Geschwindigkeit.

Ist bekannt, wie Google seinen Index durchsucht? Wie gesagt ich frage nicht nach den Kriterien an denen sich Google bei der Suche orientiert.

MfG Lük

:::Lük::: ist offline   Mit Zitat antworten
Alt 05.03.08, 21:05   #2 (permalink)
 
Benutzerbild von bad_alloc
 
Registriert seit: 27.12.07
bad_alloc Leistung: 8086
Likes: 39
Standard

man munkelt google hätte den besten rechner der welt, schneller als die momentab schnellsten zivilen rechner. man weiß nur eben nix genaues weil google keine zahlen veröffentlicht. (c't)
ich selbst vermute die zahlen sind etwas gehübscht, da du ja ~1sek brauchst um die seite aufzubauen. hier kann man auch etwas angeben.
wie das so schnell durchsucht wird ist sicherlich ebenfalls googles geheimniss
__________________
You shoot yourself in somebody else's foot.|Dann gabs da noch den Mathematiker der P?=NP in O(1) erklärte.
|[A]| = p(·,|[A]|)+1
bad_alloc ist offline   Mit Zitat antworten
   
HaBOT
 
- Anzeige -

Werbung ist gerade online    
Alt 05.03.08, 21:12   #3 (permalink)
Moderator
 
Benutzerbild von xeno
 
Registriert seit: 09.09.04
xeno Leistung: Pentium Ixeno Leistung: Pentium I
xeno eine Nachricht über ICQ schicken
Likes: 76
Standard

sogesehen hat google den schnellsten "cluster" der welt (obwohl google die daten dazu - wie schon gesagt wurde - geheim hält.

und warum das so schnell geht kann ich mir nur so erklären, daß der wert oben ein schätzwert ist und du ja eh nur 10 treffer pro seite angezeigt bekommst
xeno ist offline   Mit Zitat antworten
Alt 05.03.08, 21:18   #4 (permalink)
Themenstarter
 
Registriert seit: 17.10.06
:::Lük::: Leistung: Facit NTK
:::Lük::: eine Nachricht über ICQ schicken
Likes: 0
Standard

Zitat:
Original von xeno
und warum das so schnell geht kann ich mir nur so erklären, daß der wert oben ein schätzwert ist und du ja eh nur 10 treffer pro seite angezeigt bekommst
Aber Google muss doch trotzdem alle Seiten des Indexes durchsuchen, um das treffenste Ergebniss zu finden. Es nimmt ja nicht einfach die ersten 10 Treffer aus dem Index, oder?
:::Lük::: ist offline   Mit Zitat antworten
Alt 05.03.08, 22:22   #5 (permalink)
Senior Member
 
Registriert seit: 18.09.05
[starfoxx] Leistung: Facit NTK
Likes: 0
Standard

Ich schreibe gerade eine Arbeit über Google. Es sollte gesagt werden dass Google etwa 450'000 Rechner zu einem Riesennetzwerk zusammengebastelt und in etwa 30 Rechenzentren weltweit verteilt hat. (gem. Google.-.Die.Macht.einer.Suchmaschine.(NDR.Zapp.-.Doku).divx)

Weiter glaube ich mal gelesen zu haben dass die Anfrage in verschiedenen Teile zerlegt und dann paralell in verschiedenen Datenbanken gesucht wird. Scheinbar sind die Datenbanken auch komplett mehrfach vorhanden.

Das Google Betriebssystem soll - zu meinen Erstaunen - ausschliesslich in C/C++ geschrieben sein, ich hätte etwas schnelleres erwartet.

Dazu kann ich dir leider keine Quellen mehr nennen.

Eventuell findest du etwas mehr heraus wenn du dich mit den Funktionen des "Google Mini", sowie der "Google Seach Appliance beschäftigst"... (http://www.google.com/enterprise/)

// du könntest dir son Ding bestellen und es reversen (wieso das wohl nicht gemacht wirde / wurde...)
[starfoxx] ist offline   Mit Zitat antworten
Alt 05.03.08, 23:36   #6 (permalink)
 
Registriert seit: 05.03.08
kurzgeschichte Leistung: Facit NTK
Likes: 0
Standard

Die Suchanfragen werden vermutlich für eine Gewisse Zeit im Cache gehalten, ich glaube kaum das jedes mal wen jemand nach "Sex" sucht ein Query die Datenbank von oben bis unten durchrattert. Aber genaue Informationen wird hier wohl keiner liefern können.
kurzgeschichte ist offline   Mit Zitat antworten
Alt 06.03.08, 03:03   #7 (permalink)
 
Registriert seit: 20.08.06
buggybunny Leistung: Facit NTK
Likes: 0
Standard

Zitat:
Ich schreibe gerade eine Arbeit über Google.
Was dich aber nicht davon abhält, Schwachfug dieser Art

Zitat:
Das Google Betriebssystem soll - zu meinen Erstaunen - ausschliesslich in C/C++ geschrieben sein, ich hätte etwas schnelleres erwartet.
zu erzählen.

Interessant, was hättest du denn erwartet? Und jetzt bitte nicht mit Assembler kommen, bloß weil man mal gehört hat, das Assembler das schnellste ist.

Und was soll bitte schön das "google Betriebssytem" sein? Google setzt seit Ewigkeiten schon auf Linux. Bloß, weil da ein paar Erweiterungen drin sind, hat das noch lange nichts mit eigenem Betriebssystem zu tun.

Evtl. solltest du mal besser recherchieren.
buggybunny ist offline   Mit Zitat antworten
Alt 06.03.08, 08:27   #8 (permalink)
Member of Honour
 
Registriert seit: 07.12.04
end4win hat die Renommee-Anzeige deaktiviert
Likes: 256
Standard

http://www.is.informatik.uni-duisbur.../Fuhr:05tz.pdf

Über Internetsuchmaschinen

http://cms.fh-augsburg.de/report/200...ltextsuche.pdf

Suchverfahren allgemein, es wird auch auf Indexierung eingegangen.

http://habacht.blogspot.com/2007/10/...hitecture.html

Die Technik die dahinter steht.

Gruss
__________________
Die deutsche Rechtschreibung ist Freeware, daher darf man sie kostenlos nutzen.
Allerdings ist sie nicht Open Source, dies bedeutet man darf sie nicht verändern oder in veränderter Form
veröffentlichen.
end4win ist offline   Mit Zitat antworten
Alt 06.03.08, 10:26   #9 (permalink)
Member of Honour
 
Benutzerbild von beavisbee
 
Registriert seit: 22.02.07
beavisbee Leistung: Pentium IIIbeavisbee Leistung: Pentium IIIbeavisbee Leistung: Pentium IIIbeavisbee Leistung: Pentium III
beavisbee eine Nachricht über ICQ schicken
Likes: 77
Standard

Zitat:
Original von [starfoxx]
Das Google Betriebssystem soll - zu meinen Erstaunen - ausschliesslich in C/C++ geschrieben sein, ich hätte etwas schnelleres erwartet.
du meinst sicherlich das Programm, was die Suchanfragen entgegennimmt und Ergebnisse zurückliefert...

Und da wüsste ich ebenfalls nicht, was du daran langsam findest...
PHP, ASP oder andere Scriptsprachen, mit denen Otto-Normal-Verbraucher Websites erstellt, sind wesentlich langsamer als eine C++-Applikation.

Soweit ich weiß, arbeitet auch bei Yahoo ein C++-Programm im Hintergrund.

btw: Ich würde auch davon ausgehen, dass die Suchanfragen zwischengespeichert werden.
beavisbee ist offline   Mit Zitat antworten
Alt 06.03.08, 11:19   #10 (permalink)
 
Registriert seit: 21.10.06
weau Leistung: Facit NTK
Likes: 0
Standard

Ich muss hier mal einige Informationen klar stellen :
google setzt auch auf andere Programmiersprachen, z.b. Python, da Python sehr übersichtlich ist, was bei diesem Projekt und dem damit verbundenem Quellcode der Gigantisch sein muss sinn macht.

Das solltest du eventuell in deiner Arbeit noch verbessern @starfoxx

"Als Betriebssystem wird eine abgespeckte Variante der Linux-Distribution Red Hat verwendet [7]. Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware." "

Warum google so schnell ist :

Google setzt nicht auf einen reinen Cluster.
Es werden einzelne Datenstrukturen (doc-kopien, verzeichnisse und der ganze kram) auf mehreren rechnern und mit hilfe der verfügbaren einzelrechner lässt sich das ganze halt schnell beantworten.

im hintergrund werden zusätzlich die suchanfragen gecacht

google betreibt überigens zahlreiche rechenzentren und im idealfall sollte die suchanfrage von dem nächsten rz beantwortet werden.
weau ist offline   Mit Zitat antworten
Alt 06.03.08, 12:56   #11 (permalink)
Senior Member
 
Registriert seit: 18.09.05
[starfoxx] Leistung: Facit NTK
Likes: 0
Standard

Zitat:
Original von buggybunny
Evtl. solltest du mal besser recherchieren.
Ich befasse mich mit wirtschaftlichen Fragen.
Ich hätte nicht gedacht dass schnelle Datenbankschnittstellen auch in C geschrieben sind.

Die interessantere Frage wäre sowies was für eine Datenbank Google verwendet.
[starfoxx] ist offline   Mit Zitat antworten
Alt 06.03.08, 13:03   #12 (permalink)
 
Registriert seit: 20.08.06
buggybunny Leistung: Facit NTK
Likes: 0
Standard

Zitat:
Ich befasse mich mit wirtschaftlichen Fragen.
Ich hätte nicht gedacht dass schnelle Datenbankschnittstellen auch in C geschrieben sind.
Nein, es geht hier nicht um irgendwelche Datenbank-Schnittstellen, sondern um Such-Algorithmen.

Zitat:
Die interessantere Frage wäre sowies was für eine Datenbank Google verwendet.
Google - als bekannter open-source Förderer - setzt nach eigener Aussage mySQL 5-Cluster ein.
buggybunny ist offline   Mit Zitat antworten
Alt 06.03.08, 13:26   #13 (permalink)
Senior Member
 
Registriert seit: 18.09.05
[starfoxx] Leistung: Facit NTK
Likes: 0
Standard

Zitat:
Original von buggybunny
Nein, es geht hier nicht um irgendwelche Datenbank-Schnittstellen, sondern um Such-Algorithmen.

Google - als bekannter open-source Förderer - setzt nach eigener Aussage mySQL 5-Cluster ein.
Such Algorithmen bei der Abfrage der Daten oder bei der Indizierung?
Ich ging bis jetzt immer von ersterem aus.

Mann kann Datenbankensystem als Cluster betreiben?
Ich kenne riesendatenbanken von Grossystemen, das ist mir neu. Eine Googleentwicklung?

Man könnte jetzt natürlich darüber streiten ob Google immernoch das Opensource Messiasgesicht hat wenn man JahresCashflows von 2.5 mia (2007) und Jahresgewinne (EBIT) von 5.6 Mia (2007) dagegen stellt...
[starfoxx] ist offline   Mit Zitat antworten
Alt 06.03.08, 13:35   #14 (permalink)
 
Registriert seit: 21.10.06
weau Leistung: Facit NTK
Likes: 0
Standard

Ich zitiere Bitmuncher zum Thema Datenbank-Cluster
"Bei Datenbanken kommen meist replizierte Systeme (Master-Master-Replikationen) oder Datenbank-Cluster zum Einsatz."
Sein Zitat ist dabei nicht auf google sondern auf Server Architektur bezogen.
Jeden falls gibt es sehr wohl Datenbank-Cluster.
weau ist offline   Mit Zitat antworten
Alt 06.03.08, 14:02   #15 (permalink)
Moderator
 
Benutzerbild von Elderan
 
Registriert seit: 30.03.04
Elderan Leistung: 8086
Likes: 14
Standard

Hallo,
schaut mal hier:
Technik der Suchmaschine
Google platform
How Web search engines work bzw. Realisierung von Suchmaschinen

Naja das Geheimnis ist gar nicht so groß.

Zitat:
Immerhin müssen 7 Milliarden Webseiten im Index durchsucht und die Ergebnissplatzierung von über 11 Mio Ergebnissen in dieser kurzen Zeit berechnet werden.
Wenn du bei Google nach einem Wort suchst, werden nicht alle Dokument per Textsuche durchsucht, wovon es extrem viel mehr gibt als 7 Mrd., sondern jedem Dokument werden Schlagworde zugeordnet und diese werden in einem Index zusammengefasst.

Wenn du also nach einem Wort suchst, wird einfach nur (naja so einfach nun auch nicht) der entsprechende Index aufgerufen und darin sind alle relevanten Datensätze hinterlegt, inkl. Gewichtung.
Diese Gewichtung wird nicht bei jeder Suchanfrage neu berechnet sondern im groß teil nur alle paar Monate aktualisiert, auch bekannt als Google dance

Wenn du nach zusammengesetzen Wörtern suchst, werden die entsprechenden Indizes angesprochen und die Ergebnisse gewichetet.


Naja, Google liefert noch deutlich mehr Ergebnise dazu:
Google+Arbeitsweise
Suchmaschinen Grundlagen - Arbeitsweise, Funktion und Bedeutung
Architetur von Google

Es lief irgendwann vor gar nicht so langer Zeit (aber noch im Jahr 2007) ich mein im öffentlich-rechtlichen eine Doku über Google, unter anderem wie die Suchmaschine funktioniert. Recht intressant, evt. findet die jmd.

Zitat:
ich selbst vermute die zahlen sind etwas gehübscht, da du ja ~1sek brauchst um die seite aufzubauen.
Dann hast du ja nen sau langsames Internet :p
Ne die Daten müssen ja auch übertragen werde, und bei mir baut die Seite sich deutlich schneller als 1 sek auf.

Sonst gibt es noch Fasterfox welches die anzeigt, wielange die Seite gebraucht hat sich aufzubauen
Elderan ist offline   Mit Zitat antworten
Antwort
   
- Anzeige -

Werbung ist gerade online    

[HaBo] » Web, Network & Multimedia Palace » Internet Allgemein » Wie sucht Google?
Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks sind aus
Pingbacks sind aus
Refbacks sind aus


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
FBI sucht Nachwuchs torsten News & Ankündigungen 7 17.04.09 18:38
computerspiel Sucht thaos2 HaBo Lounge 4 13.12.06 22:40
weg von der X3-Sucht foobar Fun Section 1 02.06.04 20:16
brenner sucht anschluss Philippo Hardware Probleme 19 20.02.04 09:49
Google startet kostenpflichtigen Dienst namens "Google Answers" Tec News & Ankündigungen 7 23.04.02 13:34


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61