Gnutella 0.4
Allgemein
Das Gnutella Protokoll basiert auf TCP/IP Struktur, dabei ist es aber kein Übertragungsprotokoll.
Es ist eine Art Nachrichtensystem mit 5 Nachrichtentypen.
Dabei agiert Gnutella komplett dezentral, ist also ein echtes Peer-2-Peer System. Die einzelnen Clients sind gleichzeitig auch Server, daher werden sie meist als Servents, oder einfach nur Peers, bezeichnet.
Die Verbindung zum Gnutella-Netzwerk wird über Bootstrapping hergestellt.
Bootstrapping
Da Gnutella ein dezentrales Netzwerk ist, braucht man für den ersten Kontakt mindestens eine IP eines Rechners, dabei sollte dieser bereits mit dem Netzwerk verbunden sein. Ursprünglich war der Gnutella-Webserver dieser erste Kontakt. Später wurden dann Listen von IPs veröffentlicht. Wenn man bereits einmal Kontakt hatte, kann man beim zweiten Mal die bereits gesammelten Kontakte durchprobieren um sich mit dem Netzwerk zu verbinden.
Eingliederung in das Netzwerk
Wenn die Verbindung zum Netzwerk steht, macht sich ein Peer bei seinen Nachbarn mittels Ping-Paketen bekannt. Diese werden per Broadcast über alle Verbindungen geschickt und werden durch Pong-Pakete beantwortet. Was diese Pakete genau beinhalten wird weiter unten erklärt.
Message-Pakete
Gnutella ist ein komplett dezentrales Netzwerk. Die einzelnen Peers kommunizieren über Message-Pakete. Diese werden allerdings nicht direkt von Peer zu Peer verschickt, sondern wandern über andere Peers im Netz bis zu ihrem Ziel, dh jeder Peer ist unter anderem mit dem ständigen Weiterleiten von zB Suchanfragen anderer beschäftigt.
Allgemeiner Paket-Aufbau
Die Gnutella-Pakete bestehen aus Header (22 Byte) und einem optinalen Body.
Der Header sieht wie folgt aus:
Bytes | Segment | Beschreibung |
16 | GUID | Eindeutige ID des Peers auch Globally Unique ID |
1 | Payload | Paketart: Ping, Pong, Query, Query-Hit oder Push |
1 | TTL | Time To Live, Anzahl der max. Weiterleitungen |
1 | Hops | Anzahl bereits erfolgter Weiterleitungen |
3 | Payload Length | Gesamtlänge des Pakets inkl. Body |
Dabei ist die GUID eine zufällige Zahlenkombination die einen Peer im Gnutella-Netzwerk eindeutig identifiziert. Es ist aber nicht die IP des Peers.
Die TTL soll im Normalfall nicht höher als 7 sein. Mit jeder Weiterleitung eines Pakets wird die Hop-Anzahl erhöht bis der Wert gleich der TTL ist, dann wird das Paket verworfen. Durch die Kombination aus TTL und Hop-Anzahl soll sichergestellt werden, dass Peers ihre TTL nicht netzwerkschädigend hoch wählen.
Um das Ende des einen Pakets und den Anfang des nächsten zu erkennen, muss der Client wissen wieviel Metadaten dem Header folgen, dazu dient die Payload Length.