Wie kann ich den ndbd Prozess automatisch starten?
Indem du ein entsprechendes Init-Skript anlegst.
Wie sehe ich ob die Datenodes synchron sind?
Meiner Erfahrung nach am einfachsten indem du dir die Größe der Datenverzeichnisse auf Byte genau anschaust. Sind sie gleich gross, sind auch die Knoten synchron.

Das ist allerdings der "dirty way". Um es sauberer zu lösen nimmt man Tools wie cmon (Cluster Monitor).
Wenn zum Beispiel eine Datanode länger offline war und in der Zwischenzeit viele Daten geschrieben wurden?
Dann dauert es entsprechend lange, bis der Knoten wieder synchron ist. Allerdings ist er solange ja im Status "Starting" und erst wenn er in einen synchronen Zustand kommt, wird er auf "Started" geändert und bekommt ab da Anfragen vom Management-Node zugeteilt. Voraussetzung ist natürlich, dass man das Cluster über API-Nodes anspricht und nicht direkt auf die Data-Nodes zugreift. Wobei vermutlich auch ein Direktzugriff auf die Storage-Nodes nicht möglich ist, solange sie nicht auf "STARTED" gewechselt haben. Hab das allerdings nie getestet und werde dafür jetzt auch keinen meiner Storage-Nodes runterfahren.
Ich habe gelesen, dass es möglich sein soll weitere Datanodes im laufenden Betrieb hinzuzufügen, finde aber keine Informationen dazu.
Das geht nur, wenn entsprechende NDBD-Nodes bereits in der Konfiguration definiert sind. Da man ja nur HostName und DataDir angeben muss kann man einfach schonmal im Voraus zusätzliche NDBD-Abschnitte in die Konfiguration einfügen und dort als HostName ein paar IPs eintragen, die man für weitere Storage-Nodes verwenden kann. Evtl. reicht es aber auch aus einfach leere NDBD-Abschnitte einzubauen. Das habe ich allerdings selbst noch nicht probiert. Bei den API-Nodes reicht es aber ja auch leere MYSQLD-Abschnitte in die Config zu packen.
Was passiert wenn der Management Server ausfällt?
Ich bin mir nicht 100% sicher, aber die anderen Knoten gehen dann entweder in den Status "UNKNOWN" oder "NO_CONTACT". Sie sind auf jeden Fall nicht mehr ansprechbar bis das Cluster neugestartet wurde. Von daher erreicht man echte Redundanz nur mit 2 Management-Knoten, was aber im üblichen Bereich, wo Cluster zum Einsatz kommen, aufgrund der Größe der Netzwerke zumeist eh notwendig ist. Bei einem Cluster mit einem Management-Knoten heisst ein Ausfall jedenfalls immer ein Cluster-Reboot.
Kennt jemand aktuelles Buchmaterial welches MySQL Cluster 7.1 beeinhaltet?
Als "Hardware" natürlich der Klassiker von O'Reilly, der in seiner aktuellen Ausgabe auch 7.1 beinhalten dürfte... "High Performance MySQL". Vorsicht: da gibt es 2 Ausgaben. Die eine ist recht dünn und ist eher als Nachschlagewerk geeignet. Die andere ist knapp doppelt so dick und geht etwas tiefer in's Detail. Wusste ich bisher auch nicht, bis ich es in meiner letzten Firma im Office mal als dicke Ausgabe sah. Hab selbst die dünne Version und da wird auf Cluster zwar eingegangen, aber da auch Master-Slave- und Master-Master-Replikationen darin behandelt werden, natürlich eher spärlich. Ansonsten ist mein Favorit immernoch das Reference Manual, das in Kapitel 17 sehr detailliert auf Cluster eingeht:
http://docs.sun.com/source/mysql-refman-5.1/mysql-cluster.html Schon an den Überschriften ist zu erkennen, dass damit die meisten Fragen beantwortet werden.
