Hackerboard Wiki HaboBlog
Hackerboard bei Facebook Hackerboard bei Google+ Hackerboard bei Twitter

[HaBo]

 
Linux/UNIX Linuxverfechter finden hier Weggefährten.

Kann sich jemand darauf einen Reim machen?

Diskussion: Kann sich jemand darauf einen Reim machen? im Forum Linux/UNIX, in der Kategorie Operating Systems; Anzeige Hi, ich habe einen Server mit 4 Festplatten in einem RAID5. Darauf ist ein Debian Lenny installiert. Der Rest ...

Antwort
Alt 14.12.10, 14:22   #1 (permalink)
Senior Member
 
Registriert seit: 26.03.06
Serow Leistung: 8086
Likes: 16
Standard Kann sich jemand darauf einen Reim machen?

Anzeige

Hi,

ich habe einen Server mit 4 Festplatten in einem RAID5. Darauf ist ein Debian Lenny installiert. Der Rest ist als max 2TB LUNs über iSCSI für ESX Server freigegeben. Vorletztes Wochenende haben sich User beschwert, dass VMs nicht mehr erreichbar wären. Ich habe dann herausgefunden, dass der RAID Controller (ein 3ware Gerät) gerade seinen Verification Prozess laufen hat und habe es einfach mal darauf geschoben. Letztes Wochenende hatten wir dasselbe wieder. Nach einem Reboot des Hosts kam er nicht mehr hoch: GRUB war kaputt.

Sieht da irgendjemand einen Zusammenhang? Mir fällt es irgendwie schwer zu glauben, dass der RAID Controller mit seinem Verifizierungezeugs verantwortlich für einen kaputten GRUB sein soll. Hat jemand auch schonmal Storage Disconnects im Zusammenhang mit dem Verification Prozess gesehen?

Bin grad etwas ratlos ...

ciao
serow

Serow ist offline   Mit Zitat antworten
Alt 14.12.10, 14:45   #2 (permalink)
Moderator
 
Benutzerbild von xeno
 
Registriert seit: 09.09.04
xeno Leistung: Pentium Ixeno Leistung: Pentium I
xeno eine Nachricht über ICQ schicken
Likes: 76
Standard

Raid degraded, Festplatte kaputt, kein Grub auf den anderen Platten?

a) Raid-Bios nach degradeten und/oder kaputten Platten durchsuchen, oder
b) Live-System booten, /proc/mdstat befragen

Fällt mir jetzt so auf Anhieb ein.
xeno ist offline   Mit Zitat antworten
   
HaBOT
 
- Anzeige -

Werbung ist gerade online    
Alt 14.12.10, 14:52   #3 (permalink)
Senior Member
Themenstarter
 
Registriert seit: 26.03.06
Serow Leistung: 8086
Likes: 16
Standard

Hi,

ich denke deine Ideen kann ich verneinen, denn das ganze System ist auf einem Hardware RAID installiert (inklusive GRUB). Degradet ist auch nichts:

Code:
iscsi2:~# tw_cli /c0 show

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-5    VERIFYING      -       59%     256K    5587.9    RiW    ON     

VPort Status         Unit Size      Type  Phy Encl-Slot    Model
------------------------------------------------------------------------------
p0    OK             u0   1.82 TB   SATA  0   -            WDC WD2002FYPS-01U1 
p1    OK             u0   1.82 TB   SATA  1   -            WDC WD2002FYPS-01U1 
p2    OK             u0   1.82 TB   SATA  2   -            WDC WD2002FYPS-01U1 
p3    OK             u0   1.82 TB   SATA  3   -            WDC WD2002FYPS-01U1 

Name  OnlineState  BBUReady  Status    Volt     Temp     Hours  LastCapTest
---------------------------------------------------------------------------
bbu   On           Yes       OK        OK       OK       0      xx-xxx-xxxx  

iscsi2:~# tw_cli /c0/u0 show

Unit     UnitType  Status         %RCmpl  %V/I/M  Port  Stripe  Size(GB)
------------------------------------------------------------------------
u0       RAID-5    VERIFYING      -       59%     -     256K    5587.9    
u0-0     DISK      OK             -       -       p0    -       1862.63   
u0-1     DISK      OK             -       -       p1    -       1862.63   
u0-2     DISK      OK             -       -       p2    -       1862.63   
u0-3     DISK      OK             -       -       p3    -       1862.63   
u0/v0    Volume    -              -       -       -     -       5587.9    

iscsi2:~#
ciao
serow
Serow ist offline   Mit Zitat antworten
Alt 15.12.10, 00:06   #4 (permalink)
 
Benutzerbild von MemoryMatt
 
Registriert seit: 14.12.10
MemoryMatt Leistung: Z3
Likes: 0
Standard

kommt mir ziemlich komisch vor... was für ein modell benutzt du?
3ware 9650se?
MemoryMatt ist offline   Mit Zitat antworten
Alt 15.12.10, 11:41   #5 (permalink)
Senior Member
Themenstarter
 
Registriert seit: 26.03.06
Serow Leistung: 8086
Likes: 16
Standard

Hi,

ja der müsste es sein. 4x SATA ...

ciao
serow
Serow ist offline   Mit Zitat antworten
Alt 15.12.10, 16:56   #6 (permalink)
 
Benutzerbild von MemoryMatt
 
Registriert seit: 14.12.10
MemoryMatt Leistung: Z3
Likes: 0
Standard

theoretisch könnte es sein, dass das die partionen nicht gefunden werden kann, somit würde es am Modell liegen... schonmal probiert GRUB neuzuinstallieren bzw ein BIOS update zu machen?
MemoryMatt ist offline   Mit Zitat antworten
Alt 15.12.10, 19:38   #7 (permalink)
Senior Member
Themenstarter
 
Registriert seit: 26.03.06
Serow Leistung: 8086
Likes: 16
Standard

Hi,

GRUB hab ich sofort nach dem Vorfall wieder installiert, das System musste ja wieder hochfahren. BIOS Update kann ich mal ausprobiere.

cu
serow
Serow ist offline   Mit Zitat antworten
Alt 15.12.10, 23:18   #8 (permalink)
 
Registriert seit: 04.02.06
shodan Leistung: Facit NTK
Likes: 0
Standard

Nabend,

3Ware 9650SE puuhh, also wenn Ihr noch Gelder übrig habt würde ich den durch einen anderen ersetzen, z.b. durch einen Adaptec 5405.
Glaub mir mit 3ware hab ich in den letzten 8 Monaten so viel Sch..... gehabt das ich von den dingern geheilt bin.

Aber ich versuche dir zu helfen.
Unter /var/log/ gibt es vom Controller logfiles die mit tw_aen anfangen.
Dort würd ich mal nach Meldungen vom Controller schauen.

In der aktuellen Beta Firmware (die ich auch im einsatz habe damit es halbwegs stabil läuft) wurden einige wichtige Sachen gepatcht.
Vor allem:
CR 2196: Unexpected controller soft resets
Fixed an issue with regards to deferral of write and read commands to help eliminate unexpected soft resets.

Rest siehe Readme im zip file.

Und wenn das nicht hilft würde ich versichen das Raid von 256K Stripe auf 64K Stripe zu migrieren.

Wenn in dem Logfile vom Controller Interesante Meldungen drin stehen kannste die ja mal posten.

Viel glück.

mfg
shodan ist offline   Mit Zitat antworten
Antwort
   
- Anzeige -

Werbung ist gerade online    

[HaBo] » Operating Systems » Linux/UNIX » Kann sich jemand darauf einen Reim machen?
Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks sind aus
Pingbacks sind aus
Refbacks sind aus



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61