Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité = ???

C'est ici que sont postés les messages qui n'entrent pas dans le cadre des autres forums.
Ces messages doivent néanmoins rester en conformité avec la <a href=http://www.ixus.net/charte_forums.php>Charte</a> qui régule les forums.
Nous vous remercions d'éviter les sujets complètement off-topic (foot, pêche ...). Ne perdons pas de vue qu'Ixus reste un site relatif à l'informatique.

Modérateur: modos Ixus

Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité = ???

Messagepar HP77 » 24 Nov 2010 12:17

Bonjour,

:!: Attention : 100% "3615mylife" !!!

C'est avec un assez grand désaroi que je viens poster ici pour faire part de ma dernière mésaventure :
    - En Mai / Juin dernier, mon serveur perso "à la maison" est tombé en panne à cause d'une avarie matérielle (il semblerait) au niveau de la couche magnétique du disque dur. HDD = WD5000BEVT.

    - Il y a 10 jours (en weekend), "re-belotte" ! Mon serveur perso "à la maison" est tombé en panne à cause d'une coupure de courant involontaire à l'interrupteur sur la prise... #-o :roll: . Le problème semblerait venir d'un fichier de configuration douteus, voir de la structure du système de fichier lui-même. HDD = WD5000BEVT.
    Là-dessus, j'ai un brouillon à poster là-dessus depuis ce weekend dernier mais on verra ça plus tard. (Montage du système de fichier LVM, MDx, etc... sur une serveur tout beau tout neuf pour récupérer les données, et(???) la configuration)

    - Ce matin, je découvre mon serveur AT3GC-I au boulot avec la LED d'activité disque(s) allumée non stop (pas bon signe quand celle-ci passe son temps éteinte ou à clignoter brièvement, même si c'est preque toutes les 2-3 secondes)... :-k

    SURTOUT, NE PAS REBOOTER le système !!!
    (surtout si l'on peut encore accéder aux données, :arrow: FAIRE UN BACKUP D'URGENCE !!!)
    J'ai fait l'énorme çonnerie #-o :x après quelques vérifications me laissant penser que tout était OK et qu'il s'agissait probablement d'un petit bug avec le RAID logiciel ou bien le contrôleur de la carte mère ou alors, un disque foireux (après ma mésaventure de Mai/Juin dernier, je suis devenu très "parano".

Résultats :
- la carte mère ne voit plus un seul disque dur. :x
- un des deux disques (le plus récent ajouté il y a un mois) ne démarre même plus (pas de rotation) ; HDD = WD5000BEVT - 00ZAT0 (made in Thailand) du même marchand @ Sim Lim Square
- l'autre disque (qui plus ancien), semble encore fonctionner sur mon serveur de test GA-D510UD :arrow: En court de clonage sous ddrescue via SystemRescueCD 1.6.3 (à installer, sous MS-Windows, avec "LiLi" pour être sûr de booter depuis une clef USB ET voir s'afficher l'interface graphique de Gentoo (autrement, la carte mère Gigabyte rebootait non stop avec mon ancienne version 1.5.6))


Je ne sais pas si la carte mère est "secouée" elle aussi mais ej n'ai toujours pas compris ce qu'il a bien pu se passer.
- Problème sur l'alimentation ? (19Vdc régulés et abaissés en 12Vdc puis 5Vdc (HDD SATA 2.5" = 5Vdc seulement))
- Surchauffe (40-42°C, c'est un peu chaud mais tant que ça, surtout que le même modèle de disque dur était à la maison pendant 6 mois (ici, 3 mois environ) à des chaleurs et taux d'humidité plus élevés... :-k


Pour infos, SystemMonitor me donnait ceci avant le "reboot de la mort" :
- une hausse de température de 36°C à 40-41°C depuis hier matin 9h (normal, j'étais dans le bureau et j'accédait au serveur...)
- un blanc dans les enregistrements durant 10-15 minutes dans le milieu de l'après-midi d'hier (pourtant, j'ai encore bossé (=sauvé des documents, etc...) dessus toute la soirée d'hier...)
- UpTime = 6 jours depuis le dernier reboot pour mises à jour du serveur ( :roll: ...)

A part ce blanc (ça arrive parfois) dans les logs de SystemMonitor, je n'ai rien vu d'extra-ordinaire, tout le reste me semblait "habituel".

Et dire que le serveur semblait toujours bien fonctionner malgré cette bizarrerie de la LED d'activité disque(s). :roll: :twisted: :x
Je pouvais même encore accéder à mes données !! :x :boxe: :boxe: :boxe:


Et, pour finir : Dire que j'allais enfin pouvoir me mettre à Affa, BackupPC, Rsync, etc... (voir ici : "To Do List" :roll: pour tenter de enfin d'avoir une vraie solution de backup...


Bon, bein, à part mes yeux pour pleurer..., hein !? :cry: :wink:
(et le forum pour se lamenter... :roll: :oops: :wink: )

Non, je voulais surtout poser la question suivante :
:?: Avez-vous déjà eu ce genre de tracas avec des disques comme ceux mentionés ?

Mon impression est que ces petites choses semblent vraiment très, très, très fragiles, bien plus que par le passé.
(cf. ce que j'ai trouvé sur Inernet :
- Western Digital WD WD5000BEVT-00A0RT0 Data Recovery - Datacent
- Western Digital WD WD5000BEVT-11ZAT0 Data Recovery - Datacent
- Western Digital WD WD5000BEVT-75ZAT0 Data Recovery - Datacent
)

Bon, maintenant, je mets définitivement Hitachi comme 1ère marque à acheter, si leurs produits sont toujours aussi bon que ceux que j'ai connu il y a qiuelques années déjà. :wink:


Sur ce, bonne journée (à moins que quelque chose de semblable ne vous soit arrivée aussi...) ! :wink:

Cordialement,
HP


* WD5000BEVT = Scorpio Blue SATA ; 2.5" ; 500 Go ; 8Mo cache ; 5400 tr/min
Ma config perso : ATGC3-I (=Atom 330) + 1x 2GB RAM DDR2 + 2x HDD SATA 500 GB en RAID 1 logiciel
--> Mini-Serveur à la maison (derrière une "Box")
--> configuration réseau
A lire : The SME Server Developer's Guide (EN)
HP77
Contre-Amiral
Contre-Amiral
 
Messages: 491
Inscrit le: 25 Nov 2009 06:44
Localisation: Singapour

Re: Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité =

Messagepar jibe » 24 Nov 2010 23:23

Salut,

Je ne l'ai jamais employé sur des volumes RAID et encore moins LVM, mais j'ai souvent fait des miracles avec testdisk. Essaie tes disques sur une autre bécane, s'ils démarrent et sont reconnus par le bios, tu en fais vite un clonage avec ddrescue (ou autre, mais ddrescue marche bien). Mais... n'est-ce pas avec toi qu'on a déjà abordé le sujet de la récup de données ? Si ce n'est pas avec toi, je te laisse chercher (ici et éventuellement sur le forum FreeEOS).

Quant à la raison de ta perte de données, je n'en sais rien... Il faudrait déjà voir si les disques sont reconnus ou non ailleurs.

J'ai gardé plusieurs années des WD2500BB sur ma SME, ils étaient pas mal sollicités (la majeure partie de mon home est sur la SME, les compils se font donc là...) Je les ai finalement changés simplement parce qu'il me fallait du SATA avec ma nouvelle CM.
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie

Re: Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité =

Messagepar HP77 » 25 Nov 2010 09:01

Salut Jibé,

Je te remercie de ton passage sur ce fil.
(Ainsi que d'avoir écrit du bien sur "moi" uite à mon histoire de filtrage MAC... ; je prendrais le temps d'y répondre quand (???) j'aurais un peu moins le feu sur le gaz... :
- serveurs qui lâchent les uns derrières les autres, à la maison et au boulot,
- changement de poste au boulot : ça s'annonce difficile (si au moins j'avais les yeux et "le parlé" "bridés"... :roll: )
- travaux à faire dans l'appartement quand on aura les clefs dans 15 jours
- retour en France, sur Paris(...) pour les fêtes de fin d'année
- un projet urgent à finir pour Janvier pour une tête de *** (je le suppose raciste ou, au moins, nationaliste à 200%... :roll: ) qui m'a coulé en tant que chez d'équipe projet )

PFFFF !!
Mouais, je comprends pourquoi je suis repassé en mode "3615mylife" sur le forum, désolé, je vais faire le nécessaire pour remettre ça en vrac sous le pallaisson mais, ne venez pas frotter trop fort les pieds dessus ou ça va re-sortir ! :P :mrgreen: :wink:

jibe a écrit:Mais... n'est-ce pas avec toi qu'on a déjà abordé le sujet de la récup de données ? Si ce n'est pas avec toi, je te laisse chercher (ici et éventuellement sur le forum FreeEOS).

:oops: :oops: :oops:
Si, si ! :roll:
Même que c'est depuis cette galère que j'ai décidé de doubler tous mes disques durs (RAID mirroring) en attendant de pouvoir enfin implémenter une vraie solution de backup automatisée... #-o
Pas eu le temps d'aller plus vite ques les pannes à répéptiton... :cry:

Bon, très sérieusement, hier après-midi, j'ai fait ce que tu as indiqué dans la foulée + des petits trucs en plus :
    - Echange du PCB contrôleur SATA du disque 2 "mort" avec celui d'un disque "sain" : WinXP détectait un périphérique USB mais rien d'autre. Le disque ne tournait pas mais les têtes semblent avoir balayé la surface disque...
    - Le disque 1, lui aussi indétectable sur la carte mère du serveur HS m'a donné espoir lorsque j'ai vu Grub démarrer puis le logo SME et enfin un "Kernel Panic" (à cause de al carte mère différente. A ce sujet, pourrais-je m'en tirer avec kudzu ?)
    - DDrecue a bossé pendant au moins 10h au lieu des 5h habituelles (je n'avais qu'un boîtier SATA externe qui fait aussi sorit VGA 8) mais qui est aussi super lent... :roll: ) sur mon disque 1 pour le cloner sur le disque de secours prévu en cas d'avarie RAID (heureusement, j'ai du stock avec 4 disques pour 3 serveurs :wink: ) mais, tous les mêmes (WB5000BEVT) mais d'un magasin, de séries et de pays de fabrication (Malaysie) différents ! 8)

Là, je m'en vais connecter le disque sain, issu du clonage sur la carte mère du "défunt" serveur. Clonage avec 0 erreur, heureusement.

[Hors Sujet]
Dans la foulée, j'ai remarqué hier midi que l'on m'a activé le NAC de Cisco sur toutes les prises réseaux de mon bureau : serveur accessible uniquement depuis mon petit routeur D-Link DIR 600 au bureau. :x :twisted:

Il va vraiment me falloir trouver un client Linux pour mon serveur SME pour "berner" le NAC en lui disant "j'ain un système MS-Windaubé à la sauce mégabeurk de Symantec End Poi(so)nt, etc...

Bon, j'arrête de me prendre la tête là-dessus pour le moment (mais, ça craint pour mes futurs projets... ) et je vais "de ce pas" tenter de "ressuciter" mon serveur de données.
[/Hors Sujet]



A++ pour la suite de ma més-aventure ! :wink:


Cordialement,
HP
(qui frise la follie ! :wink: )
Ma config perso : ATGC3-I (=Atom 330) + 1x 2GB RAM DDR2 + 2x HDD SATA 500 GB en RAID 1 logiciel
--> Mini-Serveur à la maison (derrière une "Box")
--> configuration réseau
A lire : The SME Server Developer's Guide (EN)
HP77
Contre-Amiral
Contre-Amiral
 
Messages: 491
Inscrit le: 25 Nov 2009 06:44
Localisation: Singapour

Re: Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité =

Messagepar HP77 » 25 Nov 2010 16:22

Bien, bien, bien :
- Le disque 1 de mon système en RAID logiciel est de retour dans le serveur et semble bien fonctionner, tout seul.
- Le disque 2 de mon système en RAID logiciel est maintenant le disque neuf (issu du clonage précédent).
- Le disque 2 est maintenant lui aussi dans le serveur.

Ne pouvant plus accéder au shell en tant que utilisateur admin de mon système SME, comment vérifier que tout est en ordre au niveau du RAID logiciel ?

J'ai regardé du côté de # man mdadm mais cela ne m'inspire guère. :?

Que l'on se sent tout petit face à tant de nouveautés ! :|

C'est là que mon expression :
HP a écrit:"L'ignorance est un luxe que l'on ne devrait jamais se permettre. Son coût est bien trop souvent sans prix !"
, prend tout son sens...


Bon, en espérant que je puisse faire un emprunt inestimé et inestimable à la communeauté IXUS... [-o<


En attendant, que vaut-il mieux pour moi de faire ?
Laisser comme c'est ou plutôt garder un disque à l'arrêt en guise de "backup du moment" si ça lâche encore une fois. :?:


Pour la petite histoire, le disque 2 qui m'a lâché provient du même magasin qui m'a vendu les autres disques WD5000BEVT qui ont lâché ou eu des problèmes.
MA conclusion : ces gens ont, à mon goût, un trop gros taux de disques foireux. Même étallé sur plusieurs mois à un an pour que ce soit honnête.
De plus, ce sont les seuls à avoir en stock de viieilles séries classées dans les séries à risque chez Western Digital... (cf. les liens que j'ai trouvé e cité dans mon premier message de ce fil)

Pour moi, ça sent le SAV compliqué à coup sûr, je le craints. :roll: :(
En attendant, je vais devoir prendre les devant pour les autres disques que j'utilise et qui proviennent de chez ces gens-là. :x


Aller, fin de l'épisode "3615mylife", en espérant que cela puisse resservir à d'autres personnes en galère et surtout puisse aider à comprendre un peu mieux pourquoi et comment certaines choses comme celles-ci peuvent se produire ainsi que ce qu'il faut faire ou ne faut pas faire... :wink:

A++
HP_


P.S.
Ce qui serait sympa, dans ma situation, ce serait de pouvoir faire les choses depuis le Server-Manager (qui est toujours accessible à l'utilisateur admin de SME mais, là, c'est normal puisque cela semble indépendant du Shell) grâce à une contribution stable et fournie en "ntaif" avec SME. :wink:
Ma config perso : ATGC3-I (=Atom 330) + 1x 2GB RAM DDR2 + 2x HDD SATA 500 GB en RAID 1 logiciel
--> Mini-Serveur à la maison (derrière une "Box")
--> configuration réseau
A lire : The SME Server Developer's Guide (EN)
HP77
Contre-Amiral
Contre-Amiral
 
Messages: 491
Inscrit le: 25 Nov 2009 06:44
Localisation: Singapour

Re: Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité =

Messagepar jibe » 25 Nov 2010 22:24

Salut,

HP77 a écrit:en espérant que cela puisse resservir à d'autres personnes en galère et surtout puisse aider à comprendre un peu mieux pourquoi et comment certaines choses comme celles-ci peuvent se produire ainsi que ce qu'il faut faire ou ne faut pas faire...

J'espère que les "autres personnes en galère" arriveront mieux que moi à comprendre :roll:

La seule question que j'ai retenue est celle concernant mdadm. Pour cela, tu peux commencer par lire les explications de Gaston réparties dans ses posts. Sinon, tu peux toujours demander à Google s'il ne connait pas un tuto plus explicite... Mais le man reste bien sûr la référence.

Sinon, pour connaitre l'état de ton raid :
Code: Tout sélectionner
cat /proc/mdstat
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie

Re: Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité =

Messagepar HP77 » 26 Nov 2010 03:26

Bonjour,
jibe a écrit:J'espère que les "autres personnes en galère" arriveront mieux que moi à comprendre :roll:

OK.
Je ferais un résumé clair, placé en tête de discussion dès que possible. :wink:

jibe a écrit:La seule question que j'ai retenue est celle concernant mdadm. Pour cela, tu peux commencer par lire les explications de Gaston réparties dans ses posts. Sinon, tu peux toujours demander à Google s'il ne connait pas un tuto plus explicite... Mais le man reste bien sûr la référence.


Je te remercie pour les pistes, je vais pouvoir me concentrer là-dessus plutôt que de lire un peu tout et n'importe quoi avant même d'avoir, au moins vu, les bases. :)

jibe a écrit:Sinon, pour connaitre l'état de ton raid :
Code: Tout sélectionner
cat /proc/mdstat

Ca, c'est sympa. C'est ce que je cherchais à faire. :D

Bon, voilà ce que ça me répond :
Code: Tout sélectionner
[root@sme7.5_AT3GC-I_boulot ~]# cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sdb2[0]
      488279488 blocks [2/1] [U_]

md1 : active raid1 sdb1[0]
      104320 blocks [2/1] [U_]

unused devices: <none>
[root@sme7.5_AT3GC-I_boulot ~]#


Aucun message explicite d'un quelconque problème.
(A moins que cela soit bien visible pour ceux qui savent décrypter "[2/1] [U_]" au quotidien. :wink:
Bon, je regarderai la doc un peu plus tard. De mémoire, il me semble que j'avais pigé le truc lors de mon premier contact avec le RAID logiciel sur SME 8) )

Sauf erreur de ma part, je crois comprendre que mon RAID est actif (=no problem) et que le disque /dev/sdb est devenu le "maître" et pas un seul disque détecté comme non utilisé par le RAID.
Cela me paraîtrait (supposition) logique sachant que :
- le disque_2 (tout beau tout neuf) = /dev/sdb contient (en données perso) juste 2 fichiers ".xls" de plus que le disque_1 (=original ayant servi de 'master' lors du clonage) ;
- le disque_1 a été remis dans le serveur apprès le disque_2.
- le disque_2 passe alors en "maître" car contient plus de données que l'autre disque présent.

Si je me trompe, arrêtez-moi tout de suite ! :wink:

Que dois en conclure ?
- RAID= OK ?
- ou bien j'ai encore du souci à me faire ??

Bon, je verrais peut-être ça dimanche, si l'emploi du temps du samedi ne déborde pas de trop... :roll: :wink:


En tous cas, Bien Merci à toi "Jibé" ! :wink:

Cordialement,
HP
Ma config perso : ATGC3-I (=Atom 330) + 1x 2GB RAM DDR2 + 2x HDD SATA 500 GB en RAID 1 logiciel
--> Mini-Serveur à la maison (derrière une "Box")
--> configuration réseau
A lire : The SME Server Developer's Guide (EN)
HP77
Contre-Amiral
Contre-Amiral
 
Messages: 491
Inscrit le: 25 Nov 2009 06:44
Localisation: Singapour

Re: Matériel - HDD ''WD5000BEVT'' - Fiabilité et Fragilité =

Messagepar jibe » 27 Nov 2010 01:16

Salut,

Il te manque le second (ou plutôt le premier, dans l'ordre système) disque. Voici ce que tu devrais obtenir (en adaptant éventuellement les disques) :
Code: Tout sélectionner
# cat /proc/mdstat
Personalities : [raid1]
md3 : active raid1 hdc3[0] hda3[1]
      486239232 blocks [2/2] [UU]
     
md2 : active raid1 hdc2[0] hda2[1]
      2040128 blocks [2/2] [UU]
     
md1 : active raid1 hdc1[0] hda1[1]
      104320 blocks [2/2] [UU]
     
unused devices: <none>
~/#


Pour le raid 1, un volume raid (md1 ou md2...) est formé de deux disques (hda1+hdc1 ou hda2+hdc2) :wink:
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie


Retour vers Autres bavardages

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit et 1 invité

cron