Synology-Forum.nl
Hardware ondersteuning => NAS hardware vragen => Topic gestart door: Basalt op 10 juni 2020, 21:43:01
-
Op 1 juni kreeg ik voor het eerst in de maandelijkse SMART rapportage 2 beschadigde sectoren op schijf 2 (die ik voor Time Backup gebruik).
Dus maar eens kijken bij Opslagbeheer. Onder IntegriteitsInfo zie ik staan: "Current_Pending_Sector 2", alle andere tellers die met fouten te maken hebben staan op 0.
Dat was voor mij aanleiding om (ook voor het eerst) een uitgebreide SMART test te starten op die schijf.
Het probleem is alleen dat die SMART test dagenlang bleef hangen op 90%. Ik heb hem een paar dagen geleden afgebroken en opnieuw gestart, en nu hij blijft weer op 90% hangen.
Wat kan hier aan de hand zijn?
-
Hangen op 90% komt vaker voor. Hij heeft er bij mij eens ruim een week over gedaan voordat hij met een disk-fail kwam.
-
Nou, een disk fail hoeft nou ook weer niet direct :o
Maar ik zal 'm dit keer wat langer z'n best laten doen...
-
Het was een diks die vanaf het begin al op 90% bleef hangen bij een uitgebreide smart test. Ik heb hem eigenlijk steeds binnen een week afgebroken.Hij had al snel read errors, maar nooit veel en heeft het jaren gedaan.
Toe begonnen de slechte blokken snel toe te nemen tot boven de 100 en heb ik de schijf uit de raid gehaald. In die situatie heb ik de uitgebreide test heel lang laten doorlopen.
-
Dit is een bug (SMART test hangt op 90%) die al heel lang speelt. Als je echt wilt weten of de schijf goed is moet je hem Uit de NAS halen en op een PC testen met de software van de leverancier.
-
Oh, mooi is dat :wtf:
Dan blijf ik maar de maandelijkse snelle test gebruiken.
-
Dit is een bug (SMART test hangt op 90%) die al heel lang speelt.
Ik had gezocht op "smart" in dit forum, maar vond alleen topics over smart TV en smartphones.
Maar ik had wat meer 'smart' moeten zoeken: met de term "smart 90%" vind ik inderdaad een fix aantal meldingen over het blijven hangen op 90%. Een echte oplossing heb ik helaas niet gevonden (behalve wat Hofstede hierboven suggereerde).
-
Persoonlijk vindt ik het complete onzin om een SMART test voor schijven te schedulen. De hele functie van SMART is juist dat de schijf zich vanzelf meldt als hij merkt dat zijn gezondheid achteruit gaat. Die regelmatige SMART tests belasten de schijf alleen maar onnodig en zorgen voor extra slijtage. Die test moet je alleen gebruiken als de schijf zich meldt met een probleem.
En ook al komt een schijf vandaag succesvol door een SMART test, er is geen enkele garantie dat hij er morgen alsnog mee ophoudt.
Waarom die functie dan in de NAS zit? Omdat Synology onder druk is gezet door mensen die dit per se wilden hebben.
-
Maar dankzij de maandelijkse SMART test weet ik nu wel dat er een probleem is met 2 sectoren. Ik zie het als een 'early warning'.
-
Die melding was uiteindelijk ook zonder die maandelijkse test vanzelf gekomen.
-
Dat ligt eraan of de nas de smartwaardes ook regelmatig uitleest als je geen 'snelle test' doet. (De uitgebreide test is inderdaad overbodig als er geen problemen zijn.)
Op de mac wordt b.v. ook de smart status bijgehouden, maar bij mijn weten is er geen melding bij een faal. Je zult steeds zelf in de hardware informatie moeten kijken wat de status is:
[attachimg=1]
Er zijn overigens wel 3th-party apps die ervoor zorgen dat je wel een melding krijgt. Apple zelf vind dat blijkbaar niet nodig. En wil je ook niet vermoeien met de details van de smart status. Je ziet alleen dat hij "gecontroleerd" is. Ook niet wanneer. Overigens is hij bij een 'faal' natuurlijk ook gecontroleerd, maar dat wordt dan anders weergegeven.
NB. Bovenstaand schreenshot is van mijn 2e HDD in mijn laptop. Dat mijn eerste een faal had, merkte ik omdat een systeemupdate steeds mislukte. Toen ben ik, nadet ik dagen kwijt was aan het vinden van het update probleem, naar de smart info gaan kijken en stond er een fail. Geen automatische melding. Dan had ik de schijf al veel eerder vervangen.
-
Ja hoor, de NAS meldt een abnormale SMART status direct, ook zonder test. Dat deed DSM al lang voordat Synology de mogelijkheden om een SMART test (handmatig of scheduled) uit te voeren had ingebouwd.
Toevallig vorige week nog meegemaakt in ons datacenter. Waar we dus nooit SMART testen draaien.
De meeste PC’s controleren tegenwoordig ook de SMARt status als de machine gestart wordt.
-
Toch is het goed als elk bitje periodiek gelezen wordt om degradatie vroegtijdig te ontdekken. Als je een raid5 hebt, kun je dit via datascrubbing doen. (Het wordt ook door Synology geadviseerd om dit periodiek te doen)
Als de schijven niet in een raid staan die datascrubbing toelaat, lijkt me de uitgebreide smart test een middel om de disks af en toe grondig te testen.
-
Het hele SMART gebeuren is juist ontworpen met als doel dat het niet meer nodig is schijven regelmatig te testen. Als er tijdens normaal gebruik ontdekt wordt dat er degradatie is opgetreden wordt dat door SMART automatisch gerepareerd. Het is nergens voor nodig om die detectie te forceren. Het zorgt alleen voor onnodige extra slijtage op de schijf, de testen zijn behoorlijk belastend.
Het idee dat een harde schijf regelmatig getest zou moeten worden is iets uit een ver verleden dat mensen maar moeilijk los willen laten. ☺️
-
Gisterenavond een mail van m'n NAS:
Beste gebruiker
S.M.A.R.T.-test op harde schijf 2 op Basalt is mislukt. Maak een back-up van uw gegevens en vervang de schijf zo snel mogelijk.
met vriendelijke groeten,
Synology DiskStation
Toch zie ik bij de SMART info alleen die 2 sectoren, zie bijlage, en de TimeBackup is vanochtend gewoon goed verlopen.
De SMART test nog maar eens opgestart, nu de snelle variant.
Na ruim een minuut de melding dat de test mislukt is, en opnieuw een mailtje, zelfde inhoud.
Het lijkt dus echt mis met deze schijf. Ik vraag me af of ik zonder maandelijkse SMART test er nu al achter was gekomen.
EDIT
Nu ik beter kijk zie ik dat de snelle SMART als testresultaat 'Normaal' heeft gegeven, maar ik kreeg toch een Melding van een Systeemgebeurtenis: 'S.M.A.R.T.-test mislukt op schijf 2 op Basalt'.
-
Maak een back-up van uw gegevens en vervang de schijf zo snel mogelijk.
Dat vind ik nogal overdreven voor 2 pending sectors, status OK.
-
Tsja, dat lijkt mij ook.
Maar ik heb nu wel deze alarmerende melding op m'n DSM bureaublad:
-
Na ruim een jaar bovengenoemde alarmerende melding "professioneel genegeerd" te hebben, liep mijn NAS vandaag vast. Niet meer bereikbaar op web interface, ook niet voor IMAP, SSH, ping, en geen gemounte drives meer, helemaal niks Hoorde wel wat zachte geluidjes van de harddisk(s) komen: gezoem dat regelmatig even van toonhoogte veranderde, en wat geklik.
Reset knop een paar seconden ingedrukt totdat blauwe LED begon te knipperen. Dat bleef zo zeker een half uur doorgaan.
Toen werd ik ongeduldig en heb ik de UPS uit het stopcontact gehaald, in de hoop dat die na enige tijd een nette shutdown zou initiëren, maar helaas, pas toen de UPS uitgeput was ging de NAS ook uit.
Harddisk 2 eruit gehaald en opnieuw opgestart, geen probleem.
Afgesloten en harddisk 2 er weer terug ingezet. Kreeg op web interface melding dat het volume was "Vastgelopen". In opslagbeheer de voorgestelde link aangeklikt om een Herstel van de systeempartitie te doen. Dat ging goed, en het volume is weer "Normaal", en de bovengenoemde alarmerende oranje melding is nu ook weg, de Systeemintegeriteit is "Goed" en het systeem "werkt naar behoren".
Snelle SMART test gestart, geen problemen op beide harddisks.
Nu een uitgebreide SMART test gestart op harddisk 2, dik kans dat die net als voorheen blijft hangen op 90%, voorlopig geeft hij nog 10% aan. Deze schijf moet sowieso vervangen worden, maar ik ben gewoon nieuwsgierig.
Deze harddisk 2 gebruik ik alleen voor TimeBackup, en de (dagelijkse) backup was vanochtend nog gelukt (e-mail van ontvangen). Er was vandaag niemand thuis, en zover ik weet is er ook geen VPN toegang geweest. Het laatste wat ik in /var/log/messages zie is dat de NAS om 14:12 uit deep sleep gekomen is, en een DDNS update uitvoert. De daaropvolgende log regels gaan over het weer opstarten, nadat ik de UPS weer in het stopcontact had gedaan.
Vraagje: Hoe kan het dat de NAS ergens overdag compleet vastloopt, terwijl harddisk 2 na de TimeBackup niet eens gebruikt werd? Is dat puur aan die harddisk te wijten, of kan er meer aan de hand zijn?
-
gezoem dat regelmatig even van toonhoogte veranderde, en wat geklik.
Dat geklik komt van lees/schrijf koppen, die proberen om steeds in positie te komen.
Dat is in ieder geval geen goed teken.
Zou dan toch de HD vervangen.
-
Een uitgebreide smarttest is toch al belastend voor de disk. Als hij dan ook nog problemen met de test heeft wordt de belasting alleen maar groter. Uiteindelijk kan de extra slijtage door de test ervoor zorgen dat de disk faalt. ;)
-
Ja, ik weet het: ik had die harddisk allang moeten vervangen ;)
Maar ik ben ook bezig om mijn DS412+ te gaan vervangen door wat nieuws (bijv een DS420+), waarbij de DS412+ een backup server wordt. Om de data van m'n DS412+ makkelijk over te zetten naar de nieuwe NAS heb ik onlangs (ein-de-lijk) DSM geüpdatet van 5.2 naar 6.2.4.
Die update ging vrij eenvoudig, alleen bestaat Time Backup niet meer. In plaats daarvan gebruik ik nu Hyper Backup met Smart Recycle, dat lijkt me functioneel hetzelfde (alleen staat de backup nu in een database, ipv allemaal links in het filesysteem).
En ja, die Hyper Backup gaat (net als Time Backup vroeger) naar de harddisk met SMART problemen. Als die definitief uitvalt ben ik alle voorgaande versies kwijt, maar wees gerust: ik maak ook gewone backups naar USB disks.
Direct na de overgang naar DSM 6.2.4 was de SMART waarschuwing verdwenen, maar na korte tijd verscheen die weer. Ook kreeg ik een keurige systeem melding dat "Schijf Drive 2 op DS4122+ begint te falen", en "Maak onmiddellijk een back-up van uw gegevens en vervang vervolgens de schijf".
Maar ja, je hebt altijd van de eigenwijze mensen zoals ik, die 'voor de aardigheid' toch nog eens een uitgebreide SMART test starten. Die is een eeuwigheid bezig geweest, met als resultaat:
- Integriteitsinfo - Drive 2, Geschiedenis: 2021-10-09, S.M.A.R.T Uitgebreide test, Gezond
- En onder 'Belangrijke informatie' staat in het grafiekje van de 'Telling beschadigde sectoren' de waarde -2 voor Oktober, met als toelichting: "Wanneer de slechte sector [sic] een negatief getal weergeeft, worden [sic] een aantal beschadigde sectoren hersteld en worden gegevens overgedragen naar extra ruimte op de schijf".
Het lijkt er bijna op dat het probleem met de 2 foute sectoren toch nog hersteld is :)
Bij de numerieke SMART gegevens zie ik ook geen afwijkende getallen staan.
EDIT: Ik heb de waarden vergeleken met die van 13 Juni vorig jaar (2020), en zie nu dat de 'Spin_Up_Time' is opgelopen van 188 naar 428 :x
[attach=1]
EDIT-2: Schijf 1 heeft een vergelijkbare Spin_Up_Time van 465, misschien dat onder DSM 6.2.4 andere (hogere) waarden worden getoond dan onder DSM 5.2 ?
Ik weet het, deze harddisk loopt risico, en ik ga hem heus wel een keer vervangen.
Maar ik wilde jullie deze status update (danwel: wonderbaarlijke genezing) ook niet onthouden 8)