Aktuelle Zeit: 24. Oktober 2017, 12:17

zfs-server.de

Das ZFS Forum

Schleichende Fehler schon unter 1TB Nutzdaten? (gelöst)

 
Beiträge: 46
Registriert: 21. August 2015, 07:16

Schleichende Fehler schon unter 1TB Nutzdaten? (gelöst)

Beitrag von BSFD » 10. September 2015, 07:12

Hallo,

ZFS ist ja bekannt dafür Fehler zu erkennen und bei Redundanz diesen Fehler auch beheben zu können. Mir ist in den letzten Monaten mehrfach aufgefallen, dass geschriebene Daten auf Einzelplatten relativ schnell Lesefehler aufzeigen. Anfangs dachte ich noch es hätte ggf. etwas mit den verschiedenen ZFS Versionen zu tun, dass ein Feature Flag falsch oder nicht behandelt wird. Wie kann es aber sein, dass Dateien selbst nach mehreren "zfs scrub" OK sind und dann bei einfacher Anwendung fehlerhaft sind.

Diese Lesefehler treten meist bei sehr großen Dateien auf. Für Performance Tests hatte ich mir 3 jeweils 100GB große Dateien erzeugt. Die Platte in dem System lief in den letzten Jahr problemlos. Derzeit nutze ich diese Daten unter FreeNAS.

Hat jemand aus dem Forum schon ähnliche Erfahrungen gemacht?
Zuletzt geändert von BSFD am 6. März 2016, 22:19, insgesamt 1-mal geändert.

 
Beiträge: 20
Registriert: 4. April 2015, 18:51

Re: Schleichende Fehler schon unter 1TB Nutzdaten?

Beitrag von gea » 14. September 2015, 08:40

ZFS ist seit ca 10 Jahren verfügbar und damit eines der ausgereiftesten Dateisysteme.
Unerkannte oder falsch erkannte Prüfsummen oder Datenfehler in der Kette OS >> Treiber >> Controller >> Kabel >> Backplane >> Platte sind damit in der Regel auf Probleme der schreibenden Applikation oder RAM Probleme (z.B. unerkannte RAM Fehler ohne ECC RAM) zurückzuführen.

ZFS wird aber weiterentwickelt, entweder bei Oracle (ZFS > v28) oder Illumos (ZFS v5000 mit feature flags). Dabei ist aktuell ein Bug im aktuellen Modul für den L2Arc Cache entdeckt worden, der zu Datenfehlern führen kann. Ich arbeite nur mit Solaris unmd OmniOS, es kann aber sein, dass das aktuelle FreeBSD auch bereits die neuesten ZFS Features nutzt und daher den Bug auch enthält, genau wie z.B. OmniOS 151014.

Der Bug tritt bei Vorhandensein einer L2Arc SSD auf. Dann den L2Arc entfernen ind den Pool mir scrub und zdb prüfen.
Der Bug wird gerade gefixt: https://www.illumos.org/issues/6214

 
Beiträge: 46
Registriert: 21. August 2015, 07:16

Re: Schleichende Fehler schon unter 1TB Nutzdaten?

Beitrag von BSFD » 14. September 2015, 11:55

gea hat geschrieben:Der Bug tritt bei Vorhandensein einer L2Arc SSD auf. Dann den L2Arc entfernen ind den Pool mir scrub und zdb prüfen.
Der Bug wird gerade gefixt: https://www.illumos.org/issues/6214


Ich denke mein Problem kommt wo anders her. Ich habe sowohl mit FreeBSD als auch Sabayon mit ZFS eigentlich nie größere Probleme gehabt. Was ich bei meinem Eintrag vergessen hatte ist, bei den Platten handelt es sich um USB Platten, die teils als Einzelplatte als auch gespiegelt über USB genutzt wurden. Entweder sind diese USB Treiber nicht sehr stabil, dass es dort zu Unterbrechungen kommt oder aber die Platte selbst hat einen Schlag weg. Es könnte an der noch recht neuen USB3 Unterstützung von FreeBSD liegen.

Benutzeravatar
 
Beiträge: 41
Registriert: 14. Oktober 2014, 15:49
Wohnort: Region Köln/Bonn

Re: Schleichende Fehler schon unter 1TB Nutzdaten?

Beitrag von chris » 14. September 2015, 17:15

Wir hatten dienstlich mal einen Server mit 2 USB3-Platten versehen und mit Openindiana installiert. Das lief ohne Probleme.
Man muss dazu sagen, dass die Betriebssystemplatten USB waren und der Server nur USB2-Unterstützung hatte.
Aber damit hast du natürlich auch eine Lange kette an Komponenten, die Fehler verursachen können.

 
Beiträge: 46
Registriert: 21. August 2015, 07:16

Re: Schleichende Fehler schon unter 1TB Nutzdaten?

Beitrag von BSFD » 28. Februar 2016, 18:57

Ich überlege, ob ich diesen Eintrag wieder zurück ziehe. Das von mir geschilderte Problem hat sich gelöst. Es liegt nicht an ZFS. Es lag an einem PC System, welches durch einen Speicherfehler den ZFS Pool langsam zerstört hat. Zu dieser Zeit habe ich mehrere ZFS Pools zwischen verschiedenen Systemen übertragen. Der Fehler ist mir bei einer Neuinstallation aufgefallen und lag daran, dass das System nur 16GB statt 32GB RAM sauber unterstützte. Also Entwarnung an die ZFS Nutzer!


Zurück zu FreeBSD

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast