Ich starte diese Thread jetzt einfach mal, nachdem ich keinen bereits vorhandenen gefunden habe, der passen würde. Sollte ich mich irren, dann bitte verlinkt den anderen Beitrag einfach hier und / oder ich mache in diesem anderen weiter.
Zum Thema Datengräber wurde ja bereits in einem anderen Thread angefangen zu diskutieren. Ich bin total gespannt auf euere Vorschläge oder Anregungen und wie die Organisation eines derartigen Storage aussehen kann. Ich bitte allerdings darum, keine Grundsatzdiskussion vom Zaun zu brechen, alá "Ein Elasticsearch in einem Docker Container auf einer Synology NAS betreiben ist alles andere als optimal". Es soll bitte um Grundsätzliches gehen. Gerne können a andere Probleme gesondert gelöst werden, also sollte sich herausstellen, dass größerer Diskussionsbedarf zu einem Thema wie Backup, Elasticsearch, ..., besteht, dann fände ich es besser einen eigenen Thread dafür aufmachen. Danke.
Meine Konfiguration habe ich mir für mich ausgedacht und installiert. Sie ist ein absoluter Overkill, entstand aber als Resultat aus Beispielsweise "Ich kann das, also mach ich das so" oder "Ich habe schon viel Mist, auch Verschlüsselungstrojaner, bei Kunden gesehen" oder (auch vom Kunden) "RAID 0 reicht mir als Backup" (nein, wirklich RAID 0). Hier ein Einblick in meine private Konfiguration.
Erst mal ein wenig zu meinen (aktuell) vorhandenen Datengräbern.
Hauptstorage Synology DS916+
- 4x Seagate NAS Drives
- SHR 2 / doppelte Redundanz
- 8GB RAM
- 2x 1 GBit/s LAG
- Shares für neuere Geräte
- Wird genutzt für Logstorages, Fileshare NFS/AFP/CIFS, Download Station, Syncthing, Nextcloud, Elasticsearch manche Docker Container
- RDX Drive für Backup mit 7 Drives für direkte Backups
- USV
Retrostorage DroboFS
- 5x WD RED
- 1x 1 GBit/s
- RAID 6 / doppelte Redundanz
- älteres SAMBA Protokoll für alte Rechner
Backup Storage 1 (BS1), Tägliche Backups von wichtigen Daten der Synology:
- Zotac MAG Mini ND01
- Ubuntu Server 20.04
- 3 GB RAM
- 32 GB SSD für OS
- 2x WD RED in externem eSATA Enclosure
- USV
Backup Storage 2 (BS2):
- RaspberryPi 3B+
- Raspbian (Debian)
- 32GB SD-Card
- 1x WD RED
- Relay an GPIO zum an-/abschalten der Festplatte im Bedarfsfall
Meine (Haupt)Shares:
- Archiv
- Bilder
- Scans
- Webdownloads
- Software
- ISOs
- Projekte
- Treiber
- Systemdatentraeger
- Public
- Filme
- Backups
- home
- clonezilla
- Syncthing
Die Datenhaltung:
Meine Datenstruktur ist gewachsen und gewachsen, wie vielleicht bei manchem von euch auch. Es sind aus den Datenträgerbackups von Floppies und (Shareware-)CDs, die bereits in den 90ern erstellt wurden, noch soetwas wie Downloads verschiedenster Quellen dazugekommen. Irgendwann kam mir dann der Gedanke meine Strukturen neu anzulegen und zu sortieren.
Vor wenigen Jahren, bevor ich die Synology bekam, habe ich dann angefangen Dokumente in Nextcloud zu speichern und mit entsprechendem Plugin per Elasticsearch zu indizieren. Natürlich klappt das nur mit Dokumenten richtig gut, die bereits in Textform vorliegen oder per OCR vorbereitet wurden. Ich arbeite gerade daran meine Dokumente per Tesseract OCR automatisiert in Nextcloud verarbeiten zu lassen, damit diese auch per Elasticsearch Volltextsuche indiziert werden. Das durchsuchen der Dateien war bei den vorigen Systemen suboptimal und über das Netzwerk teilweise unmöglich. Auf der Synology funktioniert das im Filebrowser um einiges besser.
Trotz Nextcloud FullTextSearch versuche ich aber dennoch auf eine Datenstruktur zu achten, um im Zweifelsfall auch manuell schneller an Dokumente heranzukommen. Beispielsweise werden alle Dokumente seit einigen Jahren mit einem Datum im Format "YYYYMMDDmmhh-" als Prefix abgespeichert um die Sortierung leichter zu gestalten. Die Ordnerstruktur sieht dann Beispielsweise wie folgt aus: Archiv->Bewerbung->2023->Firmenname->202301042316-Lebenslauf.odf. In Ordnern und Dateinamen gibt es keine Umlaute, Sonder- und Leerzeichen.
Treiber, Software, ISOs sollten in ihren Shares liegen. Der Share Systemdatentraeger besteht aus Unterordnern für verschiedene Computer, die ich besitze oder teilweise besaß, in denen Treiber, BIOS, Manuals, Fotos, Scans, also alles, was an Informationen zu diesem Computer vorhanden ist, gruppiert sein sollte. Images der Festplatten mit den fertigen Installationen erstelle ich mit Clonezilla --- manchmal natürlich mit Hilfe meines Brückenrechners --- so kann ich die Geräte immer relativ schnell wieder auf "Originalzustand" zurücksetzen, wenn ich das möchte.
Es kommt dennoch vor, dass ich Duplikate auf den Platten liegen habe. Manche sind zwar gewollt (Treiber <-> Systemdatentraeger), andere sind natürlich ungewollt und entstanden durch etwas wie Downloads von Archiven / rsync von Servern. Das muss ich dringend aufräumen und besser durchsuchbar machen...
Für ältere Rechner nutze ich mein DroboFS, welches nicht mehr aktiv genutzt wird und für meine Retrorechner ein Storage zur Verfügung stellt, was eben auch ältere SAMBA-Protokolle unterstützt.
Backups:
Ich setze grundsätzlich lieber auf offlinefähige Backups, die auch in "10 Jahren" noch von einem guten Linux gelesen werden können (sollten).
An meiner Synology ist ein RDX Laufwerk angeschlossen. Dafür habe ich 10 Cartridges, auf denen die wichtigsten Daten im Wochenrhytmus gesichert werden. So kann ich Daten bis zu 10 Wochen und 6 Tagen zurück von diesen Cartridges wiederherstellen.
Auf BS1 werden täglich die relevanten Daten per RSnapshot von der Synology geholt. BS2 schaltet wöchentlich die Festplatten an, startet einen RSnapshotprozess um die Daten von BS1 zu holen, schaltet dann nach erfolgreichem sync, verify und unmount die Festplatten nach 10 Minuten wieder aus. BS2 hängt in einem eigenen BackupVLAN und BS1 hängt in beiden VLAN.
Alle Unwichtigen Daten (z. B. Treiber, ISOs, Retrocomputerbackups), also alles, was noch nicht irgendwie anderweitig gesichert wird, werden in absolut unregelmäßigen Abständen, wenn ich mal das DROBO anschalte, per manuell zu startendem RSync auf der Synology von dieser auf das DROBO kopiert.
Was sind für mich wichtige Daten:
- Dokumente von Banken, Versicherungen, Verträge, Rechnungen, ...
- Bilder / Videomaterial von meiner Familie
- selbst verbrochene Tools / 3D-Drucker Objekte
- Bitwarden / Keepass Tresore
- Backups von aktuellen Systemen
- Emails
MEINE Gedanken zur Sicherheit von Backups:
- Es sollten Offlinefähige Medien wie Festplatten, BluRay Discs oder Streamer / RDX verwendet werden
- Die Backupdatenträger sind verschlüsselt
- Die Verschlüsselungskeys sind auf mehreren USB-Sticks gespeichert. Mindestens einer dieser Datenträger ist nicht im Haus aufbewahrt
- Die Verschlüsselungskeys liegen in einem zentralen, geschützten Storage innerhalb meines Netzwerkes und werden bei Bedarf von den entsprechenden Systemen angefordert / abgeholt und werden nicht auf dem Backupsystem gespeichert
- Keines dieser Geräte hat Internetzugriff
- Eigene VLAN für "Sicherheitszonen" --- BS2 hängt in einem eigenen VLAN, BS1 ist als einziges Gerät im in beiden VLAN erreichbar
- BS2 hat Zugriff auf BS1 und holt sich die Daten von dort, nicht anders herum
- RAID ist kein Backup
- Backups, die im selben Raum aufbewahrt werden, sind keine Backups
- manuelle Backups sind keine Backups
- Backups, die nicht getestet werden, sind Schrödingers Backups
- alle Backups werden gemonitored
- Dokumentation der Backups
Die Dokumentation der Backups wird unterschätzt. Auch im privaten kann der "Administrator" ausfallen und die Lösung, die er / sie / es erarbeitet hat ist dahin und die "hinterbliebenen" müssen schauen, wie sie klarkommen. Für meine Fälle habe ich Textdateien erstellt, die auf der NAS und USB-Sticks mit den Keys liegen. Mein größtes Problem ist aber mich dazu zu zwingen die Dokumentation auf dem aktuellsten Stand zu halten, falls sich tatsächlich mal was ändert.
So. Ich hoffe irgendjemand kann mir nun noch folgen. Ist irgendwie mehr geworden, als ich ursprünglich dachte. Wenn du also bis hier gelesen hast...
Viel Spaß