Warum Daten-Deduplizierung und -Komprimierung beim Backup und der Resilienz heute so wichtig sind

Dass Daten das Lebenselixier nahezu jedes Unternehmens sind, verdeutlicht Statista mit der Prognose, dass das weltweite Datenaufkommen bis 2025 auf mehr als 180 Zettabyte anwachsen wird. Diese zunehmende Abhängigkeit von Daten in Kombination mit einer sich ständig weiterentwickelnden Bedrohungslandschaft zeigt, dass ein solider Plan zur Sicherung und Wiederherstellung von Daten für das Überleben von Unternehmen unerlässlich ist. Ein effektiver Plan gewährleistet die Geschäftskontinuität trotz der Bedrohungen durch Systemausfälle, Naturkatastrophen und Cyberangriffe.
Doch wie kann bei diesem rasanten Datenwachstum und den Risiken sichergestellt werden, dass die Daten bei jeder Art von Katastrophe wiederherstellbar sind? Es sind vor allem zwei Technologien: die Deduplizierung und die Komprimierung. Beide optimieren die Speicheranforderungen und verbessern die Effizienz der Backup- und Wiederherstellungspläne. Durch die Eliminierung redundanter Daten und die Verringerung des Daten-Footprints helfen sie, die Speicherressourcen optimal zu nutzen und die individuell definierten Wiederherstellungszeiten (RTOs) beziehungsweise Wiederherstellungspunktziele (RPOs) einzuhalten.

Funktionsweise der Backup-Deduplizierung

Die Deduplizierung wird auf Datei-, Block- und Byte-Ebene eingesetzt, wobei die Blockebene die häufigste ist. Bei der Deduplizierung auf Blockebene werden die Daten in einzelne Blöcke aufgeteilt und auf Redundanzen untersucht. Wenn ein Block mit einem bereits gespeicherten identisch ist, wird ein Verweis auf den vorhandenen Block erstellt, anstatt eine weitere Kopie zu erstellen.
Dieser Prozess basiert auf ausgeklügelten Indizierungsmechanismen, um die eindeutigen Datenblöcke und ihre Verweise herzustellen und um bei Bedarf einen schnellen Zugriff und eine schnelle Wiederherstellung der Daten zu gewährleisten. Es existieren zwei Hauptarten der Deduplizierung: die Post-Process-Deduplizierung, bei der die Daten zunächst in ihrer ursprünglichen Form gespeichert und dann dedupliziert werden, und die Inline-Deduplizierung, die beispielsweise Arcserve in seine Lösungen integriert. Hier werden die Daten in Echtzeit und während sie in das Speichersystem geschrieben werden, dedupliziert. Die Inline-Deduplizierung ist in Bezug auf den Speicherplatz effizienter, erfordert jedoch mehr Leistung bei der Verarbeitung.

Funktionsweise der Komprimierung

Die Datenkomprimierung optimiert die Backup-Prozesse, indem sie den Datenverkehr und die Speicheranforderungen reduziert. Komprimierungsalgorithmen verringern die Größe der Datenblöcke, bevor sie gespeichert werden. Oft kann zwischen mehreren verlustfreien Komprimierungsstufen gewählt werden – von einer geringen Komprimierung zur Maximierung der Leistung bis hin zu maximaler Komprimierung zur Steigerung der Speichereffizienz. So können Unternehmen ihren Bedarf an Speicheroptimierung mit den verfügbaren CPU-Ressourcen und der gewünschten Backup-Geschwindigkeit in Einklang bringen.

Höhere Resilienz mit Deduplizierung und Komprimierung

Datenvorfälle passieren meist aufgrund technischer oder menschlicher Fehler sowie aufgrund von Cyberattacken, beispielsweise Ransomware. Die Herausforderung nach einem Datenvorfall ist die schnelle Wiederherstellung der verlorenen Daten und vor allem die Wiederherstellung eines Zustands, der möglichst unmittelbar vor der Katastrophe ist (RTO und RPO). Bei den großen Datenmengen, die Unternehmen heute verarbeiten und speichern, sind Backups ohne Deduplizierung und Komprimierung kaum in der Lage, eine schnelle Sicherung und aktuelle Wiederherstellung zu gewährleisten.
Im Gegensatz dazu eliminieren die Deduplizierung und die Komprimierung diese Herausforderung, indem deutlich kleinere Mengen an Daten viel schneller und öfter gesichert werden können. Im Umkehrschluss sorgt dies für die schnelle und sehr aktuelle Wiederherstellung von Daten, was Stillstandzeiten, Produktionsausfälle und weitere Folgen eines Datenvorfalls auf ein Minimum reduziert. Und es bietet die Möglichkeit, Cyberkriminelle ins Leere laufen zu lassen und auf die Lösegeldforderungen nicht eingehen zu müssen.
#Arcserve