In modernen Backup und Recovery Umgebungen haben sich Backup-To-Disk Lösungen seit Jahren etabliert. Viele Kunden achten dabei auf ein günstiges Kosten- und Nutzenverhältnis. Dies kann durch den Einsatz von modernen Deduplizierungstechnologien gewährleistet werden. Allerdings müssen bei der Integration in die Backupanwendung einige Spielregeln einhalten, nur so lassen sich Backup-To-Disk Lösung effizient betreiben. Die wichtigsten (nicht alle und nicht vollständig) Regeln und ein Vergleich für den Einsatz von virtuellen und physikalischen Laufwerken sind nachfolgend aufgeführt. Weiterführende Informationen und Best Practice Empfehlungen können in den „StoreOnce User Guides“ nachgelesen werden.
Basics:
- Physische und virtuelle Laufwerke funktionieren prinzipiell unterschiedlich.
- Physische Laufwerke empfangen die Daten als optimierten sequentiellen Datenstrom (sequential data stream) und schreiben die Daten in einem seriellen Format auf das sequentielle Bandlaufwerk.
- Virtuelle Laufwerke empfangen und schreiben die Daten in einem „wahlfreien“ und „willkürlichen“ Datenstrom (random data stream) um so eine höhere Performance zu erreichen.
- Wegen diesem unterschiedlichen Verhalten müssen die Methoden zur Optimierung der Backupperformance zwangsläufig anders sein. Die Optimierung für physikalische Laufwerke lassen sich demnach nicht für virtuelle Laufwerke anwenden.
Optimierungen physische Laufwerke:
- Multiplexing und eine hohe Concurrency (Anzahl der Clienten, die gleichzeitig auf ein Laufwerk schreiben können) sichern eine hohe Datentransferrate auf das Bandlaufwerk.
- Eine hohe Concurrency und Datentransferrate verhindert den Start/Stopp Modus, auch als „Shoe-Shining Effekt“ bekannt.
Multiplexing:
Optimierungen virtuelle Laufwerke:
- Für eine Optimierung der Deduplizierung muss Multiplexing verhindert werden, die Concurrency für Laufwerke muss daher „1“ betragen. Auf diese Weise ist der Datenstrom für eine Erkennung, sowie Eliminierung von Redundanzen im Datenstrom (=Deduplizierung) optimiert.
- Zur Steigerung der Backupperformance muss daher Multistreaming und damit eine erhöhte Anzahl von virtuellen Laufwerken verwendet werden. Da es sich um virtuelle Laufwerke handelt gibt es keine (oder nur wenige) Gründe sich um die Ressourcen Gedanken zu machen.
Multistreaming:
Good article. After a long battle with slow backups and slow object copies I figured this out myself. Article would have been even better if it would address what is the best way to connect drives, e.g. in a FC fabric. Physical and Virtual. In my experience, the way you physically connect them can make a huge speed difference. Keywords: Speed vs. redundancy. LUN mapping. Maybe in a follow-up article?