Mit Data Protector 9.04 wurden für die Wiederherstellung virtueller Maschinen (VMware), gesichert mit der VE Integration, die neuen Funktionen PowerOn&Run und Live Migrate von 3PAR Snapshots oder SmartCache eingeführt. Ich hatte in einem Proof-of-Concept die Gelegenheit diese Funktion zu implementieren und dem Kunden zu präsentieren. Ich habe auch bereits mit Partnern und einigen Kunden sprechen können und Fazit ist: eine gelungene Implementation! Einige Gespräche gingen auch so weit Veeam als ergänzende Backuplösung in Frage zu stellen, bietet doch Data Protector einmal mehr in Enterprise Umgebungen eine weitere attraktive Wiederherstellungsmöglichkeit für virtuelle Maschinen.
In dem angesprochenen PoC hatte ich die Sicherung von verschiedenen virtuellen Maschinen in den SmartCache durchgeführt, konnte aber auch einige Maschinen über Zero Downtime Backup sichern und in die Backup und Recovery Strategie des Kunden implementieren. PowerOn und Migrate haben bei Verwendung des 3PAR Snapshots und des SmartCaches tadellos funktioniert und ich ermuntere jeden Kunden diese neue Funktion des Data Protectors einmal zu testen. Wenn keine 3PAR im Einsatz ist, dann kann man den Test mit dem SmartCache durchführen.
Apropos tadellos, zwei Stoplersteine gab es. In einem Fall wurde beim Anschalten der virtuellen Maschine eine Fehlermeldung ausgegeben: „A question needs to be answered before power on can be completed“ und als Folge „Error powering on“. Im zweiten Fall kam eine Fehlermeldung: „Share presentation failed“ und als Folge „Power On Virtual Machine failed“. In beiden Fällen hat Data Protector allerdings nur einen Folgefehler einer anderen Ursache angezeigt. Bevor jemand auf den gleichen Fehler stößt, nachfolgend die Erklärung der Ursache.
„A question needs to be answered before power on can be completed“
Bei einem Blick in das Virtual Center, wurde die unbeantwortete Frage mit der Erklärung „Diese virtuelle Maschine wurde möglicherweise verschoben oder kopiert…“ angezeigt. Im Debug war folgendes zu sehen:
[ 99] 2015-08-19 14:23:46.463 ("/integ/vep/vepa/Plugins/Vmware/VmwareHelpers/ConfigUtil.cpp $Rev: 49146 $ $Date:: ":293) [ 99] ===>> (6) ConfigUtil::answerQuestion { [ 99] [ 20] [ConfigUtil::answerQuestion] waiting for different question _vmx1 Diese virtuelle Maschine wurde möglicherweise verschoben oder kopiert. Um bestimmte Verwaltungs- und Netzwerkfunktionen konfigurieren zu können, muss VMware ESX wissen, ob diese virtuelle Maschine verschoben oder kopiert wurde. Wenn Sie es nicht wissen, antworten Sie mit "Ich habe sie kopiert". [ 20] [ConfigUtil::answerQuestion] Throwing exception: class std::runtime_error
Moment! Deutscher Fehler im englischsprachigen Produkt? Der Virtual Center Server war zwar in Englisch installiert, aber der Dienst und der Benutzer waren nicht auf „English Locale“ eingestellt. Mit dem Link (Dank an Sebastian): http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2121646 konnte der Fehler dann schnell behoben werden und PowerOn und Migrate funktionierten wie erwartet.
„Share presentation failed“
[Normal] From: RSM@hpcs.customer.local "" Time: 8/10/2015 9:54:59 AM Restore session 2015/08/10-10 started. [Normal] From: RMA@hpcs.customer.local "SmartCache_gw1 [GW 18252:0:17740599057275740933]" Time: 8/10/2015 9:55:38 AM STARTING Media Agent "SmartCache_gw1 [GW 18252:0:17740599057275740933]" [Normal] From: RMA@hpcs.customer.local "SmartCache_gw1 [GW 18252:0:17740599057275740933]" Time: 8/10/2015 9:55:39 AM Loading medium from slot \\hpcs.customer.local\D:\Cache\358d640a_55d57510_0908_13a1 to device SmartCache_gw1 [GW 18252:0:17740599057275740933] [Major] From: RMA@hpcs.customer.local "SmartCache_gw1 [GW 18252:0:17740599057275740933]" Time: 8/10/2015 9:55:45 AM Share presentation failed. [Major] From: OB2BAR_VEAgent@hpcs.customer.local "/DATACENTER" Time: 8/10/2015 9:55:45 AM Received ABORT request from RSM (ERR: Error starting backup/restore (BMA cannot be started or similar).) [Major] From: VEPALIB_VMWARE@hpcs.customer.local "/DATACENTER" Time: 8/10/2015 9:55:45 AM Preparation of replica vm 'virtualmachine' for restore failed ... [Critical] From: VEPALIB_VMWARE@hpcs.customer.local "/DATACENTER" Time: 8/10/2015 9:55:45 AM Power On Virtual Machine failed.
Nach einigen Debugs hatte ich festgestellt dass der Port 111 in Benutzung war (nestat -ano
). Ein Blick in die Prozessliste zur PID zeigte den verantwortlichen Prozess an – ONC/RPC Portmapper. Der Prozess (gehört zu QLogic’s OneCommand) belegte den Port 111 und verhinderte somit einen Start des NFS Dienstes. Lösung: Den Dienst ONC/RPC Portmapper auf deaktiviert setzen und NFS Dienst starten, schon funktioniert die Präsentation an den ESX Server.
Übrigens: Für das Purgen der angeschalteten Maschinen wurde der Befehl omnidbutil
erweitert. Mit omnidbutil -purge_expired_poweron_vms -daily
erfolgt die Bereinigung.