In einem anderen Artikel „What is device polling“ hatte ich beschrieben was Device Polling ist und welche Auswirkungen das auf ein backup haben kann. Hier versuche ich nun aufzuzeigen wie man Device Polling verhindert.
Bleibt zu erwähnen das nachfolgende Hinweise für anständige Hardware – HP – gelten. Wenn man gezwungen ist Data Protector auf F***** oder I** oder D*** Servern zu installieren, so ist die entsprechende Doku des Herstellers zu verwenden.
Generell gilt: Device Polling muss auf allen Servern deaktiviert werden welche Bandlaufwerke im SAN „sehen“ können. Server die nicht Bandlaufwerke sehen müssen sind in eine separate Zone auf den SAN Switchen zu schieben. Nach Möglichkeit sollte immer 1:1 Zoning genutzt werden. Auf den MSL 6000 kann es helfen eine leere indexed map zu haben (somit werden neue Server nicht zugeordnet) und eine zusätzliche Map im NSR zu generieren.
- Deaktivieren von Netzwerkscannern: NMAP oder 3com Network Director sind dafür bekannt Netzwerktraffic auf dem NSR zu senden, der sporadische Reboots der NSR’s verursachen kann. Scans sollte nur in der backupfreien Zeit stattfinden.
- Unter Windows werden sogenannte TUR (Test Unit Ready) Komanndos in periodischen Abständen an den SCSI Bus gesendet (Windows 2000 – alle 3 Sekunden, Windows 2003 – jede Sekunde). Dieses Verhalten tritt sofort auf wenn ein neuer Server installiert wird und dieser Server SAN Zugriff hat. Windows 2008 ist nur dann betroffen, wenn dort der Wechselmediendienst (RSM) als zusätzliches Feature installiert wird. Prinzipiell ist der Wechselmediendienst zu deaktivieren und zusätzlich dem Bandlaufwerkstreiber TUR zu entwöhnen (siehe auch Folgepunkt). Microsoft hat hierfür einen KB Artikel 842411: http://support.microsoft.com/default.aspx?scid=kb;en-us;842411. Zusätzlicher Hinweis: wenn man einen Server abschaltet und für neue Zwecke neu installieren möchte, so sollte man auch das Zoning beim „Rückbau“ überprüfen, da beim Neuinstallieren des Servers mit Windows das Problem sofort wieder auftreten kann.
- Für HP LTO muss die aktuellste Version der Treiber eingesetzt werden, da eine ältere Version (1.0.3.0) im Installationsfile das Polling immer aktiviert. Prinzipiell muss der folgende Registry Key für jedes Laufwerk (Laufwerkstyp – hplto, hpdlt, …) eingetragen werden und danach der Server neu gestartet werden, unter Umständen muss auch der NSR neu gestartet werden. Die Schritte sind auch für die Robotic notwendig (libxprmc, hpmc oder hpuln32).
- HKLM\SYSTEM\CurrentControlSet\Services\hplto
- neuen DWORD anlegen, Name AutoRun, Wert=0
Auch auf UNIX kann es zum Pollen der Devices kommen:
- HP-UX 11.23 (v2) reicht es aus den Kernel Parameter st_san_safe zu setzen –>
kctune st_san_safe=1
- Für HP-UX 11.31 (v3) gibt es einen neuen Parameter, hierfür ist jedoch Patch PHKL_36312 erforderlich:
- Setzen des Wertes:
scsimgr set_attr -d estape -a norewind_close_disabled=1
- Speichern des Wertes:
scsimgr save_attr -d estape -a norewind_close_disabled=1
- Überprüfen des Wertes:
scsimgr - estape get_attr
Und wie kann man das dann alles noch kontrollieren? Auf einem NSR kann man die Traces leeren und bei nichtlaufendem Backup prüfen wieviele Einträge geschrieben werden, device polling würde hier sehr viele Einträge in Sekunden anzeigen.
Anmerkung generell: Polling wird zwar immer noch passieren, aber mit den ergriffenen Maßnahmen nicht mehr in der Masse. Ein unter HP-UX abgesetztes ioscan, unter Windows ausgeführtes „Nach geänderter Hardware suchen“ oder ein ausgeführtes LTT werden trotzdem ein wenig device polling durchführen, dieses Verhalten ist aber in einem akzeptablen Maße.
Und weil ich grade LTT erwähnt habe. Dieses Tool kann mittlerweile auch genau dokumentieren welcher HBA TUR verursacht; mit einer sauber gepflegten SAN Doku sollte man dann sehr schnell den verursachenden Server finden können. Das LTT Tool gibt es übrigens hier: (Wusstet hier dass es das Tool für Netware gibt? – Ich bin Master CNE…)http://h20000.www2.hp.com/bizsupport/TechSupport/DriverDownload.jsp?lang=de&cc=de&prodNameId=406731&taskId=135&prodTypeId=12169&prodSeriesId=406729&lang=de&cc=de
Very informative document.Thanks!