domenica 18 novembre 2018

Windows server Reboot Loop.

Ecco un altro problema piuttosto particolare che mi ha dato parecchie grane nei giorni scorsi.

La settimana precedente mi ero reso conto che c'era un reboot pending, a seguito aggiornamenti, in un server Windows 2008 R2 virtualizzato.

Avevamo aspettato un po' di tempo poichè il server in questione fornisce più di un servizio e non si voleva interrompere l'attività lavorativa.

Ho quindi pensato di effettuare il reboot con calma la domenica mattina, quando il riavvio non avrebbe disturbato nessuno. Mi sono collegato in VPN da casa, lanciato il reboot e poi ho atteso che la macchina tornasse in linea per attivare alcuni servizi.

Attendi, attendi, attendi.... la macchina non torna in linea!

Mi collego quindi alla console da Vmware e scopro che il sistema entra in un loop di riavvii che non si ferma.

Prima viene questa schermata


poi questa


e dopo qualche secondo il sistema si riavvia di nuovo.

Chiaramente anche tutti i tentativi di avvio in "Modalità provvisoria", "ultima configurazione valida" o altro terminavano nello stesso modo.

Dopo non poche imprecazioni mi sono messo con calma a cercare qualche how-to in Internet per risolvere il problema.

Pensando che la situazione fosse legata ad uno degli ultimi aggiornamenti caricati ho cercato il modo di disabilitare la loro installazione.

Qui il suggerimento di come rimuovere gli aggiornamenti in stato pending.

per arrivare alla console questa la sequenza di schermate, premere F8 al boot





comandi:

dism /image:e:\ /get-packages > dism.log

dism /image:e:\ /remove-package /packagename:<nome pacchetto> /norestart

Nota: il disco di sistema di Windows viene mappato come E: (in un restore da copia di backup l'ho invece trovato su D:)

qui l'esecuzione del comando


Nota: sono passato attraverso una lista editata con Notepad in modo da poter copiare il nome dell'aggiornamento e incollare nella finestra della command line poichè la console virtuale di Vmware con consente il CTRL+C e CTRL+V.

Nota2: per utilizzare il copia incolla in una finestra console premere ALT+SPAZIO, si apre il menu in alto a six ed è possibile incollare quello che si ha negli appunti.

Ho fatto la stessa operazione per diversi aggiornamenti e, mano a mano, ne risultavano sempre altri in stato pending, ma nessuno risolveva il problema.

Ho cercato quindi altri How-to ed ho trovato chi consigliava di rinominare il file TrustedInstaller.exe, qui il comando:


In effetti questo risolveva in parte il problema poichè si arrivava alla pagina di login con CTRL+ALT+CANC, si riusciva a fare anche il login, ma dopo qualche secondo il sistema si riavviava di nuovo.

Alla fine mi sono arreso e ho tentato di ripartire da una copia di backup, ma anche qui ho avuto delle sorprese.

Il Restore del backup di una settimana prima presenta lo stesso problema.
Il Restore del backup di due settimane prima presenta lo stesso problema.
Il Restore del backup di tre settimane prima presenta lo stesso problema.

....PANICO!

Alla fine l'unico sistema che portava a termine l'avvio in modo corretto era un salvataggio di inizio settembre.

Forse l'anomalia non era nata da aggiornamenti ma da altre cause!

Vabbè, oramai ero arrivato a domenica sera e mi sono detto: il server, tra gli altri servizi, distribuiva le licenze CAD 3D, lo lascio in linea in modo che i progettisti lavorino e domani (lunedì) con calma vedo di pensare agli altri servizi.

Tra gli altri servizi ce n'erano alcuni che lavoravano su file di testo e che quindi sono stati recuperati dai backup di Veeam, ma c'era una applicazione che lavorava con un database SQL Express.

Il lunedì ho anche chiesto alla società che segue i nostri sistemi di fare dei tentativi per recuperare la macchina, ma alla fine si sono arresi anche loro.

Con Vmware è stato comunque possibile lasciare in linea la copia vecchia di inizio settembre e fare dei test con la macchina ultima versione, ma che però non si avviava.

Tra i vari tentativi (e comunque lasciando rinominato il file TrustedInstaller.exe) ho visto che, scegliendo questa opzione all'avvio


il sistema riusciva ad avviarsi (stranamente in modalità grafica), si poteva fare il login e sono riuscito a effettuare un backup da SQL Express e a esportare il file.

Per cui sono riuscito a recuperare un file consistente di tutto il database.

Adesso abbiamo migrato tutti i servizi su un Windows server 2016.



Nessun commento:

Posta un commento