Procedura di ripristino della replica continua cluster

 

Si applica a: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

Ultima modifica dell'argomento: 2007-10-29

La replica continua cluster fornisce la ridondanza completa sia dei dati che dei servizi che consentono di accedere ai dati. La ridondanza completa consente il ripristino rapido nei casi in cui quest'ultimo non fosse possibile a causa di una copia condivisa dei dati delle cassette postali.

La procedura di ripristino della replica continua locale può essere suddivisa in due tipi di interruzioni:

  • Interruzioni pianificate   Le interruzioni pianificate sono avviate dall'amministratore. È possibile utilizzare un'interruzione pianificata per eseguire il ripristino a causa di un errore rilevato dal sistema di monitoraggio o per eseguire attività amministrative, come la manutenzione hardware, l'installazione di prodotti software o aggiornamenti dei programmi software.

  • Interruzioni non pianificate   Le interruzioni non pianificate vengono avviate dal sistema come azione di ripristino per un errore rilevato. Queste interruzioni vengono rilevate e il loro ripristino è attivato dal Servizio cluster di Windows.

Nella seguente tabella vengono descritte le azioni di ripristino previste per diversi tipi di errore. Alcuni errori richiedono l'avvio del ripristino da parte dell'amministratore, mentre altri vengono gestiti automaticamente dalla soluzione di clustering di Exchange.

Azioni di recupero da errore

Descrizione Azione Commenti

Errore di arresto del sistema operativo, il sistema operativo rilevato non risponde più, interruzione completa dell'alimentazione di un nodo, errore irreversibile nel chip del processore, della scheda madre, della piastra base o interruzione completa della comunicazione per un nodo

Failover automatico al nodo passivo, se disponibile. L'amministratore ha inoltre la possibilità di imporre il montaggio automatico indipendentemente dalla perdita dei dati se il ripristino non è avvenuto entro il periodo di tempo specificato. Se dopo il failover non viene montatno alcun database e il nodo attivo originale torna di nuovo in linea, con tutto il materiale archiviato in stato operativo, vengono copiati i registri mancanti e i database vengono installati automaticamente.

Affinché il nodo passivo sia disponibile, deve essere possibile stabilire un quorum dopo il malfunzionamento. Ciò significa che il nodo restante deve essere in grado di accedere al quorum di condivisione dei file. In alternativa, la maggior parte dei nodi nel cluster deve essere operativa e in grado di comunicare reciprocamente.

Errore totale di archiviazione sul server attivo

Errori di archiviazione segnalati tramite il sistema di monitoraggio. L'amministratore può ripristinare i dati archiviati o avviare l'interruzioni pianificata per il nodo passivo.

Questo errore viene segnalato come errore di tutti i database.

Errore del centro dati

Se si verifica un errore del nodo attivo nel centro dati primario, si verifica il failover automatico del server di cassette postali in cluster al nodo passivo nel secondo centro dati.

Per poter continuare a fornire l'accesso alla posta, è necessario ripristinare altri servizi di elenchi in linea, servizi di rete e server Exchange. I dati della posta saranno disponibili e aggiornati entro pochi minuti.

Errore nell'unità del sistema operativo

Nessuna azione di ripristino automatico. Non rilevato da Exchange a meno che non si verifichi un errore del sistema operativo. Rilevato in base all'evidenza degli errori e non in base alla causa principale.

L'errore nell'unità del sistema operativo viene segnalato dai servizi di monitoraggio del sistema operativo e può causare danni al sistema operativo.

Spazio insufficiente sull'unità del sistema operativo

Failover automatico nel nodo passivo, se disponibile.

La segnalazione di questo tipo di errore avviene tramite i servizi di monitoraggio. Se il ripristino automatico non viene eseguito o non può essere eseguito, l'azione di ripristino per questo scenario è determinata dall'amministratore.

Errore grave nella rete pubblica del cluster

Nessuna azione di ripristino automatico.

Se la rete pubblica viene perduta, lo stato delle risorse indirizzo IP diventa Non riuscito. Dopo che è stato risolto il problema della rete pubblica, è possibile riportare in linea le risorse.

Perdita di quorum del cluster

Server di cassette postali in cluster e quorum del cluster non in linea.

Questo scenario determinerà la mancanza di servizi se non è possibile costituire un quorum.

Errore dell'Archivio informazioni

Riavvio automatico della risorsa Archivio informazioni. Se l'errore della risorsa Archivio informazioni si verifica durante il riavvio, viene attivato un failover.

Dopo ripetuti errori, l'amministratore può tentare di spostare manualmente nel nodo passivo il server di cassette postali in cluster nel tentativo di riportarlo in linea.

Errore nell'unità dell'applicazione (file binari)

Nessuna azione di ripristino automatico.

In genere questo scenario darà luogo ad altri errori che vengono segnalati tramite i servizi di monitoraggio e vengono avviati dall'amministratore. L'azione di ripristino per questo scenario è determinata dall'amministratore.

Spazio insufficiente sull'unità dell'applicazione (file binari)

Nessuna azione di ripristino automatico.

La segnalazione avviene tramite i servizi di monitoraggio. L'azione di ripristino per questo scenario è determinata dall'amministratore.

Perdita completa del database o del gruppo di archiviazione o errore grave del database

Tentativo automatico di rimontare i database interessati. Se il tentativo non riesce, lo stato del database rimane Non riuscito ma non si verifica alcun failover dei server di cassette postali in cluster.

Il gruppo di archiviazione o il database vengono smontati a causa di un errore o di un danneggiamento software oppure il problema è dovuto a un errore dell'hardware. Ad esempio, un gruppo di archiviazione esegue uno smontaggio forzato di tutti i database quando la directory dei registri non è disponibile. L'amministratore determina l'azione correttiva.

Errore parziale del gruppo di archiviazione o del database, non disponibilità di alcuni dati o errore iniziale di montaggio del database

Nessuna azione di ripristino automatico.

Errore parziale significa che è stato rilevato un danneggiamento, tuttavia la gravità non è tale da imporre lo smontaggio del gruppo di archiviazione o del database. Se il database non viene montato all'avvio, non verrà intrapresa alcuna azione e l'errore viene segnalato dal monitoraggio. Il server Cassette postali genera gli eventi quando vengono rilevati e tali eventi possono essere segnalati dai servizi di monitoraggio. Il monitoraggio, inoltre, rileverà e segnalerà i database smontati.

Danneggiamento del registro rilevato per il gruppo di archiviazione

Nessuna azione di ripristino automatico. La copia è danneggiata ed è necessario effettuare nuovamente il seeding.

Il servizio di monitoraggio segnala questa condizione.

Spazio insufficiente sull'unità dei database o del registro delle transazioni

Nessuna azione di ripristino automatico. I database del gruppo di archiviazione verranno smontati.

La mancanza di spazio libero sull'unità viene segnalata tramite il sistema di monitoraggio. L'amministratore determina l'azione correttiva.

L'amministratore dispone del controllo di configurazione per il ripristino di errori da interruzione non pianificata. Per ulteriori informazioni sulle interruzioni pianificate e non pianificate, vedere Interruzioni pianificate e non pianificate.