Share via


Dépannage de clusters de basculement

Cette rubrique aborde les sujets suivants :

  • Étapes de dépannage de base

  • Récupération à partir d'une défaillance de cluster de basculement

  • Résolution des principaux problèmes de gestion de clusters de basculement

  • Utilisation de procédures stockées étendues et d'objets COM

Étapes de dépannage de base

Lorsque vous utilisez le clustering de basculement de SQL Server, gardez à l'esprit que le cluster de serveurs comprend une instance de clustering de basculement qui s'exécute sous Microsoft Cluster Services (MSCS). L'instance SQL Server peut être hébergée par des nœuds Microsoft MSCS qui fournissent le cluster de serveurs Microsoft.

Si les nœuds qui hébergent le cluster de serveurs connaissent des problèmes, ceux-ci peuvent se répercuter sur votre instance de cluster de basculement. Pour analyser et résoudre ces problèmes, dépannez un cluster de basculement SQL Server comme suit :

  1. Matériel : passez en revue les journaux des événements système Microsoft Windows.

  2. Système d'exploitation : examinez les journaux des événements d'application et des événements système Windows.

  3. Réseau : examinez les journaux des événements d'application et des événements système Windows. Pour vérifier la configuration actuelle, consultez l'article de la Base de connaissances Configuration de carte réseau privée recommandée sur un cluster de serveurs.

  4. Sécurité : examinez les journaux des événements d'applications et de sécurité Windows.

  5. MSCS : examinez les journaux de cluster, des événements d'application et des événements système Windows.

  6. SQL Server : effectuez un dépannage normal après avoir vérifié qu'aucun problème n'affecte les paramètres fondamentaux du matériel, du système d'exploitation, du réseau, de la sécurité et de MSCS.

Récupération à partir d'une défaillance de cluster de basculement

Généralement, une défaillance de cluster de basculement est due à l'une des deux causes suivantes :

  • Défaillance matérielle dans un nœud d'un cluster composé de deux nœuds. Cette erreur peut être due à une défaillance de la carte SCSI ou du système d'exploitation.

    Pour effectuer une récupération à partir de cette défaillance, supprimez le nœud défaillant du cluster de basculement à l'aide du programme d'installation de SQL Server, mettez l'ordinateur hors connexion et résolvez la défaillance matérielle, puis réinstallez l'ordinateur et ajoutez le nœud réparé à l'instance de cluster de basculement.

    Pour plus d'informations, consultez Procédure : créer un cluster de basculement SQL Server (programme d'installation) et Procédure : récupérer d'une défaillance de cluster de basculement dans le scénario 1.

  • Échec du système d'exploitation. Dans ce cas, le nœud est hors ligne, mais il n'est pas rompu de manière irrémédiable.

    Pour effectuer une récupération à partir d'une défaillance du système d'exploitation, récupérez le nœud et testez le basculement. Si l'instance SQL Server ne bascule pas correctement, vous devez utiliser le programme d'installation de SQL Server pour supprimer SQL Server du cluster de basculement, effectuer les réparations nécessaires, réinstaller l'ordinateur, puis ajouter le nœud réparé à l'instance de cluster de basculement.

    Ce type de récupération à partir d'une défaillance du système d'exploitation peut prendre du temps. Si l'échec du système d'exploitation peut être facilement récupéré, évitez toutefois d'utiliser cette technique.

    Pour plus d'informations, consultez Procédure : créer un cluster de basculement SQL Server (programme d'installation) et Procédure : récupérer d'une défaillance de cluster de basculement dans le scénario 2.

Résolution des problèmes courants

La liste ci-dessous décrit les problèmes d'utilisation les plus courants et explique comment les résoudre.

Problème : utilisation incorrecte de la syntaxe d'invite de commandes pour installer SQL Server

Erreur 1 : Il est difficile de diagnostiquer les erreurs du programme d'installation lorsque vous utilisez le commutateur /qn à partir de l'invite de commandes, dans la mesure où celui-ci supprime toutes les boîtes de dialogue et les messages d'erreur du programme d'installation. Si le commutateur /qn est spécifié, tous les messages d'installation, y compris les messages d'erreur, sont écrits dans les fichiers journaux de l'installation. Pour plus d'informations sur les fichiers journaux, consultez Procédure : afficher et lire les fichiers journaux d'installation de SQL Server.

Solution 1 : utilisez le commutateur /qb à la place du commutateur /qn. Si vous utilisez le commutateur /qb, l'interface utilisateur de base s'affichera à chaque étape, ainsi que les messages d'erreur.

Problème : SQL Server ne peut pas se connecter au réseau après avoir fait l'objet d'une migration vers un autre nœud

Erreur 1 : les comptes de service SQL Server ne sont pas en mesure de contacter un contrôleur de domaine.

Solution 1 : dans les journaux d'événements, recherchez des signes indiquant l'existence de problèmes réseau, tels que des défaillances de carte ou des problèmes affectant le service DNS. Vérifiez que vous pouvez exécuter une commande ping sur le contrôleur de domaine.

Erreur 2 : les mots de passe des comptes de service SQL Server ne sont pas identiques sur tous les nœuds du cluster ou le nœud ne redémarre pas un service SQL Server qui a fait l'objet d'une migration depuis un nœud défaillant.

Solution 2 : modifiez les mots de passe des comptes de service SQL Server à l'aide du Gestionnaire de configuration SQL Server. Si vous n'effectuez pas cette opération et que vous modifiez les mots de passe des comptes de service SQL Server sur un nœud, vous devez également modifier les mots de passe sur tous les autres nœuds. Le Gestionnaire de configuration de SQL Server effectue cette opération automatiquement.

Problème : SQL Server ne peut pas accéder aux disques organisés en clusters

Erreur 1 : les microprogrammes ou les pilotes ne sont pas mis à jour sur tous les nœuds.

Solution 1 : vérifiez que tous les nœuds utilisent les versions adéquates des microprogrammes et les mêmes versions des pilotes.

Erreur 2 : un nœud ne peut pas récupérer des disques de clusters qui ont fait l'objet d'une migration depuis un nœud ayant échoué sur un disque de clusters partagés utilisant une lettre de lecteur différente.

Solution 2 : les lettres de lecteur de disque pour les disques de clusters doivent être identiques sur les deux serveurs. Si ce n'est pas le cas, examinez l'installation d'origine du système d'exploitation et MSCS (Microsoft Cluster Service).

Problème : la défaillance d'un service SQL Server provoque un basculement

Solution : pour empêcher que la défaillance de services spécifiques provoque le basculement du groupe SQL Server, configurez ces services à l'aide de l'Administrateur de cluster dans Windows, comme suit :

  • Désactivez la case à cocher Affecter le groupe sur l'onglet Avancé de la boîte de dialogue Propriétés de texte intégral. Cependant, si SQL Server provoque un basculement, le service de recherche en texte intégral redémarre.

Problème : SQL Server ne démarre pas automatiquement.

Solution : utilisez l'Administrateur de cluster dans MSCS. Le service SQL Server doit être paramétré de manière à démarrer manuellement ; l'Administrateur de cluster doit être configuré dans MSCS de façon à démarrer le service SQL Server. Pour plus d'informations, consultez Gestion des services.

Problème : le nom de réseau est hors connexion et vous ne pouvez pas vous connecter à SQL Server avec TCP/IP

Erreur 1 : le service DNS a échoué à cause d'une ressource cluster définie de façon à requérir ce service.

Solution 1 : remédiez aux problèmes DNS.

Erreur 2 : un nom en double existe sur le réseau.

Solution 2 : utilisez NBTSTAT pour rechercher le nom en double, puis résolvez le problème.

**Erreur 3 :**SQL Server ne se connecte pas à l'aide de canaux nommés.

Solution 3 : pour vous connecter à l'aide de canaux nommés, créez un alias avec le Gestionnaire de configuration de SQL Server pour vous connecter à l'ordinateur approprié. Par exemple, si vous disposez d'un cluster à deux nœuds (Node A et Node B) et d'une instance de cluster de basculement (Virtsql) avec une instance par défaut, vous pouvez vous connecter au serveur dont la ressource de nom réseau est hors connexion, en procédant comme suit :

  1. Déterminez le nœud sur lequel s'exécute le groupe contenant l'instance de SQL Server, à l'aide de l'Administrateur de cluster. Dans cet exemple, il s'agit de Node A.

  2. Démarrez le service SQL Server sur cet ordinateur à l'aide de net start. Pour plus d'informations sur l'utilisation de net start, consultez Démarrage manuel de SQL Server.

  3. Démarrez le Gestionnaire de configuration SQL Server SQL Server sur Node A. Examinez le nom du canal sur lequel le serveur est à l'écoute. Il doit être similaire à \\.\$$\VIRTSQL\canal\sql\query.

  4. Sur l'ordinateur client, démarrez le Gestionnaire de configuration SQL Server.

  5. Créez un alias SQLTEST1 pour vous connecter à ce nom de canal via les canaux nommés. Pour cela, entrez Node A comme nom de serveur et modifiez le nom du canal de la manière suivante : \\.\canal\$$\VIRTSQL\sql\query.

  6. Connectez-vous à cette instance à l'aide de l'alias SQLTEST1 comme nom de serveur.

Problème : le programme d'installation de SQL Server échoue sur un cluster avec l'erreur 11001

Erreur : une clé de Registre orpheline dans [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL.X\Cluster]

Solution : assurez-vous que la ruche du Registre MSSQL.X n'est pas en cours d'utilisation, puis supprimez la clé de cluster.

Problème : erreur d'installation de cluster : « Le programme d'installation ne dispose pas des privilèges suffisants pour accéder au répertoire : <lecteur>\Microsoft SQL Server. Impossible de poursuivre l'installation. Ouvrez une session en tant qu'administrateur ou contactez votre administrateur système. »

Erreur : cette erreur est due à un lecteur partagé SCSI mal partitionné.

Solution : recréez une partition unique sur le disque partagé, comme suit :

  1. Supprimez la ressource disque du cluster.

  2. Supprimez toutes les partitions du disque.

  3. Dans les propriétés du disque, vérifiez que celui-ci est un disque de base.

  4. Créez une partition sur le disque partagé, formatez-le, puis affectez-lui une lettre de lecteur.

  5. Ajoutez le disque au cluster à l'aide de l'Administrateur de cluster (cluadmin).

  6. Exécutez le programme d'installation de SQL Server.

Problème : les applications ne parviennent pas à inscrire les ressources SQL Server dans une transaction distribuée

Erreur : comme Microsoft Distributed Transaction Coordinator (MS DTC) n'est pas complètement configuré dans Windows, les applications peuvent échouer dans leur tentative d'inscription des ressources SQL Server dans une transaction distribuée. Ce problème peut affecter les serveurs liés, les requêtes distribuées et les procédures stockées distantes qui utilisent des transactions distribuées. Pour plus d'informations sur la façon de configurer MS DTC, consultez Avant l'installation du clustering de basculement.

Solution : pour éviter ce type de problème, vous devez activer intégralement les services MS DTC sur les serveurs où SQL Server est installé et MS DTC est configuré.

Pour activer correctement MS DTC, procédez comme suit :

  1. Dans le Panneau de configuration, ouvrez Outils d'administration, puis Gestion de l'ordinateur.

  2. Dans le volet gauche de Gestion de l'ordinateur, développez Services et applications, puis cliquez sur Services.

  3. Dans le volet droit de Gestion de l'ordinateur, cliquez avec le bouton droit sur Distributed Transaction Coordinator, puis sélectionnez Propriétés.

  4. Dans la fenêtre Coordinateur de transactions distribuées, cliquez sur l'onglet Général, puis sur Arrêter pour arrêter le service.

  5. Dans la fenêtre Coordinateur de transactions distribuées, cliquez sur l'onglet Ouverture de session, puis définissez le compte d'ouverture de session NT AUTHORITY\NetworkService.

  6. Cliquez sur Appliquer, puis sur OK pour fermer la fenêtre Coordinateur de transactions distribuées. Fermez la fenêtre Gestion de l'ordinateur. Fermez la fenêtre Outils d'administration.

Utilisation de procédures stockées étendues et d'objets COM

Lorsque vous utilisez des procédures stockées étendues avec une configuration de clustering de basculement, toutes les procédures stockées étendues doivent être installées sur un disque de cluster dépendant de SQL Server. Ceci permet d'assurer que lors du basculement d'un nœud, les procédures stockées étendues peuvent toujours être utilisées.

Si les procédures stockées étendues utilisent des composants COM, l'administrateur doit enregistrer les composants COM sur chaque nœud du cluster. Les informations pour le chargement et l'exécution des composants COM doivent figurer dans le Registre du nœud actif, afin que les composants soient créés. Dans le cas contraire, les informations sont conservées dans le Registre de l'ordinateur sur lequel les composants COM ont été enregistrés en premier lieu.