Configuration d’un Cluster de Basculement pour Windows HPC Server 2008

 


Article par Barnabé BALP (MSP)

Barnabé BALP est étudiant à Ingésup (Toulouse), école d’experts en informatique. Il affectionne particulièrement le développement d’applications, les sciences et plus particulièrement le calcul intensif (Cluster de calcul, Grid Computing, MPI, OpenMP, CUDA, OpenCL, DirectCompute, etc.).

Jeune auto entrepreneur, Barnabé est également très intéressé par les technologies Microsoft en général et en particulier par Visual Studio pour le développement et Windows HPC Server.

Vous trouverez ci-dessous le début de l’article, n’hésitez pas à télécharger la suite directement en format pdf


Sommaire de l'article

  • Vue d’ensemble et configuration requise pour Windows HPC Server 2008 dans un Cluster de Basculement
    • Vue d'ensemble
    • Configuration système requise
    • Compte de domaine
    • Infrastructure Réseau
    • Windows HPC Server 2008 dans un Cluster de Basculement

Ce document est une traduction de celui publié par Microsoft sur leur site Microsoft TechNet « Configuring Failover Clustering in Windows HPC Server 2008 Step-by-Step Guide », avec toutefois en plus des captures d’écran pour illustrer les manipulations décrites.

Ce document fournit les procédures et des conseils pour le déploiement de Windows HPC Server 2008 dans un cluster de basculement composé de serveurs fonctionnant sous Windows Server 2008.

Si vous désirez la haute disponibilité pour votre service de planification des jobs (HPC Job Scheduler Service), vous pouvez configurer votre nœud principal pour qu’il fasse partie d’un cluster de basculement composé de deux serveurs fonctionnant ensembles. Un disfonctionnement survenant sur le serveur agissant en tant que nœud principal provoquera alors le basculement automatique de vos services vers l’autre serveur pour le remplacer. C’est ce qu’on appelle le processus failover (basculement). Grâce à ce processus, même si une interruption survient sur le nœud principal, les jobs peuvent continuer à s’exécuter ou à être soumis au cluster de calcul.

Mettre en place un cluster de basculement permet d’augmenter la disponibilité de votre nœud principal que ce soit pour des interruptions planifiés ou non.

  • Les interruptions non planifiés : Si un disfonctionnement survient sur une ressource matérielle ou logicielle de votre serveur agissant en tant que nœud principal, une brève interruption de service aura lieu. En effet, cette interruption correspond au basculement des services du nœud principal vers l’autre serveur du cluster de basculement. C’est le processus failover, pendant lequel les services sont arrêtés puisqu’en train d’être relancer sur l’autre serveur. Grâce à ce processus, vous pourrez réparer votre serveur, pendant qu’un autre assure temporairement sa fonction.
  • Les interruptions planifiés : Vous ne désirez certainement pas interrompre tout votre cluster de calcul pour une simple opération de maintenance sur votre nœud principal (par exemple : installer un service pack, une mise à jour ou remplacer du matériel). Si votre nœud principal fait partie d’un cluster de basculement, un autre serveur peut alors continuer de gérer les nouveaux jobs ou ceux déjà en exécution pendant que vous faites vos opérations de maintenance.

Les noms qui sont utilisé pour faire référence à la solution de calcul haute performance (HPC) de Microsoft et ses composants ont changé pour cette version du produit. Les changements sont les suivants :

  • Windows Server 2008 HPC Edition a remplacé Windows Server 2003 Compute Cluster Edition.
  • Windows HPC Server 2008 a remplacé Windows Compute Cluster Server 2003.
  • Microsoft HPC Pack 2008 a remplacé MicrosoftComputeCluster Pack 2003.

Avant de commencer …

Cette section liste les autres documents à consulter avant de commencer votre déploiement.

**Important :****Avant de commencer votre déploiement, consulter les Release Notes pour Windows HPC Server 2008.

Il est recommandé de vous familiariser avec les logiciels utilisés dans ce document. Pour cela, vous pouvez consulter les différentes documentations qui vous sont proposées dans l’ordre suivant : 

Les logiciels utilisés dans ce document Documentation à consulter

Windows HPC Server 2008.

Il vous est recommandé avant d’essayer de suivre ce guide de créer votre propre cluster Windows HPC Server 2008 (nœud principal et nœuds de calcul) sans l’intégration d’un cluster de basculement. C’est-à-dire avec un unique nœud principal. Ainsi, vous pourrez vous assurer d’avoir bien compris comment configurer l’environnement matériel et logiciel nécessaire pour Windows HPC Server 2008.

Windows HPC Server 2008 Getting Started Guide.

(https://go.microsoft.com/fwlink/?LinkId=121228)

Ou en français : Déploiement et configuration d’une infrastructure Windows HPC Server 2008.

(https://technet.microsoft.com/fr-fr/hpc/ff823717.aspx

La fonctionnalité « Clustering avec basculement » (Failover Clustering) pour Windows Server 2008.

Lorsque vous aurez compris les bases de Windows HPC Server 2008, il vous est recommandé de créer un cluster de basculement composé de deux serveurs sans applications ou services mis en cluster. Cela vous permettra de vous familiariser avec la fonctionnalité cluster de basculement Windows (Failover Clustering).

Configuring a Two-Node File Server Failover Cluster in Windows Server 2008 Step-by-Step Guide.

(https://go.microsoft.com/fwlink/?LinkId=86167)

Installation de SQL Server 2005 Service Pack 2 pour un cluster de basculement.

Il vous est recommandé de revoir les informations relatives à la création d’un cluster de basculement SQL Server 2005 pour vous familiariser avec ce processus qui fait partie également de ce guide.

How to: Create a New SQL Server 2005 Failover Cluster. (Setup)(https://go.microsoft.com/fwlink/?LinkId=121035)

Les sections de ce guide …

Ce guide contient les sections suivantes :

  • Vue d’ensemble et configuration requise pour Windows HPC Server 2008 dans un Cluster de Basculement.
  • Etapes de configuration de Windows HPC Server 2008 dans un Cluster de Basculement.
  • Gestion de Windows HPC Server 2008 dans un Cluster de Basculement.
  • Ressources supplémentaires relatives à Windows HPC Server 2008 dans un Cluster de Basculement.

 

I. Vue densemble et configuration requise pour Windows HPC Server 2008 dans un Cluster de Basculement

Dans cette section

  • Vue d’ensemble.
  • Configuration système requise.
  • Compte de domaine.
  • Infrastructure réseau.
  • Windows HPC Server 2008 dans un Cluster de Basculement.

 

Vue d'ensemble

Si vous désirez la haute disponibilité pour  votre service de planification des jobs (HPC Job Scheduler Service), vous pouvez configurer votre nœud principal (Head Node) pour qu’il fasse partie d’un cluster de basculement (cluster failover) composé de deux serveurs fonctionnant ensembles. Un disfonctionnement survenant sur le serveur agissant en tant que nœud principal provoquera le basculement automatique de vos services vers l’autre serveur du cluster de basculement. C’est ce qu’on appelle le processus failover (basculement).

**Important :****Dans ce document, le mot « cluster » peut faire référence au nœud principal et à l’ensemble des nœuds de calcul exécutant Windows HPC Server 2008 ou à un ensemble de serveurs exécutant Windows Server 2008 avec la fonctionnalité « Clustering avec basculement » (Failover Clustering). Le mot « nœud » peut faire référence à un nœud principal ou un nœud de calcul composant le cluster de calcul sous Windows HPC Server 2008, ou à un des serveurs du cluster de basculement. Dans ce document, les serveurs dans le contexte d'un cluster de basculement sont généralement appelées « serveurs », pour les distinguer d'un nœud principal ou d’un nœud de calcul.

Lorsque vous configurez votre nœud principal dans un cluster de basculement, chacun des serveurs du cluster doit avoir accès à l’espace de stockage réservé au cluster de basculement (Failover cluster storage). Cet espace contient le planificateur de jobs (HPC Job Scheduler) et les bases de données de gestion. Le service de planification des jobs (HPC Job Scheduler Service) s'exécute sur l’un des serveurs du cluster de basculement, mais si un problème survient, il peut « basculer » vers un autre serveur (appartenant au même cluster de basculement).

Le schéma suivant montre comment un cluster de basculement fonctionne avec Windows HPC Server 2008.

 

Configuration système requise

La configuration système requise pour suivre ce document est une combinaison des exigences pour les éléments suivants :

  • La fonctionnalité « Clustering avec basculement » (Failover Clustering) dans Windows Server 2008.
  • L’installation de SQL Server 2005 Service Pack 2 pour un Cluster de Basculement.
  • Windows HPC Server 2008.

Les sections suivantes fournissent davantage de détail concernant les configurations requises.

Configuration matérielle requise pour un cluster de basculement exécutant Windows HPC Server 2008

Vous avez besoin du matériel suivant pour un cluster de basculement exécutant Windows HPC Server 2008.

  • Deux serveurs compatibles avec Windows Server 2008 : Bien que la fonctionnalité « Clustering avec basculement » (Failover Clustering) pour Windows Server 2008 puisse fonctionner avec un maximum de huit serveurs, Windows HPC Server 2008 prend uniquement en charge une configuration de deux serveurs.

Il est recommandé d’utiliser un ensemble de machines ayant les mêmes composants.

Le tableau suivant liste la configuration matérielle requise pour l’installation d’un système Windows Server 2008 exécutant Windows HPC Server 2008 :

Configuration Mémoire Vive Processeur Espace Disque (Partition Système)
Minimum 512 MB 1 GHz (installation complète) 8 GB
Recommandé 1 GB (installation complète) 2 GHz (installation complète) 40 GB (installation complète)

**Important :****Microsoft fournit un support pour sa solution de cluster de basculement uniquement si tous les composants matériels sont marqués comme « Certifié pour Windows Server 2008 ». En outre, la configuration complète (serveurs, réseaux et espace de stockage) doit passer tous les tests de « **l’Assistant de validation de configuration *» (Validate a Configuration Wizard) *qui est inclus dans le composant logiciel enfichable « Gestion du cluster de basculement » (Failover Cluster Management snap-in).

Pour plus d'informations sur la compatibilité de votre matériel avec Windows Server 2008, consultez le Windows Server Catalog (https://go.microsoft.com/fwlink/?LinkID=59821).

Pour plus d'informations sur le nombre maximum de serveurs que vous pouvez avoir dans un cluster de basculement, consultez Compare Technical Features and Specifications (https://go.microsoft.com/fwlink/?LinkId=92091).

  • Des cartes réseaux et des câbles (pour la communication réseau failover) : le matériel réseau, comme d'autres composants de la solution de cluster de basculement, doit être compatible avec Windows Server 2008. Si vous utilisez iSCSI, vos cartes réseau doivent être dédiées à la communication réseau ou iSCSI, pas les deux.

 

**Important :****Vous devez utiliser plusieurs réseaux distincts pour relier les serveurs du cluster de basculement, afin d'éviter les points individuels de défaillance (single point of failure). C'est un point important car la charge sur le réseau reliant le nœud principal aux nœuds de calcul peut être élevée, particulièrement lorsque que le cluster de calcul est en plein fonctionnement.

Pour Windows HPC Server 2008, seul la topologie 5 (qui est public uniquement) n'est pas prise en charge pour le scénario d’un cluster de basculement. Pour plus d'informations, reportez-vous à la section « Infrastructure réseau », plus loin dans cette section.

Notez que si vous connectez les serveurs du cluster de basculement à l'aide d'un seul réseau, le réseau passera le test d'exigence de redondance dans « l’Assistant de validation de configuration » (Validate a Configuration Wizard). Toutefois, le rapport de « l'Assistant de configuration du cluster de basculement » (Failover Cluster Setup Wizard) vous avertira que le réseau ne doit pas avoir de points individuels de défaillance.

Pour plus de détails sur la configuration réseau nécessaire pour un cluster de basculement Windows Server 2008, reportez-vous à la section « Network infrastructure and domain account requirements for a two-node failover cluster » dans « Failover Cluster Step-by-Step Guide: Configuring a Two-Node File Server Failover Cluster » (https://go.microsoft.com/fwlink/?LinkId=86167).

  • Contrôleurs de périphérique ou cartes appropriées pour le stockage :

    • Pour « Serial Attached SCSI » ou « Fibre Channel » : Si vous utilisez « Serial Attached SCSI » (SAS) ou « Fibre Channel », pour tous vos serveurs en cluster, alors tous les composants de la pile de stockage doivent être identiques. Il est nécessaire que les logiciels d’entrées/sorties à chemins d’accès multiples (basé sur « Microsoft Multipath I/O » ou MPIO) et les « **Device Specific Module **» (DSM) soient identiques. Il est recommandé que les contrôleurs de périphérique de stockage de masse (les « Host Bus Adapter » (HBA), les pilotes HBA et firmware HBA) qui sont reliés à l’espace de stockage réservé du cluster soient identiques eux aussi. Si vous utilisez différents HBA, vous devez vérifier auprès de votre fournisseur que vous observez les bonnes pratiques.
      *Note :***Avec Windows Server 2008, vous ne pouvez pas utiliser de SCSI parallèle pour connecter vos espaces de stockage sur les serveurs du cluster de basculement.
    • Pour iSCSI : Si vous utilisez un périphérique iSCSI, chaque serveur dans le cluster de basculement doit avoir une ou plusieurs cartes réseau ou des adaptateurs de bus hôte dédiés à l’espace de stockage du cluster. Le réseau que vous utilisez pour iSCSI ne peut pas être utilisé pour la communication réseau. Les cartes réseau que vous utilisez pour vous connecter à la cible de stockage iSCSI doivent être identiques, et il est recommandé d'utiliser du Gigabit Ethernet ou une connexion plus rapide. Pour iSCSI, vous ne pouvez pas utiliser les cartes réseau associées, car elles ne sont pas prises en charge avec iSCSI. Pour plus d'informations sur iSCSI, consultez iSCSI Cluster Support: FAQ (https://go.microsoft.com/fwlink/?LinkId=61375).
  • Stockage : Vous devez utiliser un espace de stockage partagé qui soit compatible avec Windows Server 2008. Cet espace de stockage doit contenir au moins deux volumes distincts (unités logiques) configurés au niveau matériel. L’un des volumes fonctionne en tant que disque témoin (décrit dans le paragraphe suivant). L’autre volume contient les fichiers requis par le nœud principal du cluster de basculement. Les besoins en stockage sont les suivants :

    • Pour utiliser la prise en charge native de disques inclus dans le cluster de basculement, utiliser des disques de base, pas de disques dynamiques.

    • Il est recommandé de formater les partitions NTFS (NTFS est obligatoire pour le disque témoin).

    • Pour la partition du disque, vous pouvez utiliser un « master boot record » (MBR) ou une table de partition GUID (GPT).

      Le disque témoin (witness disk) est un disque de l’espace de stockage réservé du cluster de basculement que vous avez désigné pour contenir une copie de la base de données de configuration du cluster de basculement lui-même. (Un disque témoin fait partie de certaines configurations de quorums, mais pas toutes) Pour Windows HPC Server 2008, la configuration du quorum est « Nœud et disque majoritaires » (Node and Disk Majority**)**, c'est la valeur par défaut pour un cluster de basculement avec un nombre pair de serveurs. « Nœud et disque majoritaires » (Node and Disk Majority) signifie que les serveurs du cluster de basculement ainsi que le disque témoin contiennent des copies de la configuration du cluster de basculement, et qu’un cluster de basculement peut fonctionner (ou « atteindre le quorum ») tant qu'une majorité de ces copies (deux des trois) est disponible.

Configuration logicielle requise pour un cluster de basculement exécutant Windows HPC Server 2008

Pour configurer votre nœud principal sur un cluster de basculement, vous devez installer Windows Server 2008 Enterprise ou Windows Server 2008 Datacenter. Par ailleurs, Windows HPC Server 2008 ne prend en charge que l’architecture 64 bit, donc tous les serveurs doivent exécuter la même version d’un système d'exploitation 64 bit.Tous les serveurs doivent également avoir les mêmes mises à jour de sécurité et les mêmes services packs.

Chaque serveur dans le cluster de basculement nécessite également SQL Server 2005 Standard Service Pack 2 nécessaire pour le planificateur de jobs (HPC Job Scheduler) et les bases de données du service de gestion (Job Scheduling and Management Service).

Le nœud principal ne peut pas servir de nœud de calcul ou de nœud WCF (Windows Communication Foundation) broker.

Compte de domaine

Vous avez besoin des attributs de domaine suivants :

  • Rôle du domaine : Les deux serveurs du cluster de basculement doivent être dans le même domaine Active Directory. Aucun des serveurs dans le cluster de basculement ne doit obligatoirement assuré le rôle de contrôleur de domaine (pour maintenir un niveau de sécurité pour SQL Server 2005).
  • Compte pour l'administration du cluster de basculement : Lorsque vous créez un cluster de basculement et lorsque vous installez SQL Server 2005, vous devez être connecté au domaine avec un compte qui possède des droits d'administrateur et des autorisations sur les deux serveurs du cluster de basculement. Le compte n'a pas besoin d'être un compte d’administrateur du domaine, mais peut être un compte d'utilisateurs du domaine qui est dans le groupe Administrateurs sur les deux serveurs. Par ailleurs, si le compte n'est pas un compte d’administrateur du domaine, le compte (ou le groupe du compte) doit avoir l'autorisation pour « Créer des objets Ordinateur » (Create Computer Objects**)** dans le domaine.
  • Un groupe de sécurité du domaine pour installer SQL Server 2005 : Sur un cluster de basculement exécutant SQL Server 2005, les groupes de domaine qui sont communs à tous les nœuds du cluster sont utilisés pour contrôler l'accès aux clés de registre, fichiers, objets SQL Server et autres ressources du cluster. Toutes les autorisations d’accès aux ressources sont contrôlées par des groupes de domaine à niveau ayant pour membres les comptes des services SQL Server. Pour plus d'informations, reportez-vous à la section « Domain Groups for Clustered Services » (https://go.microsoft.com/fwlink/?LinkId=121041).
  • Un compte de service pour les services de SQL Server lors de l’installation SQL Server 2005 : Vous pouvez utiliser un seul compte pour tous les services. En tous les cas, tous les comptes de service de l’instance SQL Server doivent être des comptes du domaine. Pour plus d'informations, reportez-vous à la section « Service Account » (https://go.microsoft.com/fwlink/?LinkId=121044).

 

Infrastructure Réseau

Pour le scénario décrit dans ce guide, vous avez besoin de l'infrastructure réseau suivante :

  • Paramètres réseau et adresses IP : Pour la haute disponibilité, il est recommandé de suivre les étapes ci-dessous, parmi lesquelles vous devez choisir une adresse statique pour le réseau privé (réseau du cluster) afin de satisfaire les exigences du programme d'installation de SQL Server 2005. Une fois l'installation terminée, vous pouvez modifier la configuration de l’adresse IP, pour par exemple, modifier l'adresse statique pour une adresse fournie dynamiquement par DHCP (Dynamic Host Configuration Protocol) ou pour ajouter des adresses IP supplémentaires sur le réseau de l'entreprise.
  • Reportez-vous également à la section précédente de ce document « Configuration matérielle requise pour un cluster de basculement exécutant Windows HPC Server 2008 ».

Windows HPC Server 2008 prend en charge plusieurs topologies de réseau, qui sont conçus pour répondre à un large éventail de besoins de l'utilisateur et de performances, de mise à l'échelle (scaling) et d’exigences d’accès. Les topologies se distinguent par le nombre de réseaux auxquels le cluster est connecté et de quelle manière. Lorsqu'il est utilisé dans un cluster de basculement, Windows HPC Server 2008 prend en charge les quatre premières topologies définis dans le tableau suivant. Il ne supporte pas la topologie 5 (dite public uniquement).

Topologies Description
1 Les nœuds de calcul sont isolés sur un réseau privé.
2 Les nœuds de calcul sont sur un réseau public et sur un réseau privé.
3 Les nœuds de calcul sont isolés sur un réseau privé et sur un réseau d’application (MPI Network).
4 Les nœuds de calcul sont sur trois réseaux : public, privé et d’application (MPI Network).
5 Les nœuds de calcul sont sur un réseau public uniquement (pas supporté pour un cluster de basculement).

**Remarque :****Le réseau public correspond au réseau de l’entreprise. Le réseau privé correspond au réseau du cluster de calcul (sous Windows HPC Server 2008), dédié à la plupart des communications entre les nœuds du cluster. Le réseau d’application correspond quant à lui au réseau du cluster de calcul, dédié aux communications MPI des applications haute performance s’exécutant sur le cluster.

**Remarque :**Les sections suivantes de ce guide appelleront des exigences de configuration spécifiques pour la haute disponibilité de chacune des topologies précédentes. Pour plus d'informations sur la configuration du réseau et pour choisir une topologie de réseau, consultez « Déploiement et configuration d’une infrastructure Windows HPC Server 2008 » (https://technet.microsoft.com/fr-fr/hpc/ff823717.aspx).

 

Windows HPC Server 2008 dans un Cluster de Basculement

Cette section résume les différences entre l’exécution de votre nœud principal pour Windows HPC Server 2008 sur un seul serveur et son exécution dans un cluster de basculement.

  • Dans un cluster de basculement, le nœud principal ne peut être un nœud de calcul ou un nœud WCF broker. Ces options sont désactivées automatiquement dès que le nœud principal est configuré pour un cluster de basculement.
  • Parce que le nœud principal ne peut servir de nœud de calcul, il ne peut pas être mis en ligne. L’état du nœud principal reste hors ligne automatiquement dès que le nœud principal est configuré pour un cluster de basculement.

Les services et ressources durant le processus de basculement (failover)

Le tableau suivant résume ce qu’il se passe pour chaque service et ressource durant le processus de basculement (failover).

 

Service ou Ressource Que se passe-t-il durant le processus de basculement (failover).

Planificateur de Jobs

(Job Scheduler)

Basculement sur défaillance vers l’autre serveur du cluster de basculement.

 

Service de Gestion

(Management service)

Basculement sur défaillance vers l’autre serveur du cluster de basculement.

CCS managed file shares

(InstallShare, spoolDir)

Basculement sur défaillance des droits de propriété (donc droits d’accès) vers l’autre serveur du cluster de basculement.

Base de données de gestion

(Management Database)

Stocké sur un espace de stockage réservé au cluster de basculement, ce qui veut dire que cette base de données est accessible par les deux serveurs du cluster de basculement dès qu’ils en ont besoin.

Base de données du planificateur de jobs

(Job Scheduler Database)

Basculement sur défaillance des droits de propriété (donc droits d’accès) vers l’autre serveur du cluster de basculement.
NAT Est répliqué à travers l’Assistant de configuration réseau (Network Configuration Wizard) pour les topologies 1 et 3.
WDS Est répliqué.

Service de rapports

(Reporting service)

Ne bascule pas (failover non pris en charge)
DHCP Est répliqué (portée partitionnée par le biais de l'Assistant de configuration du réseau « Network Configuration Wizard »)

Partage de fichiers pour les nœuds de calcul

(File sharing)

Si configuré via le composant logiciel enfichable « Gestion de cluster de basculement » (Failover Cluster Management snap-in), bascule sur l'autre serveur du cluster de basculement.

 

>> Télécharger gratuitement cet article <<

 

Retour vers le haut