Stratégies de disponibilité élevée

 

S’applique à : Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

Dernière rubrique modifiée : 2007-08-31

Cette rubrique fournit une vue d'ensemble de la haute disponibilité dans Microsoft Exchange Server 2007. Cette rubrique introduit également le processus de décision recommandé pour la sélection de la solution de disponibilité appropriée pour votre organisation.

Les termes disponibilité et haute disponibilité peuvent avoir des significations très différentes selon le contexte d’utilisation et le public concerné. Ils peuvent être utilisés pour décrire une série d’objectifs commerciaux et de besoins techniques, allant des objectifs de disponibilité matérielle seuls aux objectifs critiques s’appliquant à l’ensemble du service de messagerie.

En général, il est relativement facile pour les organisations d'effectuer des prévisions incorrectes concernant les objectifs de disponibilité. Il est également facile pour les organisations d’exiger des niveaux de disponibilité plus élevés que ceux pour lesquels elles sont disposées à payer avant d'avoir mesuré les implications en termes de coût.

Les implications financières de la plupart des solutions de disponibilité sont notamment les suivantes :

  • Matériel

  • Logiciels

  • Infrastructure réseau

  • Formation

  • Facilité de gestion

  • Coûts de fonctionnement

La facilité de gestion correspond aux accords contractuels définis avec des fournisseurs de service tiers ou aux contrats de niveau opérationnel passés avec des divisions informatiques de votre organisation, pour fournir ou maintenir des services ou des composants informatiques.

Disponibilité

La disponibilité fait référence à un niveau de service fourni par des applications, des services ou des systèmes. Les systèmes à haute disponibilité offrent un temps d'arrêt minimal, planifié ou non. La disponibilité est souvent exprimée en tant que pourcentage de temps durant lequel un service ou un système est disponible, par exemple 99,9 % pour un service qui est indisponible 8,75 heures par an.

Afin d’améliorer la disponibilité, vous devez implémenter des mécanismes de tolérance de pannes pour masquer ou minimiser l’impact des pannes des composants et des dépendances du service. La tolérance de pannes est obtenue en implémentant la redondance aux points faibles des composants défaillants.

Lors de la planification de la disponibilité de Microsoft Exchange, considérez tous les composants appartenant à l’infrastructure de messagerie. Certains composants peuvent également représenter d’autres services ayant des sous-composants. La disponibilité du service de messagerie est déterminée par la disponibilité de chaque composant faisant partie de l’infrastructure.

Définition des exigences de disponibilité

La disponibilité du système est une question complexe qui s’étend sur plusieurs fonctions. Un grand nombre d’approches différentes peuvent être adoptées pour fournir les niveaux disponibilité requis, chacun avec ses propres implications de coût.

Toutefois, les exigences de disponibilité peuvent être fréquemment exprimés en des termes relativement simples par le client et sans avoir besoin d’une compréhension totale des implications. Cette situation peut donner lieu à des incompréhensions entre le client et l’organisation informatique, à des niveaux d’investissement inappropriés et, enfin, au mécontentement des clients à cause de la définition de prévisions inappropriées.

Une exigence de 99,5 pour cent de disponibilité exprimée peut différer d'une autre de exigence de 99,5 pour cent de disponibilité. Une exigence peut examiner uniquement la disponibilité de la plate-forme matérielle, et une autre la disponibilité du service de bout en bout. La définition de la disponibilité du service de bout en bout peut aussi varier de façon considérable. Il est important de comprendre exactement comment chaque exigence de disponibilité doit être évaluée. Par exemple :

  • Si le matériel et les logiciels sur le serveur principal fonctionnent correctement et si les connexions de l’utilisateur sont prêtes à être acceptées par l’application, la solution est-elle considérée comme disponible à 100 % ?

  • S'il existe 100 utilisateurs et que 25 % d’entre eux ne peuvent pas se connecter à cause d'une panne du réseau local, peut-on toujours considérer que la solution reste disponible à 100 % ?

  • Si seul un utilisateur sur 100 parvient à se connecter et à travailler, la disponibilité de la solution n'est-elle que de 1 % ?

  • Si les 100 utilisateurs peuvent se connecter mais que le service est dégradé avec uniquement deux transactions de clients possibles sur trois ou si les performances sont médiocres, comment cela affecte-t-il les paramètres de disponibilité ?

La période durant laquelle la disponibilité doit être évaluée peut également avoir un impact significatif sur la définition de la disponible. Une exigence de disponibilité de 99,9 % pour une durée d’un an permet 8,75 heures d'indisponibilité. Une exigence de 99,9 pour cent de disponibilité pour une période de quatre mois consécutifs permet uniquement une indisponibilité de 40 minutes pendant chaque période.

Il est également important d’identifier et de négocier les périodes d'indisponibilité pour l’activité de maintenance planifiée, les mises à jour de service pack et des logiciels. Le nombre d’arrêts programmés pouvant être tolérés a un impact significatif sur la définition des exigences de disponibilité.

La version de publication (RTM) de Microsoft Exchange Server 2007 inclut de nouvelles fonctionnalités permettant de réduire les coûts et d'augmenter la disponibilité :

  • Réplication continue locale   La réplication continue locale (LCR) est une solution de serveur unique qui utilise une technologie intégrée pour créer et conserver une copie d'un groupe de stockage sur un deuxième ensemble de disques qui sont connectés au même serveur que le groupe de stockage de production. La LCR permet l'envoi de journaux synchrone, la relecture de journal et un basculement manuel rapide vers une copie des données. Pour plus d'informations sur la LCR, consultez la rubrique Réplication locale en continu.

  • Réplication continue en cluster La réplication continue en cluster combine les fonctionnalités de réplication et de relecture dans Exchange 2007 avec les fonctionnalités de basculement dans les services de cluster Microsoft. La CCR est une solution qui peut être déployée sans aucun point de défaillance dans un centre de données unique ou entre deux centres de données. Pour plus d'informations sur la CCR, consultez la rubrique Réplication continue en cluster. La réplication continue en cluster (CCR) offre divers avantages par rapport au clustering dans les versions précédentes d'Exchange Server et les clusters à copie unique dans Exchange 2007. Pour plus d'informations sur ces avantages, consultez la rubrique Avantages de la réplication continue en cluster sur les clusters à copie unique.

  • Clusters à copie unique   Des clusters à copie unique (CCR), appelé clusters de stockage partagé dans les versions précédentes d'Exchange Server, sont présents dans Exchange 2007, où ils ont fait l'objet de modifications et d'améliorations importantes. Pour plus d'informations sur SCC, consultez la rubrique Clusters à copie unique.

Microsoft Exchange Server 2007 Service Pack 1 (SP1) ajoute une nouvelle fonctionnalité conçue pour assurer la résilience de site :

  • Réplication continue de secours   La réplication continue de secours (SCR) est une nouvelle fonctionnalité incluse dans Exchange 2007 SP1. Comme son nom l’indique, la SCR est conçue pour les scénarios utilisant ou activant l’utilisation des serveurs de récupération de secours. La SCR étend les fonctionnalités de réplication continue existantes et permet de nouveaux scénarios de disponibilité pour les serveurs de boîtes aux lettres Exchange 2007. La SCR utilise la même technologie d’envoi et de relecture des journaux utilisée par la LCR et la CCR afin d'offrir des options et configurations de déploiement supplémentaires. La SCR permet de répliquer des données de serveurs de boîtes aux lettres autonomes et de serveurs de boîtes aux lettres en cluster. Pour plus d'informations sur la SCR, consultez la rubrique Réplication continue de secours.

Ces fonctionnalités offrent des possibilités de récupération optimisées qui répondent à diverses exigences de disponibilité. Le tableau suivant répertorie les diverses exigences de disponibilité et compare les solutions Exchange 2007 aux solutions de récupération d'urgence disponibles dans Exchange Server 2003. Pour plus d'informations sur les configurations de haute disponibilité pour Exchange 2007, consultez la rubrique Déploiements de grande disponibilité.

Comparaison entre les solutions de haute disponibilité basée sur les exigences de disponibilité

Exigences de disponibilité Solution Exchange 2003 Solution Exchange 2007 RTM Solution Exchange 2007 SP1

Archivage à long terme

Sauvegardes complètes quotidiennes Restauration de sauvegardes sur un serveur recréé à l'identique

Sauvegardes hebdomadaires complètes et sauvegardes quotidiennes incrémentales. Restauration de sauvegardes sur un serveur quelconque

Sauvegardes hebdomadaires complètes et sauvegardes quotidiennes incrémentales. Restauration de sauvegardes sur un serveur quelconque

Réponse aux erreurs de l'utilisateur

Durée par défaut de 7 jours de conservation dans le conteneur de dépôt Au-delà de 7 jours, restauration de sauvegardes sur un serveur recréé à l'identique

Durée par défaut de quatorze jours de conservation dans le conteneur de dépôt Au-delà de quatorze jours, restauration de sauvegardes sur un serveur quelconque

Durée par défaut de quatorze jours de conservation dans le conteneur de dépôt Au-delà de quatorze jours, restauration de sauvegardes sur un serveur quelconque

Tolérance aux pannes :

  • Disque

  • Matériel

  • Stockage partagé

Restauration de sauvegardes sur un serveur recréé à l'identique

Réplication en continu Aucune restauration requise

Défaillance autonome ou double défaillance de réplication continue en cluster (CCR) : Tonalité à un emplacement alternatif ou le portabilité de base de données.

Réplication en continu Aucune restauration requise

Défaillance autonome ou double défaillance de réplication continue en cluster (CCR) : Tonalité à un emplacement alternatif ou le portabilité de base de données.

Tolérance aux incidents à l'échelle du site

Restauration de sauvegardes sur un serveur recréé à l'identique

Réplication continue sur un deuxième site Aucune restauration requise

Défaillance autonome ou double défaillance de réplication continue en cluster (CCR) : Tonalité à un emplacement alternatif ou le portabilité de base de données.

Réplication continue de secours sur un deuxième site. Aucune restauration requise

Portabilité de base de données ou activation de serveur de secours

Sélection de la solution de disponibilité appropriée

Plusieurs configurations permettent d'améliorer la disponibilité d'un déploiement Exchange 2007. Une étape importante dans la sélection de la solution de disponibilité appropriée requiert d'analyser l'ensemble d'options sélectionnées pour identifier la solution qui correspond le mieux aux objectifs et exigences de disponibilité de votre entreprise. Une des manières de procéder consiste à élaborer un tableau avec une section pour chaque type de défaillance. Dans chaque section du tableau, utilisez une ligne pour identifier chaque solution fournissant une stratégie de récupération correspondant à vos exigences de disponibilité pour la défaillance. Documentez les facteurs principaux de la solution dans les colonnes. Les facteurs peuvent être les suivants :

  • délai de récupération ;

  • impact de la récupération sur les données  ;

  • coûts logiciels et matériels associés ;

  • coûts de ressources associés ;

  • probabilité d'événement ;

  • implications pour l'entreprise ;

  • risques de complication ;

  • solutions tierces ;

  • avantages ;

  • inconvénients.

Une fois les tableaux complétés, sélectionnez plusieurs solutions afin d'en analyser le coût. Pour chaque solution sélectionnée, vous devez calculer un coût estimé par boîte aux lettres, qui peut également être consigné dans un tableau. Dans le tableau des coûts, insérez une ligne afin d'évaluer la qualité de la solution par rapport aux objectifs de l'entreprise. Veillez à évaluer plusieurs choix. Sélectionnez au moins une solution qui correspond à vos besoins mais diffère de la solution que retiendrait votre organisation.

Enfin, passez en revue les objectifs de l'entreprise, les exigences de disponibilité, les solutions possibles et l'analyse des coûts pour choisir votre solution. Lors de ce processus, les éléments clés à considérer pour prendre la bonne décision sont les suivants :

  • Définissez un ensemble clair d'objectifs de l'entreprise hiérarchisés   La hiérarchisation est importante car il est probable que les différents objectifs sont contradictoires.

  • Évaluez les conditions historiques qui ne sont éventuellement plus applicables   Tirez parti du potentiel d'Exchange 2007 lors de l'étape de conception et d'évaluation. L'expérience a montré que les solutions les plus rentables peuvent impliquer d'opter pour de nouvelles approches en ce qui concerne les sauvegardes, le stockage et les opérations.

  • Examiner les points de défaillance uniques du système de messagerie   Une copie unique des données de boîte aux lettres stockée sur un réseau SAN unique (Storage Area Network) signifie que les données ne sont pas complètement protégées contre l’endommagement et l’échec. L'endommagement et l'échec peuvent affecter cette copie unique des données de plusieurs manières, indépendamment du niveau de redondance assuré par le réseau SAN. Avec un cluster à copie unique, un échec de réseau SAN peut provoquer une perte de données sur plusieurs heures et une panne de plusieurs jours pour le service. La CCR est une solution de disponibilité pour laquelle une perte de données peut survenir en cas d'échec du serveur, mais elle maintient par ailleurs deux copies des données. La CCR compense la plupart des pertes de données suite à un échec du serveur à l'aide de la fonctionnalité du serveur de transport Hub appelée conteneur de dépôt de transport. Aussi, dans la plupart des situations d'échec matériel, les données de boîte aux lettres sont préservées.

  • Explorez les options de stockage disponibles pour chaque solution   La CCR permet aux organisations d'utiliser diverses solutions de stockage, telles qu'un stockage DAS. La CCR ne requiert pas de structure SAN, ce qui réduit les complications et les coûts associés. Le stockage DAS, qu'il s'agisse d'un réseau SAN ou d'une solution de stockage à moindre coût, est plus facile à déployer et exploiter.

  • Songez que la CCR et la LCR vous permettent de modifier votre stratégie de sauvegarde et de passer d'une sauvegarde complète quotidienne classique à une stratégie impliquant des sauvegardes complètes moins fréquentes et des sauvegardes incrémentielles quotidiennes   La CCR et la LCR peuvent également prendre en charge un contrat de niveau de service (SLA) moins important pour la récupération de la première défaillance. Pour que le contrat SLA couvre la récupération d'un double échec (situation dans laquelle les deux copies sont en échec ou endommagées), il peut être nécessaire d'augmenter votre contrat SLA de restauration actuel. De telles modifications peuvent réduire de façon considérable votre coût total de possession (TCO), car les coûts liés à la sauvegarde constituent généralement un composant essentiel du TCO. En outre, le fait d'adopter une stratégie de sauvegarde basée sur les disques peut également réduire les coûts liés à la sauvegarde.

  • Envisagez l’utilisation de la technologie de réplication continue dans Exchange 2007 pour créer une solution   La CCR rend inutile une technologie de réplication tierce. Actuellement, la CCR prend en charge les clusters à deux noeuds, chaque noeud maintenant une copie des données. Une solution de résilience de site basée sur cette technologie présente plusieurs avantages :

    • Elle garantit la disponibilité pour les clients des données de boîte aux lettres dans le centre de données de sauvegarde.

    • La réplication continue déplace moins de données que la plupart des solutions tierces.

    • Elle requiert une intégration moindre pour créer une solution de résilience de site.

  • Créez les tableaux qui identifient le comportement de récupération et les coûts associés aux différentes options   Assurez-vous que le tableau des coûts contient plusieurs options à comparer avec vos pratiques actuelles. Utilisez les éléments des tableaux que vous créez pour concevoir une solution qui :

    • constitue la meilleure solution pour les besoins de l'entreprise.

    • correspond aux exigences en termes de coûts.

    • représente un niveau de complexité du point de vue du déploiement et des opérations que votre organisation peut prendre en charge.

Produits et composantes de base

Le déploiement des produits et des composantes devrait se baser sur leur capacité de satisfaire les besoins d'intégrité et de disponibilité stricts. Considérez ces exigences comme la pierre angulaire de la conception de disponibilité. L'investissement supplémentaire requis pour atteindre des niveaux de disponibilité encore plus élevés sera gaspillé et les niveaux de disponibilité non atteints si ces produits et composantes de base ne sont pas fiables et prédisposés à l'échec.

Processus de gestion de service

Les processus de gestion de service efficaces contribuent aux niveaux supérieurs de disponibilité. Les processus tels que la gestion de la disponibilité, la gestion d'incidents, la gestion de problèmes et la gestion de changements jouent un rôle important dans la gestion générale du service de messagerie.

Gestion des systèmes

La gestion des systèmes devrait fournir le contrôle, le diagnostic et la récupération automatisée d’erreur pour permettre la détection rapide et la résolution de défaillance potentielle et réelle.

Solutions spéciales avec redondance totale

L'approche à la disponibilité continue dans la gamme de 100 pour cent exige des solutions onéreuses qui incorporent la redondance totale. La redondance est la technique d’amélioration de la disponibilité par l’utilisation de composantes dupliquées. Pour les exigences de disponibilité strictes devant être satisfaites, ces composantes doivent travailler en parallèle de manière autonome.

Définition des objectifs de disponibilité et des exigences de contrat SLA

L'accomplissement des hauts niveaux de disponibilité commence par le déploiement de produits et de composantes de bonne qualité. Cependant, ces produits et composantes à eux seuls ne délivreront probablement pas des niveaux soutenus de disponibilité requis. Vous devriez considérer les objectifs de disponibilité dans le processus de conception dès la première étape de développement. Cette approche évite la probabilité d’augmentation de coûts relatifs au remaniement, aux mises à niveau imprévues nécessaires pour répondre à la disponibilité requise, aux outils imprévus pour contrôler l'infrastructure, aux dépenses imprévues pour éliminer les simples points de défaillance dans l'infrastructure, la facilité de maintenance et la praticabilité.

Dans cette perspective de haute disponibilité, passez en revue le contrat de niveau de service (SLA) que vous avez établi pour votre organisation. Une fois le contrat SLA établi, vous pouvez déterminer le déploiement d'Exchange 2007 et les configurations de serveur les mieux adaptées à ce contrat.

Vous trouverez ci-après les considérations clé pour une haute disponibilité par rapport à la récupération d'urgence :

  • Temps d'arrêt autorisé   Vous devez prendre en considération le temps d’arrêt autorisé maximal acceptable pour votre organisation sur la base de la définition de votre organisation pour le service de disponibilité d’Exchange. En fonction de la définition du temps d’arrêt de votre organisation, vous pouvez répondre aux exigences du contrat SLA de votre organisation à l’aide d’une stratégie de récupération de tonalité de messagerie. Une stratégie de récupération de tonalité de messagerie inclut la fourniture aux utilisateurs d'une boîte aux lettres temporaire de façon à ce qu'ils puissent échanger des messages électroniques immédiatement suite à une défaillance. Cette stratégie restaure rapidement le service de messagerie électronique avant de récupérer les données d'historique des boîtes aux lettres. En général, la récupération s'effectue en fusionnant éventuellement les données d'historique et les données temporaires des boîtes aux lettres.

  • Temps de récupération autorisé   Vous devez prendre en considération le temps maximal autorisé pour chaque type d’opération de récupération d’urgence. Par exemple, vous pouvez spécifier le temps approximatif nécessaire pour la récupération d’une boîte aux lettres, d’une base de données unique ou d’un serveur tout entier exécutant Exchange 2007.

  • Tolérance de perte de données   Vous devez prendre en considération la tolérance acceptée par votre organisation pour la perte temporaire ou permanente de données Exchange. Par exemple, votre organisation peut tolérer la perte temporaire de données de boîtes aux lettres depuis la sauvegarde précédente pour une période de 24 heures tant que les utilisateurs peuvent envoyer et recevoir des messages dans une période de 4 heures. Dans d'autres cas, vous pouvez envisager une configuration plus stricte, comme exiger la restauration dans les 4 heures de toutes les données d’Exchange au point de défaillance.

Après avoir considéré l'impact des temps d'arrêt sur votre organisation et avoir sélectionné un niveau de disponibilité souhaité dans votre environnement de messagerie, vous êtes prêt à établir un contrat SLA. Les exigences des contrats SLA déterminent le rôle joué par des éléments tels que le stockage, les clusters, la récupération et les sauvegardes dans votre organisation.

Lors de l'évaluation des contrats SLA, vous devez commencer par identifier les heures de fonctionnement normal et les attentes en matière de temps d'arrêt planifié. Vous devez ensuite déterminer les attentes de votre entreprise en matière de disponibilité, de performances et de récupération, y compris les délais de remise de messages, le pourcentage de disponibilité du serveur, la quantité de stockage requise et la durée nécessaire à la récupération d'une base de données Exchange.

À cela s'ajoute la nécessité d'identifier le coût estimé des temps d'arrêt non planifiés afin d'adapter la quantité adéquate de tolérance de pannes dans votre système de messagerie.

Les fonctionnalités d'Exchange 2007 et de Windows Server 2003 peuvent affecter la manière dont vous concevez votre organisation en fonction des contrats SLA. Par exemple, les fonctionnalités de LCR, de CCR, de SCC, du service VSS, des groupes de stockage de récupération, de la portabilité des bases de données et de la portabilité des tonalités peuvent vous permettre de repousser les limites précédemment imposées par vos contrats SLA.

Le tableau suivant répertorie certaines des catégories et des éléments spécifiques pouvant être inclus dans vos contrats SLA.

Catégories et éléments d'un contrat SLA typique de niveau entreprise

Catégories du contrat SLA Exemples d'éléments du contrat SLA

Heures de fonctionnement

  • Heures durant lesquelles le service de messagerie est accessible aux utilisateurs

  • Heures réservées aux temps d'arrêt planifiés (maintenance)

  • Durée du préavis pour les modifications réseau ou autres changements pouvant affecter les utilisateurs

Disponibilité des services

  • Pourcentage de temps durant lequel les services Exchange sont en cours d'exécution

  • Pourcentage de temps durant lequel les magasins de boîtes aux lettres sont montés

  • Pourcentage de temps durant lequel les services de contrôleur de domaine sont en cours d'exécution

Performances du système

  • Nombre d'utilisateurs internes simultanés actuellement pris en charge par le système de messagerie

  • Nombre d'utilisateurs distants simultanés actuellement pris en charge par le système de messagerie

  • Nombre de transactions de messagerie actuellement pris en charge par unité de temps

  • Niveau de performances acceptable, tel que la latence constatée par les utilisateurs

Récupération d'urgence

  • Durée autorisée pour la récupération de chaque type de défaillance (de base de données, de serveur de boîtes aux lettres, de contrôleur de domaine et de site)

  • Durée nécessaire pour fournir un système de messagerie de secours permettant aux utilisateurs d'envoyer et de recevoir des messages sans accéder à l'historique des données (nommé Tonalité de messagerie)

  • Durée nécessaire à la récupération des données au point de défaillance

Assistance utilisateur et service technique

  • Méthodes spécifiques à disposition des utilisateurs pour contacter l'Assistance utilisateur

  • Temps de réponse de l'Assistance utilisateur pour différentes catégories de problèmes

  • Procédures de l'Assistance utilisateur concernant l'escalade de problèmes

Autre

  • Quantité de stockage requise par utilisateur

  • Nombre d'utilisateurs exigeant des fonctionnalités spéciales, telles que l'accès à distance au système de messagerie

L'inclusion de différentes mesures de performances dans vos contrats SLA vous permet de garantir la satisfaction des exigences de performances spécifiques de vos utilisateurs. Par exemple, en cas de latence élevée ou de faible bande passante disponible entre les clients et les serveurs de boîtes aux lettres, les utilisateurs évalueront le niveau de performances différemment des administrateurs système. Plus spécifiquement, les utilisateurs pourront juger le niveau de performances médiocre, tandis que les administrateurs système le jugeront acceptable. Donc, assurez-vous de contrôler les niveaux de latence d'entrées/sorties (E/S) disque.

Notes

Pour chaque élément de contrat SLA, vous devez également déterminer les critères d'évaluation de performances spécifiques qui seront utilisés pour mesurer les performances et les comparer aux objectifs de disponibilité. Vous devez en outre déterminer la fréquence de remise de statistiques à la direction du service informatique et autres personnels de direction.

Établissement de contrats SLA avec vos fournisseurs

De nombreuses entreprises qui accordent une grande importance aux solutions de haute disponibilité utilisent les services de fournisseurs tiers pour atteindre leurs objectifs de disponibilité. Dans ces cas, l'obtention d'un système de messagerie à haute disponibilité exige le recours à des services proposés par des fournisseurs de matériel et de logiciels externes. La non-réceptivité des fournisseurs et le manque de formation de leur personnel peuvent diminuer la disponibilité du système de messagerie.

Veillez à négocier un contrat SLA avec chacun de vos principaux fournisseurs. L'établissement de contrats SLA avec les fournisseurs permet de garantir le niveau de performances, l'évolutivité et la disponibilité attendue de votre système de messagerie. L'absence de contrat SLA peut augmenter sensiblement la durée d'indisponibilité du service de messagerie.

importantImportant :
Assurez-vous que votre personnel connaît les conditions de chaque contrat SLA. Par exemple, de nombreux contrats SLA de fournisseurs de matériel contiennent des clauses stipulant que seuls le support technique du fournisseur ou des membres du personnel de votre organisation certifiés sont autorisés à ouvrir les boîtiers des serveurs. Le non-respect de ces clauses peut constituer une violation du contrat SLA et entraîner une annulation des garanties ou des responsabilités du fournisseur.

Outre l'établissement de contrats SLA avec vos principaux fournisseurs, vous devez tester régulièrement les procédures d'escalade en effectuant des exercices de demande de support technique. Veillez également à tester les arborescences de téléphones et de récepteurs de radiomessagerie afin de vérifier que vous disposez des informations de contact les plus récentes.

Considérations de disponibilité

Il est recommandé de prendre en compte les problèmes suivants pour déterminer les exigences de disponibilité :

  • Compréhension de la vulnérabilité à l'échec de la conception de l'infrastructure proposée. Vous devriez vous assurer qu'il n'y a aucun point de défaillance. Un simple point de défaillance a trait à n'importe quelle composante dans l'infrastructure de messagerie qui n'a aucune capacité de redondance et peut affecter l'utilisateur quand il échoue. La conception technique proposée pour la solution devrait couvrir la configuration complète d'un bout à l'autre.

  • Considérez les niveaux minima de disponibilité exigés par l’entreprise pour le service de messagerie et les niveaux minima d'intégrité, de facilité de maintenance et de praticabilité pour chaque composante de l'infrastructure de messagerie.

  • Considérez la capacité de tester ou simuler les nouvelles composantes pour vous assurer qu'ils correspondent aux exigences spécifiées. Pour évaluer si les nouvelles composantes dans la conception peuvent correspondre aux exigences spécifiées, il est important que le régime de mise à l'essai que vous incitez vérifie que la disponibilité attendue peut être délivrée. La mise à l'essai devrait aussi être exécutée lorsque les composantes sont entretenues. Les outils de simulation pour la génération de la demande attendue de l’utilisateur pour le nouveau service de technologie de l'information devraient sérieusement vérifier que les composantes continuent à opérer dans les conditions de tension et de volume.

Considérations de haute disponibilité

Une solution de messagerie à haute disponibilité nécessite d'investir dans une solution de contrôle, des processus de gestion de service, des outils de gestion des systèmes et de redondance, et de les déployer. Pour les déploiements de grande disponibilité, il est important qu'aucun point de défaillance n’existe d’un bout à l’autre à l’intérieur de cette configuration. La conception de haute disponibilité doit considérer l'élimination de points de panne uniques et la provision de composantes alternatives pour fournir un minimum de perturbation à l'opération de l’entreprise si la défaillance d’une composant se produit. La conception doit aussi éliminer ou minimiser les effets de temps mort planifié à l'opération de l’entreprise normalement requis pour accueillir l'activité de maintenance comme l’application des changements à l'infrastructure. Les critères de récupération devraient définir la récupération rapide et la réintégration de service comme un objectif clé à l’intérieur de la conception à la phase de récupération de la conception.

Dans le cadre de l'élaboration d'un plan de déploiement d'une solution de messagerie, vous devez identifier les objectifs de la solution. Il s'agit d'un aspect particulièrement important de la conception des caractéristiques de disponibilité de la solution. Il arrive souvent que les objectifs de l'entreprise soient contradictoires. Par exemple, vous cherchez à atteindre une disponibilité totale mais avez également besoin d'appliquer les dernières mises à niveau de sécurité dans la semaine suivant leur publication. Les coûts sont souvent un autre facteur important pour l'élaboration des plans de déploiement. La meilleure approche pour trouver la solution adaptée à votre entreprise consiste à utiliser une méthodologie de planification qui identifie l'ensemble des besoins de l'entreprise et évalue les options disponibles à cet effet.

Pour garantir une haute disponibilité, vous devez continuellement prendre en compte les méthodes opérationnelles de votre organisation. Il est impératif de comprendre les causes des pannes. Si des modifications de processus appropriées ont pu permettre de prévenir ces pannes, elles doivent être appliquées.

L'analyse proactive de l'environnement Exchange est un autre facteur clé de l'optimisation de la disponibilité. Elle permet d'identifier les éléments pouvant poser problème dans le système avant que ceux-ci ne provoquent des défaillances ou des pannes. Elle permet, en outre, d'alerter le personnel d'exploitation sur les problèmes qui ne sont pas automatiquement récupérés par le système. Dans ces situations, une réponse en temps opportun peut réduire la durée de la panne et augmenter la disponibilité.

Exchange 2007 place les dépendances sur une infrastructure dans un centre de données. De cette manière, la disponibilité d'Exchange est liée à la disponibilité de ses dépendances. Il est recommandé d'établir des contrats SLA pour chaque dépendance. Le contrat SLA doit spécifier la disponibilité du service fourni et le temps de récupération en cas de défaillance. Par exemple, le service d'annuaire Active Directory est une dépendance clé pour Exchange. Si la disponibilité d'Active Directory est inférieure aux objectifs de disponibilité d'Exchange, il y a de grandes chances pour qu'Exchange ne parvienne pas à atteindre ses objectifs.

La disponibilité d'Exchange 2007 dépend de la disponibilité d'autres services au sein de l'infrastructure informatique. Des services, tels qu'Active Directory et la gestion de réseau doivent fonctionner pour qu'Exchange soit opérationnel. La disponibilité de ces services affecte directement la disponibilité d'Exchange. Vous devez donc vous assurer que les exigences de disponibilité d'Exchange ne sont pas supérieures à celles de ses dépendances. Les dépendances sont généralement les suivantes :

  • Active Directory

  • DNS (Domain Name System) ;

  • réseau TCP/IP ;

  • sous-système de stockage ;

  • services de sauvegarde ;

  • services d'analyse ;

  • infrastructure du centre de données (électricité et air conditionné).

Une fois les objectifs de l'entreprise et les contrats SLA définis pour les dépendances Exchange, il est recommandé de dresser une liste initiale des exigences de disponibilité pour les services de messagerie. La liste doit inclure chaque classe générale de défaillance et l'objectif de temps de récupération (RTO) attendu. Pour les défaillances liées aux données, la liste doit inclure une indication relative à l'impact de la défaillance sur les données. Vous pouvez spécifier cela en indiquant un objectif de point de récupération (RPO). Celui-ci identifie l'impact sur les données en spécifiant un délai qui définit le niveau de données disponible après la récupération. Vous devez prendre en compte les défaillances suivantes :

  • perte d'un élément de courrier ;

  • perte d'une boîte aux lettres ;

  • perte ou endommagement d'une base de données ;

  • défaillance d'un disque ;

  • défaillance ou endommagement d'un volume de disque ;

  • défaillance d'une unité de stockage ;

  • défaillance d'un serveur ;

  • perte de connectivité réseau ;

  • défaillance du centre de données.

Dans de nombreuses organisations, les exigences de disponibilité définies varient en fonction du type d'utilisateur. Par exemple, certains utilisateurs peuvent utiliser le système de messagerie pour procéder au suivi des livraisons ou des ventes quand d'autres l'utilisent pour des messages non critiques. L'objectif de temps de récupération (RTO) et l'objectif de point de récupération (RPO) pour les utilisateurs qui s'appuient sur le système de messagerie pour les processus critiques doivent être aussi courts que possible, tandis que ceux qui utilisent le système de messagerie pour des processus non critiques peuvent tolérer des RTO et RPO plus longs.

Pour plus d'informations

Pour plus d'informations sur la résilience de site pour Exchange 2007, consultez la rubrique Site Resilience Configurations.