XQuery et le typage statique

Article
04/03/2023

S’applique à :SQL Server

XQuery dans SQL Server est un langage typé statiquement. Autrement dit, il génère des erreurs de type lors de la compilation des requêtes dès qu'une expression renvoie une valeur dotée d'un type ou d'une cardinalité qu'une fonction ou un opérateur spécifique n'accepte pas. De plus, la vérification des types statiques peut également déceler si une expression de chemin d'accès faisant référence à un document XML typé a été mal typée. Le compilateur XQuery commence par une phase de normalisation au cours de laquelle s'ajoutent les opérations implicites (atomisation, par exemple), puis effectue l'inférence de type statique et la vérification des types statiques.

Inférence de type statique

L'inférence de type statique consiste à déterminer le type de retour d'une expression. Pour cela, il faut prendre en compte les types statiques des paramètres d'entrée et la sémantique statique de l'opération, puis inférer le type statique du résultat. Par exemple, le type statique de l'expression 1 + 2,3 est déterminé de la manière suivante :

Le type statique de 1 est xs:integer et le type statique de 2.3 est xs:decimal. En fonction de la sémantique dynamique, la sémantique statique de l’opération + convertit l’entier en décimal, puis retourne une décimale. Le type statique déduit serait alors xs:decimal.

En cas d'instances XML non typées, il existe des types particuliers pour indiquer que les données ne sont pas typées. Ces informations servent à vérifier le type statique et à effectuer certaines conversions implicites.

En cas de données typées, le type d'entrée est inféré à partir de la collection de schémas XML qui contraint l'instance du type de données XML. Par exemple, si le schéma autorise uniquement les éléments de type xs:integer, les résultats d’une expression de chemin d’accès utilisant cet élément seront zéro ou plusieurs éléments de type xs:integer. Ceci est actuellement exprimé à l’aide d’une expression telle que element(age,xs:integer)* où l’astérisque (*) indique la cardinalité du type résultant. Dans cet exemple, l’expression peut entraîner zéro ou plusieurs éléments de nom « age » et de type xs:integer. D’autres cardinalités sont exactement une et sont exprimées à l’aide du nom de type seul, zéro ou un et exprimées à l’aide d’un point d’interrogation (?), et 1 ou plus et exprimées à l’aide d’un signe plus (+).

Il arrive parfois que l'inférence de type statique induise le renvoi d'une séquence vide par une expression. Par exemple, si une expression de chemin d’accès sur un type de données XML typé recherche un <élément name> à l’intérieur d’un <élément client> (/customer/name), mais que le schéma n’autorise pas un <nom> à l’intérieur d’un <client>, l’inférence de type statique déduit que le résultat sera vide. Cela sera utilisé pour détecter les requêtes incorrectes et sera signalé en tant qu’erreur statique, sauf si l’expression était () ou data( () ).

Des règles détaillées d'inférence sont fournies dans la sémantique formelle de la spécification XQuery. Microsoft les a légèrement modifiées pour les rendre compatibles avec les instances du type de données XML typé. Suite à la modification la plus importante apportée à cette norme, le nœud de document implicite connaît le type de l'instance du type de données XML. Par conséquent, une expression de chemin d'accès de la forme /age sera typée précisément en fonction de cette information.

En utilisant SQL Server Profiler modèles et autorisations, vous pouvez voir les types statiques retournés dans le cadre des compilations de requêtes. Pour les consulter, votre trace doit inclure l'événement XQuery Static Type dans la catégorie d'événement TSQL.

Vérification des types statiques

La vérification des types statiques permet de s'assurer que, lors de l'exécution, seules des valeurs de type compatible avec l'opération seront reçues. Dans la mesure où les types n'ont pas à être vérifiés lors de l'exécution, des erreurs potentielles peuvent être détectées à l'avance au moment de la compilation. Les performances s'en trouvent donc améliorées. En revanche, le typage statique demande à l'auteur de la requête un soin supplémentaire dans la formulation de la requête.

Voici les types appropriés qu'il est possible d'utiliser :

Types explicitement autorisés par une fonction ou une opération.
Sous-type d'un type explicitement autorisé.

Les sous-types sont définis en fonction des règles de sous-typage permettant de les dériver par restriction ou extension du schéma XML. Par exemple, un type S est un sous-type du type T si toutes les valeurs dotées du type S sont aussi des instances du type T.

De plus, toutes les valeurs entières sont aussi des valeurs décimales, conformément à la hiérarchie du type de schéma XML. En revanche, toutes les valeurs décimales ne sont pas des entiers. Si un entier est un sous-type de décimal, la réciproque est fausse. Par exemple, l’opération autorise uniquement les + valeurs de certains types, comme les types numériques xs:integer, xs:decimal, xs:float et xs:double. Si des valeurs d’autres types, telles que xs:string, sont passées, l’opération génère une erreur de type. Cela s'appelle le typage fort. Des valeurs d'autres types, comme le type atomique utilisé pour indiquer la présence de XML non typé, peuvent être converties implicitement en une valeur d'un type accepté par l'opération. Cela s'appelle le typage faible.

Si elle est obligatoire après une conversion implicite, la vérification des types statiques permet de s'assurer que seules les valeurs dotées de types autorisés et d'une cardinalité correcte sont transmises à une opération. Pour « string » + 1, il reconnaît que le type statique de « string » est xs:string. Comme il ne s’agit pas d’un type autorisé pour l’opération + , une erreur de type est générée.

En cas d'ajout du résultat d'une expression arbitraire E1 à une expression arbitraire E2 (E1 + E2), l'inférence de type statique détermine tout d'abord les types statiques de E1 et de E2, puis vérifie que ces types statiques sont autorisés avec l'opération. Par exemple, si le type statique de E1 peut être xs:string ou xs:integer, la vérification du type statique déclenche une erreur de type, même si certaines valeurs au moment de l’exécution peuvent être des entiers. Il en serait de même si le type statique de E1 était xs:integer*. Étant donné que l’opération + n’accepte qu’une seule valeur entière et que E1 peut retourner zéro ou plus de 1, la vérification du type statique génère une erreur.

Comme nous l'avons déjà mentionné, il arrive fréquemment que l'inférence de type déduise un type plus large que ce que sait l'utilisateur à l'égard des données transmises. Dans ces cas-là, l'utilisateur doit réécrire la requête. Voici quelques cas typiques :

Le type infère un type plus général tel qu'un supertype ou une union de types. Si le type est un type atomique, vous devez utiliser l'expression cast ou la fonction constructor pour indiquer le type statique réel. Par exemple, si le type déduit de l’expression E1 est un choix entre xs:string ou xs:integer et que l’ajout nécessite xs:integer, vous devez écrire xs:integer(E1) + E2 au lieu de E1+E2. Cette expression peut échouer au moment de l’exécution si une valeur de chaîne qui ne peut pas être convertie en xs:integer est rencontrée. En revanche, l'expression passera désormais la vérification des types statiques. Cette expression est mappée avec la séquence vide.
Le type infère une cardinalité supérieure à celle que les données contiennent réellement. Cela se produit fréquemment, car le type de données xml peut contenir plusieurs éléments de niveau supérieur, et une collection de schémas XML ne peut pas le limiter. Afin de réduire le type statique et de garantir qu'il n'y a en fait qu'une seule et unique valeur transmise, vous devez utiliser le prédicat positionnel [1]. Par exemple, pour ajouter 1 à la valeur de l'attribut c de l'élément b situé sous l'élément a de niveau supérieur, vous devez write (/a/b/@c)[1]+1. En outre, le mot clé DOCUMENT peut être utilisé avec une collection de schémas XML.
Certaines opérations perdent les informations de type lors de l'inférence. Par exemple, si le type d’un nœud ne peut pas être déterminé, il devient anyType. Il n'est pas implicitement converti en un autre type. Ces conversions se produisent le plus souvent pendant la navigation à l'aide de l'axe parent. Vous devez éviter d'utiliser ce type d'opérations et réécrire la requête si l'expression crée une erreur de type statique.

Contrôle des types union

La manipulation des types union demande un soin particulier du fait du contrôle du type. Deux des problèmes rencontrés sont expliqués dans les exemples suivants.

Exemple : fonction sur un type union

Considérez une définition d’élément pour <r> d’un type union :

<xs:element name="r">  
<xs:simpleType>  
   <xs:union memberTypes="xs:int xs:float xs:double"/>  
</xs:simpleType>  
</xs:element>

Dans le contexte XQuery, la fonction fn:avg (//r) « moyenne » renvoie une erreur statique, car le compilateur XQuery ne peut pas ajouter de valeurs de types différents (xs:int, xs:float ou xs:double) pour les <r> éléments dans l’argument fn:avg(). Pour résoudre ce problème, réécrire l’appel de la fonction en tant que fn:avg(for $r in //r return $r cast as xs:double ?).

Exemple : opérateur sur un type union

L'opération addition (« + ») requiert les types exacts des opérandes. Par conséquent, l’expression (//r)[1] + 1 retourne une erreur statique qui a la définition de type décrite précédemment pour l’élémentr<> . Une solution consiste à la réécrire sous la forme (//r)[1] cast as xs:int? +1, où « ? » indique 0 ou 1 occurrence. SQL Server nécessite « cast as » avec « ? », car n’importe quel cast peut provoquer la séquence vide à la suite d’erreurs d’exécution.

Voir aussi

Références relatives au langage Xquery (SQL Server)