Descripción de la sintaxis de reglas de directiva

 

Se aplica a: Office 365 Enterprise, Live@edu, Forefront Online Protection for Exchange

Tema modificado por última vez: 2012-05-02

Existen dos opciones para la sintaxis de la regla al crear reglas de directiva en Forefront Online Protection para Exchange (FOPE). La primera es utilizar valores separados por comas (CSV) mezclados con la sintaxis de cadena comodín, que figura como Básica en el editor de reglas de directiva del Centro de administración de FOPE. La segunda consiste en utilizar un subconjunto de caracteres especificados en la sintaxis de expresiones regulares, que figura como RegEx en el editor de reglas de directiva del Centro de administración de FOPE, para aquellas reglas más complejas.

Si no está familiarizado con la sintaxis RegEx, puede seleccionar la opción Básica, que le permite crear expresiones simples para el filtrado de contenido y le ayuda a escribir expresiones de coincidencia en el formato correcto evaluándolas según el contexto en que están definidas. Por ejemplo, en el campo Dirección IP solo se aceptarán direcciones IP correctas. Si las reglas que desea crear requieren más complejidad, como coincidencia de patrones de números y patrones de palabras, puede utilizar un subconjunto de caracteres de sintaxis RegEx al seleccionar la opción RegEx. Con esta opción no están disponibles las validaciones basadas en el contexto; únicamente se aplicarán las validaciones específicas de la sintaxis.

Sintaxis Básica

Si selecciona Básica en el editor de reglas de directiva, podrá recoger expresiones mediante una sintaxis CSV, separando las expresiones de coincidencia con comas. Además, podrá mejorar expresiones de coincidencia con sencillos metacaracteres de cadena comodín. La misma sintaxis se aplica a los archivos de diccionario cargados a través de Filtros.

Definición de sintaxis Básica

Metacarácter Descripción Ejemplo

,

La coma es el metacarácter de elección, también conocido como alternación o separador, y devuelve la expresión situada antes o después de la coma.

abc, def, xyz devuelve abc o def o xyz

*

Un asterisco es el metacarácter comodín, y representa cero o más caracteres.

Nota

Este carácter es equivalente a (.*) en la sintaxis RegEx.

ab* devuelve aba o abaa o abaaa o ab12345667, etc.

?

El signo de interrogación representa cualquier carácter.

Nota

Este carácter es equivalente a (.) en la sintaxis RegEx.

ab? devuelve aba o abb o abc o ab1 o ab2, etc.

\

La barra diagonal inversa es el operador de escape. Para poder coincidir con los literales (,) (*) (?) o (\) y suprimir su significado especial en la sintaxis básica, el operador de escape debe colocarse delante de los operadores de sintaxis básica.

Nota

Este carácter es equivalente a () en la sintaxis RegEx.

\*a\\bc\? devuelve *a\bc?

/0 hasta /32

Una barra diagonal indica una notación de Enrutamiento de interdominios sin clases (CIDR). Esto se puede expresar agregando una barra diagonal (/) seguida de un número del 0 al 32 después del último octeto de una dirección IP.

Nota

La notación CIDR solo se aplica a las expresiones de dirección IP, y no se puede utilizar en otros contextos.

99.99.98.0/23 devuelve los intervalos IP desde 99.99.98.0 hasta 99.99.99.255

Nota

El número total de caracteres insertados en cualquier campo o diccionario de regla de directiva no puede superar los 9.000. El límite de tamaño del archivo de diccionario es de 2 MB.

Sintaxis RegEx

Si selecciona RegEx en el editor de reglas de directiva, puede especificar más expresiones complejas que devuelvan patrones de texto, números o caracteres especiales. Por ejemplo, puede comparar variaciones diferentes de una palabra como viagra, vi@gra, vlagra mediante un subconjunto de caracteres RegEx. Esto le permitirá minimizar el número de reglas necesarias y crear expresiones de coincidencia eficaces, como, por ejemplo, para buscar números de tarjetas de crédito, números de la seguridad social, direcciones de correo electrónico y cadenas parecidas de palabras o números confidenciales.

Definición de sintaxis RegEx

La opción RegEx en el editor de reglas de directiva es un subconjunto de la sintaxis de expresiones regulares básicas y extendidas POSIX, que se expresa en la siguiente tabla.

Tipo de carácter Carácter Descripción Ejemplo

Meta

^

El metacarácter símbolo de intercalación coincide con la posición de inicio de la cadena.

Nota

Utilizado en combinación con el carácter signo de dólar, el símbolo de intercalación tiene la misma funcionalidad que la opción de coincidencia exacta.

^abc devuelve abc1234, pero no 1234abc

Meta

$

El metacarácter signo de dólar coincide con la posición final de la cadena, o la posición inmediatamente anterior a una nueva línea de fin de cadena.

Nota

En combinación con el carácter símbolo de intercalación, el signo de dólar ofrece la misma funcionalidad que la opción de coincidencia exacta.

abc$ devuelve 1234abc, pero no abc1234

Meta

*

La estrella devuelve el elemento que le precede cero o más veces.

Importante

Este carácter debe utilizarse con precaución, ya que las expresiones de coincidencia que lo utilizan pueden ser más de las esperadas.

ab*x devuelve abx o abbx o abbbx o abbbbx, etc.

Meta

+

El metacarácter más devuelve el elemento que le precede una o más veces.

Este carácter debe utilizarse con precaución, ya que las expresiones de coincidencia que lo utilizan pueden ser más de las esperadas.

ab+x devuelve abbx o abbbx o abbbbx o abbbbbx, etc.

Meta

.

El metacarácter punto devuelve cualquier carácter excepto una nueva línea.

ab.x devuelve ab1x o ab2x o ab3x o ab4x, etc.

Meta

?

El signo de interrogación devuelve el elemento que le precede una o ninguna vez.

ab? devuelve a o ab

Meta

|

La barra vertical es un carácter de elección o alternación, que coincide con la expresión anterior o posterior al operador, con inicio en la primera cadena (izquierda) y con final cuando se encuentra una coincidencia.

abc|def|xyz devuelve abc o def o xyz o abc12345, pero no a123c o axm

Meta

\

La barra diagonal inversa hace que los metacaracteres RegEx se traten como caracteres literales en el contexto de la regla.

x\*1\.5\+9\\x=y devuelve x*1.5+9\x=y

Clase

\w

La barra diagonal inversa con una w minúscula coincide con cualquier carácter de palabra, incluidos los caracteres alfanuméricos con "_".

\w123 devuelve a123 o bbb123 o c_c123xxx, pero no @123

Clase

\d

La barra diagonal inversa con una d minúscula coincide con cualquier dígito decimal.

\dabc devuelve 123abc o 12345abcxxx o 1abc1, pero no abc123 o @abc123

Clase

\s

La barra diagonal inversa con una s minúscula coincide con cualquier carácter de espacio en blanco.

abc\sdef devuelve abc def

Importante

Si no está familiarizado con la sintaxis RegEx, le recomendamos que utilice la opción Básica o que pruebe las reglas mediante la acción de regla de directiva Prueba antes de utilizarlas con las acciones de reglas de directivas Rechazar, Cifrar o Redirigir. Las reglas de directiva del Centro de administración solo admiten un subconjunto de caracteres RegEx.
El número total de caracteres RegEX insertados en cualquier campo de regla de directiva no puede superar los 9.000.

Más ejemplos de creación de expresiones de coincidencia con RegEx

Los siguientes son ejemplos de expresiones RegEx que coinciden con diferentes partes de un mensaje:

  • Un punto, que se utiliza para que coincida con extensiones de archivo, coincide con cualquier carácter tras la expresión. Por ejemplo, r. devolvería cualquier nombre de archivo que empezara con la letra r y cualquier carácter detrás. Por ejemplo, la expresión de coincidencia r. devolvería extensiones como r1 u otra combinación de dos caracteres.

  • Para que coincidan como literales, es necesario que todos los metacaracteres RegEx vayan acompañados del operador de escape. Los metacaracteres que no sean RegEx se comparan literalmente y no necesitan que se agregue el operador de escape. Si desea comparar el punto en un nombre de dominio, es necesario que se agregue el carácter de escape al punto mediante \.. La expresión de coincidencia contoso\.com devolverá contoso.com.

  • En el caso de las opciones de Dominio, el dominio devuelto actúa en presencia del dominio del remitente o destinatario en un encabezado de correo electrónico. Por ejemplo, una regla que realice una acción en contoso.com afectará también a los mensajes del subdominio 123.contoso.com. Si solo desea comparar el nombre de dominio sin subdominios, puede configurar la regla con el metacarácter símbolo de intercalación ^contoso.com. La regla configurada de esta forma solo devolverá mensajes de correo electrónico enviados o recibidos de contoso.com y no de 123.contoso.com.

  • Si desea buscar palabras, por ejemplo, en el asunto, cuerpo o nombre de archivo adjunto de un mensajes de correo electrónico, que terminen con la cadena “idad”, combine el asterisco y el punto para realizar la búsqueda. Por ejemplo, el término de búsqueda .*idad devolvería resultados como “sinceridad” o “felicidad”.

  • Un punto . seguido de un asterisco * representa cero o más caracteres. Por ejemplo, la expresión de coincidencia contoso\..* devolvería “contoso.com”, pero también “contoso.microsoft.com” o “contoso.midominio.ca”, etc. Para que devuelva únicamente el dominio de primer nivel (TLD) de un dominio, es necesario utilizar una expresión de coincidencia más precisa. contoso\.\w\w\w$ devolvería “contoso.com” o “contoso.org” o “contoso.tv1”, pero no dominios con más o menos de 3 caracteres alfanuméricos después del punto.

Acerca de las expresiones regulares

Las expresiones regulares, RegEx, conforman un lenguaje formal estándar utilizado en numerosos sistemas y lenguajes de programación. Las expresiones regulares pueden ser muy eficaces si se utilizan correctamente. Puede obtener más información, incluidas la definición, ejemplos y tutoriales sobre la sintaxis, en numerosos sitios web, como los siguientes:

-
MSDN Introduction to Regular Expressions (Introducción a las expresiones regulares, en inglés)

-
El sitio web Regular Expressions.Info

-
El sitio web Regular Expression Library