Crear filtros para modelos de minería de datos (Analysis Services - Minería de datos)

El filtrado de modelos basado en datos ayuda a crear modelos de minería de datos que usan subconjuntos de datos en una estructura de minería de datos. El filtrado proporciona flexibilidad a la hora de diseñar orígenes de datos y estructuras de minería de datos propios, porque se puede crear una estructura de minería de datos única basándose en una vista del origen de datos completa. A continuación, puede crear filtros para usar sólo una parte de esos datos para aprendizaje y probar una variedad de modelos, en lugar de generar una estructura diferente y un modelo relacionado para cada subconjunto de datos.

Por ejemplo, define la vista del origen de datos en la tabla Customers y las tablas relacionadas. Luego define una estructura de minería de datos única que incluye todos los campos necesarios. Por último, crea un modelo que se filtra en un atributo de cliente determinado, como Región. A continuación, puede realizar fácilmente una copia de ese modelo y cambiar la condición de filtro para generar un nuevo modelo basado en una región diferente.

Algunos escenarios de uso real donde podría aprovechar las ventajas de esta característica son los siguientes:

  • Creación de modelos independientes para valores discretos como género, regiones, etc. Por ejemplo, un almacén de ropa podría usar los datos demográficos de los clientes para generar modelos independientes por género, aunque los datos de ventas procedan de un origen de datos único para todos los clientes.

  • Experimentación con modelos creando y probando a continuación varias agrupaciones de los mismos datos, como edades de 20 a 30 frente a edades de 20 a 40 y de 20 a 25 años.

  • Especificación de los filtros complejos en el contenido de las tablas anidadas, como requerir que un caso se incluya en el modelo sólo si el cliente ha comprado al menos dos artículos de un producto determinado.

En esta sección se explica cómo generar, usa y administrar filtros en los modelos de minería de datos.

Crear filtros de modelo

Para crear y aplicar filtros puede hacer lo siguiente:

  • Usar la ficha Modelos de minería de datos en el Diseñador de minería de datos para generar condiciones con la ayuda de los cuadros de diálogo del editor de filtros.

  • Escribir una expresión de filtro directamente en la propiedad Filter del modelo de minería de datos.

  • Establecer condiciones de filtro en un modelo mediante programación usando AMO.

Crear filtros de modelo mediante el Diseñador de minería de datos

Primero filtra un modelo en el Diseñador de minería de datos cambiando la propiedad Filter del modelo de minería de datos. Puede escribir una expresión de filtro directamente en el panel Propiedades o bien, puede abrir un cuadro de diálogo de filtro para generar condiciones.

Hay dos cuadros de diálogo de filtro. El primero le permite crear condiciones que se aplican a la tabla de casos. Si el origen de datos contiene varias tablas, primero seleccione una tabla y, a continuación, seleccione una columna y especifique los operadores y condiciones que desee que se apliquen a dicha columna. Puede vincular varias condiciones mediante operadores AND/OR. Los operadores disponibles para definir valores dependen de si la columna contiene valores discretos o continuos. Por ejemplo, con valores continuos, puede usar operadores greater than y less than. Sin embargo, para valores discretos, sólo puede usar los operadores = (equal to), != (not equal to) y is null.

Nota

No se admite la palabra clave LIKE. Si desea incluir varios atributos discretos, debe crear condiciones individuales y vincularlas mediante el operador OR.

Si las condiciones son complejas, puede usar el segundo cuadro de diálogo de filtros para trabajar con una tabla cada vez. Cuando se cierra el segundo cuadro de diálogo de filtros, la expresión se evalúa y, a continuación, se combina con las condiciones de filtro que se han establecido en otras columnas de la tabla de casos.

Crear filtros en tablas anidadas

Si la vista del origen de datos contiene tablas anidadas, puede usar el segundo cuadro de diálogo de filtros para generar condiciones en las filas de las tablas anidadas.

Por ejemplo, si su tabla de casos está relacionada con los clientes y la tabla anidada muestra los productos que ha comprado un cliente, puede crear un filtro para los clientes que han comprado determinados elementos utilizando la sintaxis siguiente en el filtro de tabla anidada: [ProductName]=’Water Bottle’ OR ProductName=’Water Bottle Cage'.

También puede filtrar por la existencia de un valor determinado en la tabla anidada usando las palabras clave EXISTS o NOT EXISTS y una subconsulta. Esto le permite crear condiciones como EXISTS (SELECT * FROM Products WHERE ProductName=’Water Bottle’). EXISTS SELECT(<subquery>) devuelve true si la tabla anidada contiene al menos una fila que incluye el valor Water Bottle.

Puede combinar condiciones en la tabla de casos con condiciones en la tabla anidada. Por ejemplo, la sintaxis siguiente incluye una condición en la tabla de casos (Age > 30), una subconsulta en la tabla anidada (EXISTS (SELECT * FROM Products)) y varias condiciones en la tabla anidada (WHERE ProductName=’Milk’ AND Quantity>2)).

(Age > 30 AND EXISTS (SELECT * FROM Products WHERE ProductName=’Milk’  AND Quantity>2) )

Cuando se termina de generar el filtro, Analysis Services evalúa el texto del mismo, después se traduce a una expresión DMX y por último se guarda con el modelo.

Para obtener instrucciones sobre cómo usar los cuadros de diálogo de filtro en Business Intelligence Development Studio, vea Cómo aplicar un filtro a un modelo de minería de datos.

Administrar filtros de modelo de minería de datos

El filtrado de modelos basado en datos simplifica en gran medida la tarea de administrar estructuras y modelos de minería de datos porque permite crear fácilmente varios modelos basados en la misma estructura. También puede realizar rápidamente copias de modelos de minería de datos existentes y, a continuación, cambiar sólo la condición de filtro. A continuación se indican algunos aspectos a tener en cuenta para administrar filtros de modelos:

  • Para determinar el filtro aplicado a un modelo, vea la propiedad Filter del modelo de minería de datos.

  • Puede cambiar el nombre del modelo para reflejar el contenido del filtro. Esto facilita indicar los modelos relacionados de manera independiente.

  • La expresión de filtro se guarda como un script almacenado con la tabla anidada o el modelo de minería de datos asociado. Si elimina el texto del filtro, sólo podrá restaurarlo si vuelve a crear manualmente la expresión de filtro. Por consiguiente, si crea expresiones de filtro complejas, debería crear una copia de seguridad del texto del filtro.

  • Siempre que cambie o agregue una expresión de filtro, debe volver a procesar la estructura y el modelo para ver los efectos del filtro.

Para obtener más información sobre la sintaxis de filtros y los ejemplos de expresiones de filtro, vea Sintaxis y ejemplos del filtro de modelos (Analysis Services: Minería de datos).

Para obtener información sobre cómo usar filtros de modelos al probar un modelo de minería de datos, vea Medir la precisión del modelo de minería de datos (Analysis Services - Minería de datos).