Share via


Arquitectura lógica (Analysis Services - Minería de datos)

La minería de datos es un proceso que implica la interacción de varios componentes.

  • Puede tener acceso a orígenes de datos en una base de datos de SQL Server o cualquier otro origen de datos y usarlos para el entrenamiento, las pruebas o la predicción.

  • Defina las estructuras y los modelos utilizando SQL Server Data Tools (SSDT) o Visual Studio.

  • Administre los objetos de minería de datos y cree predicciones y consultas mediante SQL Server Management Studio.

  • Cuando la solución esté completa, puede implementarla en una instancia de Analysis Services.

El proceso de creación de estos objetos de la solución se ha descrito previamente en otro lugar. Para obtener más información, vea Soluciones de minería de datos.

En las secciones siguientes se describe la arquitectura lógica de los objetos de una solución de minería de datos.

Datos de origen de la minería de datos

Estructuras de minería de datos

Modelos de minería de datos

Objetos de minería de datos personalizados

Datos de origen de la minería de datos

Los datos que se usan en la minería de datos no se almacenan en la solución de minería de datos; solo se almacenan los enlaces. Los datos podrían residir en una base de datos creada en una versión anterior de SQL Server, en un sistema CRM o incluso en un archivo plano. Cuando se entrena la estructura o el modelo mediante un proceso, se crea un resumen estadístico de los datos y se almacena en una memoria caché que puede conservarse para usarse en operaciones posteriores, o puede eliminarse después del procesamiento. Para obtener más información, vea Estructuras de minería de datos (Analysis Services - Minería de datos).

Combine datos dispares dentro del objeto de vista del origen de datos (DSV) de Analysis Services, que proporciona una capa de abstracción sobre el origen de datos. También puede especificar combinaciones entre tablas o agregar tablas que tengan una relación de varios a uno para crear columnas de tabla anidadas. La definición de estos objetos, el origen de datos y la vista del origen de datos, se almacena en la solución con las extensiones de archivo *.ds y *.dsv. Para obtener más información acerca de cómo crear y usar orígenes de datos y vistas del origen del datos de Analysis Services, vea Tipos de orígenes de datos admitidos (SSAS multidimensional).

También puede definir y modificar orígenes de datos y vistas del origen de datos utilizando AMO o XMLA. Para obtener más información sobre cómo trabajar con estos objetos mediante programación, vea Información general de arquitectura lógica (Analysis Services - Datos multidimensionales).

Volver al principio

Estructuras de minería de datos

Una estructura de minería de datos es un contenedor de datos lógico que define el dominio de datos a partir del cual se generan los modelos de minería de datos. Una sola estructura de minería de datos puede admitir varios modelos de minería de datos.

Cuando tenga que usar los datos en la solución de minería de datos, Analysis Services leerá los datos del origen y genera una memoria caché de agregados y otra información. De forma predeterminada, esta memoria caché se mantiene para poder reutilizar datos de entrenamiento y admitir modelos adicionales. Si necesita eliminar la memoria caché, cambie la propiedad CacheMode en el objeto de estructura de minería de datos por el valor ClearAfterProcessing. Para obtener más información, vea Clases de minería de datos de AMO.

SQL Server 2012 Analysis Services (SSAS) también proporciona la capacidad de separar los datos en conjuntos de datos de prueba y de entrenamiento, para que pueda probar sus modelos de minería de datos en un conjunto de datos representativo y seleccionado de forma aleatoria. Los datos no se almacenan en realidad por separado; en su lugar, los datos de caso de la memoria caché de la estructura se marcan con una propiedad que indica si ese caso se utiliza para el entrenamiento o para las pruebas. Si la memoria caché se elimina, esta información no se puede recuperar.

Para obtener más información, vea Estructuras de minería de datos (Analysis Services - Minería de datos).

Una estructura de minería de datos puede contener tablas anidadas. Una tabla anidada proporciona detalles adicionales sobre el caso que se modela en la tabla de datos principal. Para obtener más información, vea Tablas anidadas (Analysis Services - Minería de datos).

Volver al principio

Modelos de minería de datos

Antes del procesamiento un modelo de minería de datos solo es una combinación de propiedades de metadatos. Estas propiedades especifican una estructura de minería de datos, especifican un algoritmo de minería de datos y definen una colección de parámetros y configuraciones de filtro que afectan al modo en que se procesan los datos. Para obtener más información, vea Modelos de minería de datos (Analysis Services - Minería de datos).

Al procesar el modelo, los datos de entrenamiento que se almacenan en la memoria caché de la estructura de minería de datos se utilizan para generar los patrones, según las propiedades estadísticas de los datos y la heurística definida por el algoritmo y sus parámetros. Esto se conoce como entrenar el modelo.

El resultado del entrenamiento es un conjunto de datos de resumen, contenido en el contenido del modelo, que describe los patrones encontrados y proporciona las reglas con las que generar predicciones. Para obtener más información, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

En escenarios limitados, la estructura lógica del modelo también se puede exportar a un archivo que representa las fórmulas y los enlaces de datos según un formato estándar, el lenguaje de marcado de modelado de predicción (PMML). Esta estructura lógica se puede importar en otros sistemas que utilizan PMML y el modelo así descrito puede utilizarse entonces para la predicción. Para obtener más información, vea Descripción de la instrucción Select (DMX).

Volver al principio

Objetos de minería de datos personalizados

Otros objetos que se usan en el contexto de un proyecto de minería de datos, como los gráficos de precisión o las consultas de predicción, no se conservan en la solución, pero se pueden incluir en un script mediante ASSL o se pueden generar con AMO.

Además, puede ampliar los servicios y las características disponibles en una instancia de Analysis Services agregando estos objetos personalizados:

  • Ensamblados personalizados
    Los ensamblados .NET pueden definirse mediante cualquier idioma compatible con COM o CLR y, a continuación registrarse con una instancia de SQL Server. Los archivos de ensamblado se cargan desde la ubicación definida por la aplicación ; en el servidor se guarda una copia junto con los datos. La copia del archivo de ensamblado se usa para cargar el ensamblado cada vez que se inicia el servicio.

    Para obtener más información, vea Administración de ensamblados de modelos multidimensionales.

  • Procedimientos almacenados personalizados
    La minería de datos de Analysis Services admite el uso de procedimientos almacenados para trabajar con objetos de minería de datos. Puede crear sus propios procedimientos almacenados para ampliar la funcionalidad y trabajar más fácilmente con los datos devueltos por las consultas de predicción y las consultas de contenido.

    Definir procedimientos almacenados

    Los procedimientos almacenados siguientes pueden usarse al realizar la validación cruzada.

    Procedimientos almacenados de minería de datos (Analysis Services - Minería de datos)

    Además, Analysis Services contiene muchos procedimientos almacenados del sistema que se usan internamente para la minería de datos. Aunque los procedimientos almacenados del sistema son para uso interno, es posible le resulten útiles. Microsoft se reserva el derecho de cambiar estos procedimientos almacenados según sea necesario; por consiguiente, para utilizarlos en producción, se recomienda crear consultas con DMX, AMO o XMLA.

  • Crear algoritmos de complemento
    Analysis Services proporciona un mecanismo para crear sus propios algoritmos y, después, agregar los algoritmos como un servicio de minería de datos en la instancia de servidor.

    Analysis Services utiliza las interfaces COM para comunicarse con los algoritmos de complemento. Para obtener más información sobre cómo implementar nuevos algoritmos, vea Algoritmos de complemento.

    Debe registrar cada nuevo algoritmo para poder usarlo. Para registrar un algoritmo, agregue los metadatos requeridos para los algoritmos en el archivo .ini de la instancia de Analysis Services. Debe agregar la información a cada instancia donde piense utilizar el nuevo algoritmo. Después de agregar el algoritmo, puede reiniciar la instancia y utilizar el conjunto de filas de esquema MINING_SERVICES para ver el nuevo algoritmo, incluidas las opciones y los proveedores que el algoritmo admite.

Volver al principio

Vea también

Referencia

Referencia de Extensiones de minería de datos (DMX)

Conceptos

Procesamiento de objetos del modelo multidimensional