数据类型(数据挖掘)

在 MicrosoftSQL ServerAnalysis Services 中创建挖掘模型或挖掘结构时,必须为挖掘结构中的每一列定义数据类型。数据类型告知数据挖掘引擎数据源中的数据是数值还是文本以及应如何处理数据。例如,如果数据源中包含数值数据,则可以指定是将数字作为整数处理还是使用小数位数来处理。

每种数据类型支持一种或多种内容类型。通过设置内容类型,您可以自定义在挖掘模型中如何处理或计算列中的数据。

例如,如果列中有数值数据,您可以选择将其作为数值数据类型或文本数据类型来处理。如果选择数值数据类型,则可以设置几种不同的内容类型:可以使数字离散化或者将数字作为连续值处理。有关所有内容类型的列表,请参阅内容类型(数据挖掘)

Analysis Services 支持挖掘结构列的以下数据类型:

数据类型

支持的内容类型

Text

Cyclical、Discrete、Discretized、Key Sequence、Ordered 和 Sequence

Long

Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time、Ordered、Sequence 和 Time

Classified

Boolean

Cyclical、Discrete 和 Ordered

Double

Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time、Ordered、Sequence 和 Time

Classified

Date

Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time 和 Ordered

注意注意

只有第三方算法支持 Time 和 Sequence 内容类型。支持 Cyclical 和 Ordered 内容类型,但大多数算法将它们视为离散值,不会进行特殊处理。

指定数据类型

如果直接使用数据挖掘扩展插件 (DMX) 创建挖掘模型,则可以在定义该模型时定义每一列的数据类型,同时 Analysis Services 将创建对应的包含指定数据类型的挖掘结构。如果通过使用向导创建挖掘模型或挖掘结构,Analysis Services 将建议一种数据类型,或者您可以从列表中选择一种数据类型。

更改数据类型

如果更改某一列的数据类型,则必须始终重新处理挖掘结构以及基于该结构的所有挖掘模型。有时候,如果更改数据类型,则可能无法再在特定的模型中使用该列。在这种情况下,Analysis Services 将在您重新处理该模型时引发一个错误,或者将处理该模型但忽略该特定列。