设置域属性

本主题介绍如何在 Data Quality Services (DQS) 中设置域属性。

本主题内容

  • 开始之前:

    必备条件

    安全性

  • 设置域属性

  • 跟进:设置域属性后

  • 域属性

    域名和说明

    数据类型

    使用前导值

    规范化字符串

    将输出格式设置为

    语言

    启用拼写检查器

    禁用语法错误算法

开始之前

必备条件

若要为域设置属性,您必须创建了知识库和域。

安全性

权限

您必须对 DQS_MAIN 数据库具有 dqs_kb_editor 或 dqs_administrator 角色,才能设置域属性。

用于“返回首页”链接的箭头图标[返回页首]

设置域属性

  1. 通过在域管理活动中打开某一知识库(请参阅打开知识库),然后在**“域”**列表中选择适当的域,对某一现有域设置属性。 默认情况下,将显示“域属性”页。

  2. 在按照创建域中所述创建一个新域后设置其属性。

  3. 单击**“完成”**以完成域管理活动,如结束域管理活动中所述。

用于“返回首页”链接的箭头图标[返回页首]

跟进:设置域属性后

在设置域属性后,您可以对域执行其他域管理任务,可以执行知识发现以便向域添加知识,或者可以向域添加匹配策略。 有关详细信息,请参阅执行知识发现管理域创建匹配策略

用于“返回首页”链接的箭头图标[返回页首]

域属性

域名和说明

一旦创建了一个域后,就可以更改该域名或说明。 对于知识库而言,域名必须唯一。 说明最多可以有 256 个字符。

数据类型

在您选择域后,为域中的值选择以下数据类型之一:String(默认设置)、DateIntegerDecimal。 在创建了域之后,可以查看数据类型,但不能更改数据类型。 为某个域选择的数据类型将定义可映射到该域的源数据的类型。 有关 DQS 中四个域数据类型的支持的数据类型的信息,请参阅DQS 域支持的 SQL Server 和 SSIS 数据类型

使用前导值

选中此复选框可指定将输出一组同义词中的前导值,而非是其同义词的值。 取消选择**“使用前导值”**可指定每个同义词值以其正确或更正形式输出,并且不会被其组的前导值替换。

规范化字符串

如果数据类型为 String,则选中此复选框以忽略源数据中的特殊字符。 DQS 会在数据加载到域中时在内部用 null 或空格替换特殊字符。 冒号、连字符、句点、双引号或分号将替换为空格。 单引号将替换为 null。 使用 null 可使字符串的两个部分成为一体。

忽略字符串值中的特殊字符可提高匹配精确性。 可以通过使用 null 或空格替换特殊字符来增加两个字符串之间的相似性分数。 标点符号或其他符号可以轻松地在不同字符串之间进行区分。 通过在内部替换特殊字符,可使分数能够超过 DQS 中的最低匹配阈值,导致尚未匹配的两个字符串最终匹配。 但是,您是否选择忽略特殊字符可能依赖于您对其执行匹配的数据类型。 例如,当您在英制度量系统中使用数据时,如果双引号表示英寸,单引号表示英尺,则忽略产品数据中的双引号和单引号可能会导致误报。

当在发现、匹配策略、匹配项目和清理项目活动的数据处理阶段中加载和索引数据时,执行规范化。 如果启用,规范化和基于字词的关系转换都是在分析前的预处理阶段中进行的。 在应用计算字符串之间相似性的任何算法前对每个域执行它们。 如果请求复合域分析,将在规范化和基于字词的关系转换前执行分析,因为分隔符分析要求符号。 其他操作(例如域规则和域值更改)将会在转换后执行。 在 DQS 中内部替换特殊字符不会更改结果数据。

将输出格式设置为

选择在输出域中的数据值时要采用的格式。 此格式设置特定于选定的数据类型,如下面的列表中所示。 选择**“无”**意味着将不会在列表中应用任何格式。

  • 对于字符串值,您可以指定字符串将是输出为大写、小写还是首字母大写。

  • 对于日期值,您可以指定日、月和年的格式。

  • 对于整数值,您可以指定要应用的格式掩码的类型。

  • 对于小数值,您可以指定要应用的格式掩码的精确性和类型。

语言

如果数据类型为 String,则选择为用于拼写检查器操作而要将域与之关联的语言。 此选择仅适用于拼写检查器,因为拼写检查器结果取决于所用语言。 此选择仅适用于数据类型为字符串的单一域。 语言属性与复合域无关。 复合域中每个部分的语言由相关的单一域确定。

英语为默认语言。 将**“语言”属性设置为“其他”**将为该域禁用拼写检查器。

提示提示

如果您的语言未列在“语言”下拉列表中,则必须选择“其他”。 这可确保 DQS 根据域中可用的知识(域规则、域值、TBR、匹配规则),清理和消除未列出的语言数据的重复项。 有关清理和匹配未列出的语言的详细信息,请参阅此博客文章:DQS 进行清理和匹配时所支持的语言

启用拼写检查器

如果数据类型是 String,则单击可为该域启用 DQS 拼写检查器。 拼写检查器仅适用于数据类型为字符串的域。 **“启用拼写检查器”**复选框使拼写检查器仅适用于与该复选框相关联的单一域。 该复选框不适用于复合域。

拼写检查器会对域中的值建议语法和验证更正。 有关详细信息,请参阅使用 DQS 拼写检查器

禁用语法错误算法

如果数据类型为 String,则选择此选项可指定在清理期间在域中 DQS 将不会标识语法错误。 在为该域标识语法错误无关紧要时选中此复选框。 例如,标识语法错误可能对于序列号无意义。 此控制仅可用于字符串数据类型。 DQS 不会检查非字符串数据类型是否有语法错误。

用于“返回首页”链接的箭头图标[返回页首]