部署全文索引

 

上一次修改主题: 2005-05-12

请使用 Exchange 系统管理器部署全文索引。部署涉及下列任务:

  • 创建全文索引
  • 优化全文索引
  • 执行完全填充
  • 为增量填充设置日程安排
  • 启用全文索引查询
  • 通知用户

在这些任务中,最耗费服务器资源的任务是完全填充过程,对于小数据库而言,此过程可能需要几分钟的时间,而对于大数据库而言,则可能需要几天的时间。但是,可以在上班期间后台运行填充过程,而不会对用户的系统响应时间产生显著影响。

创建全文索引

必须先为要编制索引的每个邮箱存储或公用文件夹存储创建初始索引(编录),然后才能使用全文索引。此过程将创建必需的文件结构,而在优化索引时将修改此结构。

有关如何创建初始全文索引的详细步骤,请参阅如何创建初始全文索引

优化全文索引

此部分说明如何在运行 Exchange Server 2003 的计算机上优化全文索引。通过将频繁存取的文件分散在 RAID 阵列上,可以增强系统性能。

全文索引文件有五种主要类别。默认情况下,这些文件安装在系统驱动器上,该驱动器通常没有 RAID 阵列的输入/输出 (I/O) 吞吐量。安排这些文件的磁盘位置(如下表所述)可以优化全文索引的性能。某些情况下,本主题为在群集拓扑结构中和非群集拓扑结构中移动文件提供了不同的过程。以下是全文索引文件的主要类别:

  • 编录 主索引。在 Exchange Server 2003 中,每个邮箱存储或公用文件夹存储都只有一个编录。
  • 属性存储 一个数据库,包含已在编录中编制索引的项目的各个属性。每个服务器都只有一个属性存储。
  • 属性存储日志 与属性存储数据库关联的日志文件。
  • 临时文件 包含 Microsoft Search 服务所使用的临时信息的文件。
  • 收集日志 包含索引服务的日志信息的日志文件。对于每个索引,都存在一组日志。

本部分涉及用于移动文件的下列工具:

  • Pstoreutl 位于 Program Files\Common Files\System\MSSearch\Bin。
  • SetTempPath 位于 Program Files\Common Files\System\MSSearch\Bin。
  • Catutil 位于 Program Files\Common Files\System\MSSearch\Bin。

全文索引文件的建议位置

文件类型 建议位置 如何指定位置

编录

RAID 阵列

在使用 Exchange 系统管理器创建编录时,指定 RAID 阵列上的一个位置。

note注意:
如果已经在其他位置创建了索引,请使用 Catutil 工具移动它。

属性存储

RAID 阵列

使用 Pstoreutl 工具。

属性存储日志

属性存储所在的 RAID 阵列

使用 Pstoreutl 工具。

临时文件

RAID 阵列

note注意:
在群集上,请将这些文件放置在不会发生故障转移的驱动器上,例如本地驱动器、被配置为仅在指定计算机上运行的 RAID 阵列或存储区域网络 (SAN) 上的驱动器。

使用 SetTempPath 工具。

收集日志

留在默认位置,或者移动到需要的任何位置。

在“StreamLogsDirectory”注册表项中指定位置。

有关如何优化全文索引的详细步骤,请参阅如何优化全文索引

移动属性存储和属性存储日志

在服务器上创建第一个索引时,Exchange Server 2003 将在 Exchange Server 2003 系统驱动器上创建一个新的属性存储数据库。若要提高性能,请将属性存储数据库文件移动到 RAID 阵列。对于每个服务器,只需移动一次属性存储和属性存储日志,因为服务器上的所有索引都使用同一个属性存储。

有关如何在非群集环境中移动属性存储的详细步骤,请参阅如何在非群集环境中移动全文索引的属性存储和属性存储日志

有关如何在群集环境中移动属性存储的详细步骤,请参阅如何在群集环境中移动全文索引的属性存储和属性存储日志

移动临时目录

默认情况下,收集和筛选所产生的临时文件位于 Exchange Server 2003 系统驱动器上,该驱动器通常达不到 RAID 阵列的 I/O 吞吐量。使用 SetTempPath 工具将临时目录移动到 RAID 阵列。对于每个服务器,只需移动一次此目录,因为服务器上的所有索引都使用同一个临时目录。

有关如何移动 Microsoft Search 服务临时目录的详细步骤,请参阅如何移动 Microsoft 搜索服务器临时目录

移动索引(编录)

索引应该位于 RAID 阵列上。如果在创建索引时没有指定此位置,请使用 Catutil 工具移动它。

有关如何移动索引的详细步骤,请参阅如何移动全文索引的索引(编录)

移动收集日志

收集日志是在 Exchange Server 2003 系统驱动器上创建的,该驱动器通常达不到 RAID 阵列的 I/O 吞吐量。可以选择将收集日志留在默认位置上,也可以在更高性能的驱动器上指定位置。

有关如何移动收集日志的详细步骤,请参阅如何移动全文索引的收集日志

增大邮件大小限制值

默认情况下,索引包括的邮件(包括附件)的大小不超过 16 MB。因此,带有大附件的邮件有可能被排除在索引以外,并且不会出现在用户的搜索结果中。为了避免出现性能问题,建议将此限制值增大到最大设置 4,000 MB,以便能对大型邮件和附件编制索引。

有关如何增加邮件大小限制的详细步骤,请参阅如何增加全文索引的邮件大小限制

设置检查点

强烈建议使用 Microsoft Exchange 2000 Server SP2 附带的检查点脚本,以防止可能发生的索引问题。如果 Microsoft Search 服务在对索引进行增量填充期间异常终止,则可能无法正确地对某些文件夹和邮件编制索引。(增量填充是使用自上次填充以来已经改变的数据更新现有索引的过程。)检查点通过维护编录目录中的下列备份文件来纠正此问题:

  • 两个检查点记录文件:<catalog>.chk1.gthr 和 <catalog>.chk2.gthr.
  • 存储在 Save 子目录中的已知最为完整的、未损坏的一组编录文件,大约 13 个。

默认情况下不启用检查点,因为它需要大量的额外磁盘空间。对于数据库中的每个文档,额外的文件大小大约是 200 字节。例如,数据库中的 5,000,000 个邮件或文档产生的检查点文件的总大小为 1 GB。这些文件的大小随数据库中文档数的增大而增大。在运行检查点脚本之前,应该确保有足够的磁盘空间。建议在保存全文索引编录的磁盘上至少有 15% 的可用磁盘空间。

有关如何设置检查点的详细步骤,请参阅如何设置全文索引的检查点

执行完全填充

在创建索引之后,必须运行完全填充(也称为“爬网”),以便用数据填充索引。全文索引的资源使用设置位于服务器“属性”对话框的“全文索引”选项卡上。默认情况下,它设置为“低”。建议使用默认设置。更高的设置带来的好处很少,并且可能会降低用户访问 Exchange Server 2003 服务器的速度。

将资源使用设置为“低”时,填充过程在后台运行,因此可以在上班期间执行它。填充过程的线程使用空闲处理时间。在系统上,用户活动是优先的。因为全文索引仅使用那些不使用就处于空闲状态的周期,所以它不会对用户访问服务器的速度产生显著影响。预期填充过程的正常效果是 CPU 使用率接近 100%。

note注意:
如果在 Microsoft Search 服务执行完全填充或增量填充时,遇到 Exchange 服务器的性能问题,则可以将资源使用降到“最低”。通过将资源使用设置为“最低”,可以进一步减少 Microsoft Search 服务可以使用的资源量。因此,完成完全填充或增量填充需要更长的时间,但是不会丢失任何数据。

有关如何启动完全填充的详细步骤,请参阅如何启动全文索引完全填充

初始完全填充可能需要很长时间。使用典型的 Exchange Server 2003 配置时,填充性能通常是每秒 10 到 20 封邮件。基于硬件配置、邮件的类型和大小以及可用的服务器资源,性能将有所不同。因此,完全填充所需的总时间可以从几分钟(对于小数据库)到几天(对于大数据库)。

服务器上文档的内容语言也会影响填充所需时间。例如,在包含主要以东亚语言编写的文档的服务器上填充索引所用的时间,可以是在包含以西欧语言编写的文档的服务器上所用时间的五倍多。如果包含 Internet 新闻复制的文件夹还包含 UUEncode 格式的邮件,也会大大延长填充时间。

有关如何查看填充过程状态的详细步骤,请参阅如何查看全文索引填充的状态

有关如何暂停完全填充的详细步骤,请参阅如何暂停全文索引完全填充

设置增量填充的日程安排

确定要运行增量填充以更新索引的频率。由于增量填充使用和完全填充相同的方式在后台运行,因此频繁的更新不会显著影响用户的系统响应时间。虽然应该将增量填充安排为每天至少发生一次,但是您可能希望安排更频繁的更新,因为索引的最新状态只不过是上次被填充时的状态。还应该考虑完成增量填充所需的时间量。例如,典型的日程安排将增量更新设置在每小时的开头。但是,如果更新的持续时间超过一小时,则下一次增量填充将从下一小时的开头开始。

增量填充的日程安排仅确定填充过程能够开始的时间,对填充过程没有时间限制。因此,增量填充有可能持续进行,在超过日程安排的时间后完成。

note注意:
通常,如果邮箱存储或公用文件夹存储为 6 GB 或更小,则可以每小时执行一次增量更新。如果存储大于 6 GB,或者服务器的内存使用率很高,则可能需要以较小的频率更新索引。

有关如何设置增量填充日程安排的详细步骤,请参阅如何设置全文索引增量填充日程安排

启用全文索引查询

在完成初始填充和至少一次增量填充之后,启用索引以便用户可以开始利用索引进行全文搜索。

有关如何启用全文索引的使用的详细步骤,请参阅如何启用全文索引查询

通知并指导用户

启用查询后,通知用户他们可以使用索引进行搜索,并对他们进行培训,使他们能够了解在运行全文索引搜索时所能预计的搜索结果。例如,要通知用户,可以向用户发出电子邮件通告。