关于 IFilter (Search Server 2008)

更新时间: 2009年4月

应用到: Microsoft Search Server 2008

 

上一次修改主题: 2015-03-09

提示

除非另有说明,否则本文中的信息对 Microsoft Search Server 2008 和 Microsoft Search Server 2008 Express 均适用。

在可以将所爬网的每个文件中包含的内容添加到内容索引之前,必须先去掉其格式。文件的格式取决于创建该文件的应用程序。例如,在 Microsoft Office Word 中创建的文档与在 Microsoft Office PowerPoint 中创建的幻灯片格式不同。Search Server 2008 索引编制引擎使用 IFilter 在从已爬网项提取的内容中删除内嵌的格式。

下表根据索引服务器上是否安装了 IFilter 以及文件类型是否已在搜索管理的“管理文件类型”页上列出,汇总了索引编制系统的行为。

是否安装了 IFilter? 文件类型是否已在“管理文件类型”页上列出? 结果

将对文件中的内容及其属性编制索引。

不对文件中的内容编制索引,但对其属性编制索引。

既不对文件中的内容编制索引,也不对其属性编制索引。

IFilter 和文件类型

每个 IFilter 都必须与它可以筛选的文件类型关联。文件的类型由三个或四个字母的文件扩展名标识。您可以在搜索管理的“管理文件类型”页上查看 Search Server 已安装了对应 IFilter 的文件类型的列表。如果对于您要进行爬网的某个文件类型没有 IFilter,则 Search Server 中的内容索引只能包括该文件的属性,而不包括该文件的内容。如果您希望对默认情况下未安装 IFilter 的内容编制索引,则必须安装和注册对应于该文件类型的 IFilter。

下表列出了“管理文件类型”页上的默认设置。其中包括 IFilter 默认情况下支持(但未启用)的文件类型。此外,“管理文件类型”页上列出了默认情况下不具备 IFilter 支持的一些文件类型。有关如何更新“管理文件类型”页的信息,请参阅指定要进行爬网的文件类型 (Search Server 2008)

文件扩展名 默认的 IFilter 支持 默认的文件类型包含

ascx

asm

asp

aspx

bat

c

cmd

cpp

css

cxx

def

dic

doc

docm

docx

dot

eml

exch

h

hhc

hht

hpp

hta

htm

html

htw

htx

jhtml

jsp

lnk

mht

mhtml

mpx

msg

mspx

nsf

odc

one

php

pot

pps

ppt

pptm

pptx

pub

stm

tif

tiff

trf

txt

url

vdx

vsd

vss

vst

vsx

vtx

xlb

xlc

xls

xlsm

xlxs

xlt

xml

提示

Adobe 提供了使 Office SharePoint Server 2007 能够对 Adobe 可移植文档格式 (PDF) 编制索引的 IFilter。有关安装和配置这些 IFilter 的详细信息,请参阅在 SharePoint Portal Server 2003 或 SharePoint Server 2007 中搜索门户网站时,对于搜索结果中列出的 Adobe PDF 文档不显示图标 (https://go.microsoft.com/fwlink/?linkid=144596&clcid=0x804)。

Microsoft Filter Pack

Microsoft 提供了一个筛选包,其中包含一组 IFilter,它们是对随 Search Server 2008 自动安装的 IFilter 的补充。Microsoft Filter Pack 为以下文件格式安装并注册 IFilter:.docx, .docm, .pptx, .pptm, .xlsx, .xlsm, .xlsb, .zip, .one, .vdx, .vsd, .vss, .vst, .vdx, .vsx 和 .vtx。

有关详细信息,请参阅安装 Microsoft Filter Pack (Search Server 2008)

自定义筛选器

如果您必须要进行爬网的文档不属于随 Search Server 提供或 Microsoft Filter Pack 中包含的 IFilter 所支持的文件类型,则必须在索引服务器上安装适当的 IFilter。请与创建该应用程序的公司核实,了解它是否具有适用于 Microsoft 搜索产品的 IFilter。如果该应用程序是在您自己组织内部创建的,则创建或维护应用程序的软件开发人员可以为其创建 IFilter。有关详细信息,请参阅 Microsoft Search Server 2008 软件开发工具包 (SDK)(该链接可能指向英文页面) (https://go.microsoft.com/fwlink/?linkid=141179&clcid=0x804)(该链接可能指向英文页面)。

安装 IFilter 之后,您还必须向操作系统注册 IFilter,并将其与它可处理的文件类型关联。对于每个 IFilter,安装和注册步骤有所不同。有关详细信息,请阅读 IFilter 的文档。

另请参阅

概念

安装 Microsoft Filter Pack (Search Server 2008)
关于协议处理程序 (Search Server 2008)