关于 IFilter (Search Server 2008)
更新时间: 2009年4月
应用到: Microsoft Search Server 2008
上一次修改主题: 2015-03-09
提示
除非另有说明,否则本文中的信息对 Microsoft Search Server 2008 和 Microsoft Search Server 2008 Express 均适用。
在可以将所爬网的每个文件中包含的内容添加到内容索引之前,必须先去掉其格式。文件的格式取决于创建该文件的应用程序。例如,在 Microsoft Office Word 中创建的文档与在 Microsoft Office PowerPoint 中创建的幻灯片格式不同。Search Server 2008 索引编制引擎使用 IFilter 在从已爬网项提取的内容中删除内嵌的格式。
下表根据索引服务器上是否安装了 IFilter 以及文件类型是否已在搜索管理的“管理文件类型”页上列出,汇总了索引编制系统的行为。
是否安装了 IFilter? | 文件类型是否已在“管理文件类型”页上列出? | 结果 |
---|---|---|
是 |
是 |
将对文件中的内容及其属性编制索引。 |
否 |
是 |
不对文件中的内容编制索引,但对其属性编制索引。 |
否 |
否 |
既不对文件中的内容编制索引,也不对其属性编制索引。 |
IFilter 和文件类型
每个 IFilter 都必须与它可以筛选的文件类型关联。文件的类型由三个或四个字母的文件扩展名标识。您可以在搜索管理的“管理文件类型”页上查看 Search Server 已安装了对应 IFilter 的文件类型的列表。如果对于您要进行爬网的某个文件类型没有 IFilter,则 Search Server 中的内容索引只能包括该文件的属性,而不包括该文件的内容。如果您希望对默认情况下未安装 IFilter 的内容编制索引,则必须安装和注册对应于该文件类型的 IFilter。
下表列出了“管理文件类型”页上的默认设置。其中包括 IFilter 默认情况下支持(但未启用)的文件类型。此外,“管理文件类型”页上列出了默认情况下不具备 IFilter 支持的一些文件类型。有关如何更新“管理文件类型”页的信息,请参阅指定要进行爬网的文件类型 (Search Server 2008)。
文件扩展名 | 默认的 IFilter 支持 | 默认的文件类型包含 |
---|---|---|
ascx |
是 |
是 |
asm |
是 |
否 |
asp |
是 |
是 |
aspx |
是 |
是 |
bat |
是 |
否 |
c |
是 |
否 |
cmd |
是 |
否 |
cpp |
是 |
否 |
css |
是 |
否 |
cxx |
是 |
否 |
def |
是 |
否 |
dic |
是 |
否 |
doc |
是 |
是 |
docm |
是 |
是 |
docx |
是 |
是 |
dot |
是 |
是 |
eml |
是 |
是 |
exch |
否 |
是 |
h |
是 |
否 |
hhc |
是 |
否 |
hht |
是 |
否 |
hpp |
是 |
否 |
hta |
是 |
否 |
htm |
是 |
是 |
html |
是 |
是 |
htw |
是 |
否 |
htx |
是 |
否 |
jhtml |
否 |
是 |
jsp |
否 |
是 |
lnk |
是 |
否 |
mht |
是 |
是 |
mhtml |
是 |
是 |
mpx |
是 |
否 |
msg |
是 |
是 |
mspx |
否 |
是 |
nsf |
否 |
是 |
odc |
是 |
是 |
one |
否 |
否 |
php |
否 |
是 |
pot |
是 |
否 |
pps |
是 |
否 |
ppt |
是 |
是 |
pptm |
是 |
是 |
pptx |
是 |
是 |
pub |
是 |
是 |
stm |
是 |
否 |
tif |
是 |
是 |
tiff |
否 |
是 |
trf |
是 |
否 |
txt |
是 |
是 |
url |
否 |
是 |
vdx |
否 |
是 |
vsd |
否 |
是 |
vss |
否 |
是 |
vst |
否 |
是 |
vsx |
否 |
是 |
vtx |
否 |
是 |
xlb |
是 |
否 |
xlc |
是 |
否 |
xls |
是 |
是 |
xlsm |
是 |
是 |
xlxs |
是 |
是 |
xlt |
是 |
否 |
xml |
是 |
是 |
提示
Adobe 提供了使 Office SharePoint Server 2007 能够对 Adobe 可移植文档格式 (PDF) 编制索引的 IFilter。有关安装和配置这些 IFilter 的详细信息,请参阅在 SharePoint Portal Server 2003 或 SharePoint Server 2007 中搜索门户网站时,对于搜索结果中列出的 Adobe PDF 文档不显示图标 (https://go.microsoft.com/fwlink/?linkid=144596&clcid=0x804)。
Microsoft Filter Pack
Microsoft 提供了一个筛选包,其中包含一组 IFilter,它们是对随 Search Server 2008 自动安装的 IFilter 的补充。Microsoft Filter Pack 为以下文件格式安装并注册 IFilter:.docx, .docm, .pptx, .pptm, .xlsx, .xlsm, .xlsb, .zip, .one, .vdx, .vsd, .vss, .vst, .vdx, .vsx 和 .vtx。
有关详细信息,请参阅安装 Microsoft Filter Pack (Search Server 2008)。
自定义筛选器
如果您必须要进行爬网的文档不属于随 Search Server 提供或 Microsoft Filter Pack 中包含的 IFilter 所支持的文件类型,则必须在索引服务器上安装适当的 IFilter。请与创建该应用程序的公司核实,了解它是否具有适用于 Microsoft 搜索产品的 IFilter。如果该应用程序是在您自己组织内部创建的,则创建或维护应用程序的软件开发人员可以为其创建 IFilter。有关详细信息,请参阅 Microsoft Search Server 2008 软件开发工具包 (SDK)(该链接可能指向英文页面) (https://go.microsoft.com/fwlink/?linkid=141179&clcid=0x804)(该链接可能指向英文页面)。
安装 IFilter 之后,您还必须向操作系统注册 IFilter,并将其与它可处理的文件类型关联。对于每个 IFilter,安装和注册步骤有所不同。有关详细信息,请阅读 IFilter 的文档。
另请参阅
概念
安装 Microsoft Filter Pack (Search Server 2008)
关于协议处理程序 (Search Server 2008)