文件类型和 IFilter 引用 (Office SharePoint Server)

爬网程序若要能够对内容项进行爬网,必须满足以下条件:

  • 由三到四个字母组成的文件扩展名所标识的文件类型必须在搜索管理中的“管理文件类型”页上存在。

  • 索引服务器必须安装用于该文件类型的 IFilter。

  • 文件扩展名必须与索引服务器上的 IFilter 相关联。

Microsoft Office SharePoint Server 2007 包含若干个 IFilter。但有些随 Office SharePoint Server 2007 一起安装的 IFilter 并没有将对应的文件扩展名添加到“管理文件类型”页上。在这种情况下,您只需要将文件扩展名添加到“管理文件类型”页即可。此外,在索引服务器上安装 IFilter 后,该 IFilter 会关联大多数文件类型。有关如何将某些文件类型与索引服务器上的正确 IFilter 相关联的步骤,请参阅安装 Microsoft Filter Pack (Office SharePoint Server 2007)

其他 IFilter 可从 Microsoft 和第三方供应商那里获得。如果需要,软件开发人员可以针对新文件类型创建 IFilter。如果没有 IFilter 可用于您要进行爬网的文件类型,则 Office SharePoint Server 2007 中的索引只能包括文件的属性,而无法包括文件的内容。有关详细信息,请参阅关于 IFilter (Office SharePoint Server 2007)

下表列出了默认情况下安装的 IFilter 所支持的文件类型,这些文件类型默认情况下位于“管理文件类型”页上,并且文件扩展名与索引服务器上的某个 IFilter 相关联。

文件扩展名 默认关联 自动包含在“管理文件类型”页中

ascx

asm

asp

aspx

bat

c

cmd

cpp

css

cxx

def

dic

doc

docm

docx

dot

eml

exch

h

hhc

hht

hpp

hta

htm

html

htw

htx

jhtml

jsp

lnk

mht

mhtml

mpx

msg

mspx

nsf

odc

one

php

pot

pps

ppt

pptm

pptx

pub

stm

tif

tiff

trf

txt

url

vdx

vsd

vss

vst

vsx

vtx

xlb

xlc

xls

xlsm

xlsx

xlt

xml

另请参见

概念

IFilter 和协议处理程序 (Office SharePoint Server 2007)
关于 IFilter (Office SharePoint Server 2007)
安装 Microsoft Filter Pack (Office SharePoint Server 2007)
限制或增加被爬网的内容的数量 (Office SharePoint Server)