Foxit PDF IFilter v1.0 - 大量PDF文档索引工具
10月 04, 07 by LiGht 人气指数:130 ℃
还记得上次给大家介绍的Foxit PDF Reader、Foxit PDF Editor两个软件吗?现在这儿又有一个Foxit出品的PDF文档索引工具——Foxit PDF IFilter。
Foxit PDF IFilter旨在帮助用户对大量的PDF文档进行索引,从而使用户快速搜索到PDF文档内的文本。这里所指的PDF文档可以是文件,也可以邮件附件或数据记录。Foxit PDF IFilter支持以下微软产品:Windows索引服务,MSN桌面搜索,IIS,SharePoint Portal Server, Windows SharePoint Services, Site Server,Exchange Server,SQL Server及其它基于微软搜索技术之上的产品。
Foxit PDF IFilter 是全文本搜索引擎的一个组件。通常搜索引擎分两个步骤来工作:
步骤1,搜索引擎首先遍历一个指定的位置,比如一个文件目录或数据库,然后在后台为所有的文档或最新更改过的文档进行索引,并建立内部数据来存储索引结果。
步骤2,用户指定想要搜索的关键词,接到搜索请求后,搜索引擎快速查阅索引结果,将所有包含关键词的文档反馈给用户。
在步骤1中,搜索引擎本身并不会识别PDF文档格式。因此,它要通过windows 注册表来查询一个相关的PDF IFilter, 那就是Foxit PDF IFilter. Foxit PDF IFilter 识别 PDF 格式。它可以从文档中过滤掉格式,抽取出文本,然后返回给搜索引擎。关于IFilter说明的更多信息,可以查看Microsoft Web site网站。
功能优势
- 与用户现有的Windows操作系统和各索引工具相兼容。
- 为搜索位于本地计算机,本地网络或企业内部网内的PDF文档,提供了一个简易的解决方案。
- 极大的提高了精确定位文本信息的能力。
- 比同类竞争产品更小巧快速。
- 支持包含有中文/日文/韩文语言的PDF文档。
- 支持源真正的64-bitCPU代码。
- 支持多线程,可以充分利用服务器中的多个CPU,极大地提高索引效率。
安装说明:
- 首先下载PDF IFilter。
- 停止所有当前运行的各相关的客户端程序(如各个搜索引擎)。
- 卸载旧版的Foxit PDF IFilter(如果你曾经有在你的机器上安装过)。
- 双击下载的文件,按照屏幕提示安装。
- 安装完毕,就可以启动所有相关的客户端程序了。
- 如果你使用的是SharePoint, 那么要在SharePoint搜索设置中手动地把PDF 文件类型添加到它的搜索文件类型中,因为SharePoint 的默认搜索设置中没有PDF文件类型。
- 最后重新索引你的系统,就可以开始用Foxit PDF IFilter工作了。
附加注释
由于Foxit PDF IFilter只是作为各个搜索引擎中一个组件,因此Foxit PDF IFilter 并没有自己的用户界面。 搜索引擎主要负责解析返回的文本,然后将文本信息展示给用户。
你在安装Foxit PDF IFilter时,安装程序会将一个名叫“fpdfcjk.bin”的语言文件解压到安装目录下. 这个语言文件可以帮助你索引所有包含中日韩字体的的PDF文档。
Tags: PDF
