Spiga

Foxit PDF IFilter v1.0 - 大量PDF文档索引工具

10月 04, 07 by LiGht 人气指数:130 ℃



还记得上次给大家介绍的Foxit PDF ReaderFoxit PDF Editor两个软件吗?现在这儿又有一个Foxit出品的PDF文档索引工具——Foxit PDF IFilter。

Foxit PDF IFilter旨在帮助用户对大量的PDF文档进行索引,从而使用户快速搜索到PDF文档内的文本。这里所指的PDF文档可以是文件,也可以邮件附件或数据记录。Foxit PDF IFilter支持以下微软产品:Windows索引服务,MSN桌面搜索,IIS,SharePoint Portal Server, Windows SharePoint Services, Site Server,Exchange Server,SQL Server及其它基于微软搜索技术之上的产品。

Foxit PDF IFilter 是全文本搜索引擎的一个组件。通常搜索引擎分两个步骤来工作:

步骤1,搜索引擎首先遍历一个指定的位置,比如一个文件目录或数据库,然后在后台为所有的文档或最新更改过的文档进行索引,并建立内部数据来存储索引结果。

步骤2,用户指定想要搜索的关键词,接到搜索请求后,搜索引擎快速查阅索引结果,将所有包含关键词的文档反馈给用户。

在步骤1中,搜索引擎本身并不会识别PDF文档格式。因此,它要通过windows 注册表来查询一个相关的PDF IFilter, 那就是Foxit PDF IFilter. Foxit PDF IFilter 识别 PDF 格式。它可以从文档中过滤掉格式,抽取出文本,然后返回给搜索引擎。关于IFilter说明的更多信息,可以查看Microsoft Web site网站。

功能优势

  1. 与用户现有的Windows操作系统和各索引工具相兼容。
  2. 为搜索位于本地计算机,本地网络或企业内部网内的PDF文档,提供了一个简易的解决方案。
  3. 极大的提高了精确定位文本信息的能力。
  4. 比同类竞争产品更小巧快速。
  5. 支持包含有中文/日文/韩文语言的PDF文档。
  6. 支持源真正的64-bitCPU代码。
  7. 支持多线程,可以充分利用服务器中的多个CPU,极大地提高索引效率。

安装说明:

  1. 首先下载PDF IFilter。
  2. 停止所有当前运行的各相关的客户端程序(如各个搜索引擎)。
  3. 卸载旧版的Foxit PDF IFilter(如果你曾经有在你的机器上安装过)。
  4. 双击下载的文件,按照屏幕提示安装。
  5. 安装完毕,就可以启动所有相关的客户端程序了。
  6. 如果你使用的是SharePoint, 那么要在SharePoint搜索设置中手动地把PDF 文件类型添加到它的搜索文件类型中,因为SharePoint 的默认搜索设置中没有PDF文件类型。
  7. 最后重新索引你的系统,就可以开始用Foxit PDF IFilter工作了。

附加注释

由于Foxit PDF IFilter只是作为各个搜索引擎中一个组件,因此Foxit PDF IFilter 并没有自己的用户界面。 搜索引擎主要负责解析返回的文本,然后将文本信息展示给用户。

你在安装Foxit PDF IFilter时,安装程序会将一个名叫“fpdfcjk.bin”的语言文件解压到安装目录下. 这个语言文件可以帮助你索引所有包含中日韩字体的的PDF文档。

32位 | 64位 | 官方网站

Tags:

相关日志:

This entry no have comments... but you can be first.

Leave a Reply