使用SQL Server 2008中的PDF文件进行文本搜索

我有SQL Server 2008 R2,并试图在PDF BLOB上实现全文搜索。

我已经从Adobe安装了iFilter并确认它已安装

运用

EXEC sp_help_fulltext_system_components 'filter';

过滤器.pdf E8978DA6-047F-4E3D-9C78-CDBE46041603
C: Program Files Adob​​e Adob​​e PDF用于64位平台 bin PDFFilter.dll的iFilter 11
11.0.1.36 Adob​​e Systems,Inc.

然后我为FT指数创建了全文目录并创建了FT指数

CREATE FULLTEXT INDEX ON Compliance_Updates
( 
FileDesc
 Language 1033,
 FileData
   TYPE COLUMN FileDataType
) 
 KEY INDEX PK_Compliance_Updates
     ON FT_Compliance_Updates; 

然后在添加一些PDF到表格后强制重建索引。 索引显示..

目录大小:0MB
物品数量:2
唯一的密钥数量:7
名称:FT_Compliance_Updates
最后人口日期:12/11/2013 09:36
人口状况:空闲

但是,当我执行以下搜索时,我得到零结果...

SELECT FileID, FileDesc, PubDate 
FROM Compliance_Updates 
WHERE CONTAINS(FileData, 'mortgage')

我尝试删除目录,删除所有表记录和索引(包括PK),重新运行iFilter安装

exec sp_fulltext_service 'load_os_resources', 1;
exec sp_fulltext_service 'verify_signature', 0;

重新启动SQL Server,重新创建索引和FT目录,似乎没有任何工作?


  • 版本11.x不适合我,但9.x工作。
  • 此外,您还需要在System的PATH变量末尾添加C:Program FilesAdobeAdobe PDF iFilter 9 for 64-bit platformsbin 。 开始>控制面板>系统>高级环境变量 - >系统变量 - >找到PATH

  • 版本11.x也不适用于我。 9.x作品:)很难在Adobe的网站上找到9.x 64位。 但在FTP上,您可以在这里找到它:ftp://ftp.adobe.com/pub/adobe/acrobat/win/9.x/


    FWIW,即使使用SQL Server 2014,我也无法使版本11.x工作,因此从上面友好提供的FTP链接下载了9.x版本。 9.x版本似乎仍然是一条路,因为它也适用于我! :^)

    链接地址: http://www.djcxy.com/p/55875.html

    上一篇: text search with PDF files in SQL Server 2008

    下一篇: Search text in stored procedure in SQL Server