Node.JS textract读取存储在SQL Server中的文件流

我有一个名为数据类型为NVARCHAR(MAX) Attachment列的SQL Server表。 我根据特定标准将一些PDF / Docx文件上传到不同的行。 这里是我把文件上传到db的声明

UPDATE dbo.[Document] 
SET Attachment = (SELECT BulkColumn FROM OPENROWSET(BULK N'E:1.pdf', SINGLE_BLOB) blob) 
WHERE ID = 1; 

上传成功。 我的目的是使用textract或任何其他类似工具从附件中读取底层文本。 我看到有几个API。 由于没有涉及文件和URL,我猜测正确的API应该是Buffere + MIME类型,但是确切的说是PDF和Docx的MIME类型? 我尝试为PDF和“application / vnd.openxmlformats-officedocument.wordprocessingml.document”放入“application / pdf”for docx,并且出现错误:

[错误:传递给textract的参数不正确。]

在这种情况下,MIME类型的正确值应该是什么? 或者这不应该被视为一个缓冲区? 如果那么应该使用正确的API?

我能够使用textract打开实际的物理文件并阅读内容。

感谢有人能就此提出建议。

链接地址: http://www.djcxy.com/p/45543.html

上一篇: Node.JS textract read file stream stored in SQL Server

下一篇: laravel 5.1 error in validating doc docx type file