Node.JS textract读取存储在SQL Server中的文件流

2018-06-16 01:47:02

我有一个名为数据类型为NVARCHAR(MAX) Attachment列的SQL Server表。我根据特定标准将一些PDF / Docx文件上传到不同的行。这里是我把文件上传到db的声明

UPDATE dbo.[Document] 
SET Attachment = (SELECT BulkColumn FROM OPENROWSET(BULK N'E:1.pdf', SINGLE_BLOB) blob) 
WHERE ID = 1;

上传成功。我的目的是使用textract或任何其他类似工具从附件中读取底层文本。我看到有几个API。由于没有涉及文件和URL，我猜测正确的API应该是Buffere + MIME类型，但是确切的说是PDF和Docx的MIME类型？我尝试为PDF和“application / vnd.openxmlformats-officedocument.wordprocessingml.document”放入“application / pdf”for docx，并且出现错误：

[错误：传递给textract的参数不正确。]

在这种情况下，MIME类型的正确值应该是什么？或者这不应该被视为一个缓冲区？如果那么应该使用正确的API？

我能够使用textract打开实际的物理文件并阅读内容。

感谢有人能就此提出建议。

链接地址: http://www.djcxy.com/p/45543.html

上一篇: Node.JS textract read file stream stored in SQL Server

下一篇: laravel 5.1 error in validating doc docx type file