Node.JS textract读取存储在SQL Server中的文件流
我有一个名为数据类型为NVARCHAR(MAX)
Attachment
列的SQL Server表。 我根据特定标准将一些PDF / Docx文件上传到不同的行。 这里是我把文件上传到db的声明
UPDATE dbo.[Document]
SET Attachment = (SELECT BulkColumn FROM OPENROWSET(BULK N'E:1.pdf', SINGLE_BLOB) blob)
WHERE ID = 1;
上传成功。 我的目的是使用textract或任何其他类似工具从附件中读取底层文本。 我看到有几个API。 由于没有涉及文件和URL,我猜测正确的API应该是Buffere + MIME类型,但是确切的说是PDF和Docx的MIME类型? 我尝试为PDF和“application / vnd.openxmlformats-officedocument.wordprocessingml.document”放入“application / pdf”for docx,并且出现错误:
[错误:传递给textract的参数不正确。]
在这种情况下,MIME类型的正确值应该是什么? 或者这不应该被视为一个缓冲区? 如果那么应该使用正确的API?
我能够使用textract打开实际的物理文件并阅读内容。
感谢有人能就此提出建议。
链接地址: http://www.djcxy.com/p/45543.html