使用freebase命名实体识别
我了解DBPedia聚光灯在给定的文档上进行命名实体识别。 为此,它使用存储在文件系统中的下载的DBPedia文件。请参阅URL:https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Run-from-a-JAR。
我需要的是像Freebase这样的聚光灯的等效API。 就像我浏览过的那样,我找不到任何在Freebase三重商店上运行的工具/ API。 有人能帮忙吗?
Freebase目前没有用于命名实体识别的等效项目。 但是,Freebase有链接到sameAs.org上的DBpedia,因此您可以使用DBpedia Spotlight,然后将ID解析回Freebase(该数据也可在Freebase RDF转储中使用)。
如果您正在寻找这方面的编码项目,我认为应该可以调整DBpedia Spotlight代码,以便您可以使用Freebase数据来训练其模型。 这样做的主要好处是,Freebase涵盖了比DBpedia更广泛的实体,因此您可以更好地回想起来。 此外,您可能能够利用Freebase中的其他数据(如“显着类型”)来获得更好的精度。
通过查看Freebase中的/ type / object / name和/ common / topic / alias属性,您应该能够获得一组好的“表面形式”。 与Wikpedia页面相对应的任何Freebase实体在/ wikipedia / en命名空间中将具有一个或多个/类型/对象/键值。 这些对应于维基百科页面名称(和重定向),这将允许您通过Wikipedia XML转储进行解析并确定页面上的哪些链接与Freebase主题相对应。 这里描述Freebase密钥编码方案。
您可能也对OpenCalais和AlchemyAPI感兴趣,它们将提供命名实体识别作为服务提供,并在其API响应中提供Freebase ID。
链接地址: http://www.djcxy.com/p/18085.html