在Freebase中找不到实体名称
我们正在研究一个用知识库回答问题的研究项目。 我们采用了数据集SimpleQuestions(https://research.fb.com/projects/babi/)。 我们将最新的freebase数据转储加载到Virtuoso中,并通过它们的mids查询实体的名称(使用关系type.object.name和common.topic.alias)。 但是,无法找到许多实体的名称。
我们也使用Semper提供的KB(https://github.com/percyliang/sempre),在这里我们找到更多实体的名字,但不是全部。 我们猜测这些实体可能会被删除,这是真的吗? 如果是这样,我们该如何继续解决这个问题呢?
Freebase API已折旧并且不可能获取实体名称。 但是,Google为2.1M实体提供了Freebase / Wikidata映射。 这些映射可用于将freebase实体映射到wikidata实体并获取其实体名称和其他信息。
另外,http://sameas.org/为freebase实体提供了一些额外的映射。
编辑:您也可以阅读Freebase转储以获取这些映射。 我个人使用以下属性来获取相应的实体名称:
ENTITY_GET_LABEL_ORDER = [
'<http://rdf.freebase.com/ns/type.object.name>',
'<http://rdf.freebase.com/ns/common.topic.alias>',
'<http://rdf.freebase.com/key/en>',
'<http://rdf.freebase.com/key/wikipedia.en>',
'<http://rdf.freebase.com/key/wikipedia.en_title>',
]
此外,即使在做这件事之后,还有一个很好的数量(约1-5k,不记得它),因为我们无法映射到名称,并且可以安全地删除那些(只有少数这样的)问题。 Google还提供了一个包含一些删除元组的附加转储。
链接地址: http://www.djcxy.com/p/64439.html