对以RDF表示的联网数据应用图表分析
我想对具有多种模式(即多种类型的网络节点)和多路复用关系(即多种类型的网络边缘)的网络数据进行一些分析。
分析可能是关于SNA或应用图论中的任何算法,例如联系强度,中心性,中介性,节点距离,块,集群等。
源数据是非结构化的,因此我应该首先考虑如何表示,存储和检索数据。
以下是一些想法。 我会很感激任何反馈或进一步的建议。:)
我知道已经有一些非常棒的NoSQL数据库,例如Neo4J,InfoGrid等。 但出于一些可扩展性原因(例如,许可证,网络标准...),我希望使用RDF来存储和表示我的数据。 使用的工具将是SESAME或JENA。
用RDF表示网络/图形数据的想法是微不足道的。 例如:
网络/图形数据
*Alice* ----lend 100USD----> *Bob* ----- likes ----> *Skiing*
用RDF表示
*Alice* --src--> *lend_relation* <---target--- *Bob* ---likes---> *Skiing*
|
has_value
|/
*100USD*
[Alice src lend_relation]
[Bob target lend_relation]
[lend_relation has_value 100USD]
[Bob likes Skiing]
但是,问题在于RDF和SPARQL缺乏对图模型的观点。 遍历节点或查找RDF查询(最短)距离效率不高。 它必须使用一些额外的分析工具完成,例如JUNG或JGarphT,我必须首先通过查询RDF存储构建子图,然后将其转换为JUNG或JGraphT使用的数据模型。 如果我想要额外的可视化(无论是JUNG还是JGraphT),那么我必须为可视化工具包构建另一个数据模型。 我不知道这是否清晰或有效的整合。
再次感谢您的任何建议!
如果您想用SPARQL对RDF数据进行网络分析,您可以查看SPARQL 1.1属性路径。 我相信在Jena / ARQ中它已经实现了ARQ - 属性路径。
来自SPARQL新规范的Property Paths允许您通过定义图形模式来查询RDF数据模型。 图表模式比您在SPARQL 1.0中定义的模式要复杂一些。
通过此功能以及应用程序级别的一些逻辑,您可能能够对数据执行一些有趣的网络分析。
链接地址: http://www.djcxy.com/p/65845.html上一篇: apply graph analysis on networked data represented with RDF