通用后缀树Java实现

我正在寻找具有以下功能的通用后缀树(GST)的Java实现:

在从1000条字符串创建GST之后,我想知道这1000个字符串中有多少字符串包含其他字符串。

搜索必须很安静,因为我需要对平均长度为10的大约100000个候选字符串进行搜索。


尝试语义发现工具包。 它在text / src / java / org / sd / text / radixtree上实现


非常规后缀树的Java实现可在以下位置获得:http://illya-keeplearning.blogspot.com/2009/04/suffix-trees-java-ukkonens-algorithm.html


我用Java创建了一个后缀树,使您可以轻松添加自己的搜索功能和其他匹配算法。 我的博客帖子,Java中的Suffix Trees有一个概述以及下载最新版本的说明。 我的Java实现基于Mark Nelson的“使用后缀树搜索快速字符串”一文。

更新2016-06-18

  • 包含上述后缀树实现的库现在可以在https://bitbucket.org/globalmentor/globalmentor-core上找到。
  • 最新版本的库可从Maven Central获取,网址为http://search.maven.org/#search%7Cga%7C1%7Cg%3A%22com.globalmentor%22%20AND%20a%3A%22globalmentor-core%22 。
  • 链接地址: http://www.djcxy.com/p/40085.html

    上一篇: Generalized Suffix Tree Java Implementation

    下一篇: really hard to understand suffix tree