软件在文件中查找最常出现的唯一字

我记得曾经访问过一个以最有趣的方式呈现书/小说摘要的网站。 它会显示该书中经常重复的单词列表,这些单词是独特的/不常见的。 换句话说,它会显示最大频率的词语,但不是像我,你这样的常见词汇。然后,如果经常重复,就需要显示一些词组。 例如,金银岛可能会有像海盗,风暴,战斗,财宝,八件,岛屿,龙约翰银,吉姆,预兆等字样。

这是快速了解我是否愿意阅读该书的最好方法。 我再也找不到那个网站了。 所以我想找一个可以完成这项工作的软件。 我有几本pdf和doc格式的书,我想分析一下。 有没有人知道有一个很好的工具/软件可以做到这一点?

当然,我自己也可以自己编写代码,但肯定不会重新发明轮子。 所以我的问题是,“你知道任何这样的软件吗?”

谢谢,
木根
(书呆子)


尝试Wordle.net。 它创建标签云并以不同的方式呈现它们。

答案署名:戴夫

链接地址: http://www.djcxy.com/p/18131.html

上一篇: Software to find the most occurring unique words in a file

下一篇: Which technologies are commonly used by developers to quickly build websites?