MySQL全文Stopwords原理

我目前正在尝试为我的网站开发一个基本的全文搜索,并且我注意到像“有关”的某些词被列为MySQL全文搜索的停用词。 由于搜索给定新闻项目的人不一定会使用“有关”一词进行搜索(但我当然不能为所有人说话),所以这并不会让我感到太麻烦。 不过,我希望这里有人能够启发我关于制定停用词表的理由。 谢谢!

澄清:我使用MyIsam作为我的全文表格。 停用词是MySQL不会索引的词(适用于任何全文索引)。 正如对这个问题的评论所指出的那样,没有任何形式的解释就有完整的停用词表。 我只想知道他们选择的单词背后是否有理由。


停用词只是英语中的常用词。 在大多数情况下,如果您不索引这些词,您的搜索结果将更加相关 - 而且您的索引将更小且更快。

如果您更好地满足您的需求,您可以使用ft_stopword_file变量编辑停用词列表(或将其设置为“',以索引所有单词的长度或长度大于ft_min_word_len”)。 您还可以使用ft_min_word_len变量来更改最小索引字长度,该变量存在的原因相同。

链接地址: http://www.djcxy.com/p/75259.html

上一篇: MySQL Fulltext Stopwords Rationale

下一篇: Problems using MySQL FULLTEXT search