如何检查Wordnet数据库中是否存在单词

目标:我有一个文字很多的单词。 我需要弄清楚哪些单词有拼写错误。

我为此安装了WordNet 3.0。

使用下面的命令,我可以检查wordnet是否真的存在于wordnet数据库中,但这需要我指定POS,即NOUN,PRONOUN等。 事先我可能不知道

filter <- getTermFilter("ExactMatchFilter", "car", TRUE)
terms <- getIndexTerms("NOUN", 5, filter) 

请让我知道一种方法来解决我在R中的问题


一种方法:

library(wordnet)
inWordnet <- function(w, pos =  c("ADJECTIVE", "ADVERB", "NOUN", "VERB")) {
  for (x in pos) {
     filter <- getTermFilter("ExactMatchFilter", w, TRUE)
     terms <- getIndexTerms(x, 5, filter)
     if (!is.null(terms)) return(TRUE)
  }
  return(FALSE)
}
inWordnet("car")
# [1] TRUE

或矢量化:

vInWordnet <- Vectorize(inWordnet, vectorize.args = c("w", "pos"))
vInWordnet(c("car", "asdas"))
#   car asdas 
#  TRUE FALSE 
链接地址: http://www.djcxy.com/p/62415.html

上一篇: How to check if a word exists in the Wordnet database

下一篇: Extract Word from Synset using Wordnet in NLTK 3.0