工作原理类似这样: 给定一个单词, 我们的任务是选择和它最相似的拼写正确的单词. ( 如果这个单词本身拼写就是正确的, 那么最相近的就是它自己啦). 当然, 不可能绝对的找到相近的单词, 比如说给定 lates 这个单词, 它应该别更正为 late 呢还是 latest 呢? 这些困难指示我们, 需要使用概率论, 而不是基于规则的判断. 这个就是一个编辑距离 的概念. 这两个词之间的编辑距离定义为使用了几次插入( 在词中插入一个单字母), 删除( 删除一个单字母), 交换( 交换相邻两个字母), 替换( 把一个字母换成另一个) 的操作从一个词变到另一个词.你可以在网上找找相关东西

幼月々红魔 answered 12 years, 10 months ago

Your Answer