Answers
工作原理类似这样: 给定一个单词, 我们的任务是选择和它最相似的拼写正确的单词. ( 如果这个单词本身拼写就是正确的, 那么最相近的就是它自己啦). 当然, 不可能绝对的找到相近的单词, 比如说给定 lates 这个单词, 它应该别更正为 late 呢还是 latest 呢? 这些困难指示我们, 需要使用概率论, 而不是基于规则的判断. 这个就是一个编辑距离 的概念. 这两个词之间的编辑距离定义为使用了几次插入( 在词中插入一个单字母), 删除( 删除一个单字母), 交换( 交换相邻两个字母), 替换( 把一个字母换成另一个) 的操作从一个词变到另一个词.你可以在网上找找相关东西
幼月々红魔
answered 12 years, 10 months ago