怎么实现php自定义字典中文检索算法


首先我有自己的词典。目前是采用“,”分割开的。
例如:词典:“过滤词1,过滤词2,过滤3”
文段:这次一句话过滤2
请问如何高效的判断文段中含有词典中的词语(只做完全匹配)即:过滤2?

讨论 php

事后牌纸巾 12 years, 3 months ago

我说说自己的一些看法:
首先,这些所谓要过滤的关键字,不能存贮为“a,b,c”这种形式,而是存储为二叉树的形式。
同样的开头词或者其他关联的可以发到一个节点下,这样比如,我们要查找“测试abc测试”是否含有“abc”就可以先去查找“a”的开头词的根节点,然后向子节点去层层的遍历,这样,效率的开销和循环程度就可以做到最小了。

WSDBYH answered 12 years, 3 months ago

Your Answer