如何利用tags查询“相关文章”?


项目用的是flask+mongodb+mongoengine,文章模型包含一个字符串列表的ListField(...)类型的字段用于存储tags,一篇文章可能有若干个字符串tag,我想在显示该篇文章的详细信息时,通过tags查询相关的几篇文章,python中应该怎么写更合理?

python flask mongoengine mongodb

傳說中的禦姐A 11 years, 4 months ago

相关性可以用向量表示

假设一个系统中有N个TAG, TAG1/TAG2/TAG3/.../TAGN

一篇文章的TAG情况可以用一个只包含1和0的N维向量表示,两篇文章的相关性可以用向量的内积表示

比如说文章A的TAG情况是 (1,1,1) , 文章B的TAG情况是 (0,1,1) , 文章C的TAG情况是 (1,0,1)

  • 给定文章A,A和C都应推荐
  • 给定文章B,应推荐文章A
  • 给定文章C,应推荐的文章也是A

实际实现的时候文章的TAG情况可以用binary数字表示,两个文章的相似性可以用两个binary的 AND 结果计算 hamming weight

当然啦最简单的就是用现成的轮子,比如说果壳的这个 https://github.com/guokr/simbase

mumugit answered 11 years, 4 months ago

Your Answer