如何对超链接中的url进行分词
很多url是由连续单词或单词简写拼接而成,有什么样方法把这些词划分出来。例如:
http://www.energycentraljobs.com/ -->energy central jobs
http://www.bestjobs.ie/-->best jobs
因为需要对链接进行评分,这些词就隐含有语义信息所以需要拆分出来。
akdijsh
11 years, 3 months ago