如何使用正则表达式提取友好时间字符串?


我在写的一个爬虫需要能提取页面上帖子的时间信息,但是又不想套用模版。请问如何直接提取类似于 11 分钟前 半小时前 1 小时前 昨天 15:04 一类友好的,以自然语言方式显示的时间文本?我只要能提取字符串即可,提取后的时间分析我可以自己完成

java 正则表达式

野生的河小蟹 11 years, 7 months ago

你应该使用 XPath 或者 CSS 选择器之类的方案。网页上特定的内容会有特定的特征的。

许愿-六芒星 answered 11 years, 7 months ago

Your Answer