怎样将网页中的某部分内容禁止搜索引擎抓取？

0 0

每个网页，都有一块区域的内容不希望被搜索引擎抓取，有什么好方法呢？

10 years, 7 months ago

积根队长 10 years, 7 months ago

iframe 然后写robot.txt
robot.txt 指明指定的路径不希望被抓，然后在该页面引入
具体搜索引擎的robot说明，请去各自搜索引擎官方查看

answered 10 years, 7 months ago

fatezyj answered 10 years, 7 months ago

一般情况下，搜索引擎是（包括Google）不会抓取JS生成的内容的，想要Google抓取JS内容还是需要一些配置呢， Making AJAX Applications Crawlable （可能需翻墙），因此，我觉得使用JS生成内容可行。

answered 10 years, 7 months ago

文森特·瓦伦丁 answered 10 years, 7 months ago

google 也可以索引 ajax，swf的内容。我能想到的就是图片，然后根据referer 判断是否为机器人，再决定图片是否显示。

阴谋论：有的搜索引擎并非遵守robots.txt ，只是索引了，但是不现实搜索结果。

answered 10 years, 7 months ago

椿sama answered 10 years, 7 months ago

ajax获取内容，然后在robots.txt里禁止搜索引擎抓取数据接口

answered 10 years, 7 months ago

cvp110 answered 10 years, 7 months ago

拿js脚本来生成，脚本里面可以存放unicode转义形式，或者url编码过的文本。

answered 10 years, 7 months ago

Dominic answered 10 years, 7 months ago

生成图片输出，起点这些vip阅读章节就是这么做的吧

answered 10 years, 7 months ago

会说话的大蛋糕 answered 10 years, 7 months ago