从SEO(搜索引擎优化)的角度,网站中存在大量被Google转入补充结果的网页无疑可称为“miserable failure”,之所以这么说,不仅仅缘于这些网页难以出现在用户的搜索结果页中,无论从搜索引擎获得流量,还在于,网站页面被转入补充结果的比例过高时,还将影响Google 对网站质量的整体评判,容易让Google认为你的网站是一个“低质量”或“无价值”站点。
当然,本文的重点不在于探讨补充结果。对于补充结果的详细探讨,可参考如下资料:
尽管一般说来,网页被置入补充结果,一般多由于链接以及链接的相关性与权威度不足,不过,具体到基于WordPress的博客而言,还存在一个不容回避的问题,那便是重复内容(Duplicate Content)。在WordPress的默认架构设置中,主页、分类页以及archives页存在着大量的重复内容——即使您在archives页输出摘要,可以在一定程度上稍许有所改善,但这一情况仍然是存在的,仍然在多个页面存在相同的段落——至于其他页面甚至包括集成的搜索页,也都会出现这种情况。这也造成了当Google索引了这些页面后,因其与博客网页真正具有价值的内容页,主要指posts与pages,存在Duplicate Content,而只能被置入补充结果,也让内容页大大贬值。
道理同之前博客学堂在为WordPress网站创建robots.txt介绍的由RSS Feeds引发的重复内容问题相同,当然,解决方法也类似,那便是,为了保证博客网站的内容页面同时也是blogger希望搜索引擎重视的价值得到最大体现,必要的时候我们需要告诉Google不去索引、收录那些存在重复内容问题的页面,如Archives页等。而要实现这一点,便是在这些页面的head部分加入“noindex”标签——当然,使用robots.txt,当然也可以将这些页面排除在Google的索引之外,不过,这些页面中的链接特别是指向内容页的链接我们还是需要的,而robots.txt则似乎有倒去脏水也倒掉了孩子的嫌疑,从这个角度看,使用robots.txt未必是个好的选择。——具体通过在WordPress模板的header.php中加入一段条件判断语句,发现当前页为archives、categories、search时加入类似如下的语句:
<meta name="robots" content="noindex,follow" />
如果您懒得自己修改,也可直接使用这个插件,Duplicate Content Cure Plugin for Wordpress,其实现的功能正如上所述。——WordPress丰富的插件资源正是博客学堂推荐使用WordPress作为首选blog平台的主要原因。
注:这样的作法虽然在理论上可行,但存在一个致命的问题,那便是如果在archives、categories页中加入了Google Adsense广告时,加入了“noindex”标签后,则同时也会禁止Adsense用来分析发现广告与内容相关性的 MediaBot,这不仅有违Google的政策,也会直接造成这些页面上相关性差的广告甚至只能显示公益广告。






当前共计3 回复 ↓
TrackBacks ↓
留下您的评论