Blog安装、优化及创收技巧

博客应用入门之Google网站管理员工具

2007/11/18 | BlogsDiy · 7 回复

博客实用工具入门说在前面的话:

有些朋友可能会质疑为什么我们把Google网站管理员工具列入博客实用工具系列,毕竟,不少人认为Google网站管理员工具更多地与SEO(搜索引擎优化)有关,或,仅仅是一款SEO工具,与博客没有干系;而且,也曾看到类似SEO便是Spam,是与博客的基本宗旨相悖的之类的说法。

在此简要回答一下:

  • 不管怎么说,博客终究仍是个网站,尽管有的人可能将其视之为“血统高贵”的网站有的人则视其为“简易”网站,仍然要遵循一般网站建设与推广的规律;
  • 您可以不重视SEO,不刻意追求博客的SEO效果,但是,与其他博客推广方式相比,搜索引擎同样是用户发现、了解您的博客的重要窗口,而且更廉价、效果更佳,同时我相信没几个博客会拒绝来自搜索引擎的用户。而要实现这一点,或者至少说让您的博客在搜索引擎中不致“太吃亏”,您需要了解搜索引擎的基本要求与规律,需要掌握您的博客在搜索引擎眼中的样子,比如是不是对搜索引擎友好易于robots爬行、您的重要页面是否被搜索引擎发现并且被搜索引擎认为其的确“重要”、您的博客内存在多少重复内容以及链接策略是否走在正确的轨道上,等等,这些信息都可以在Google网站管理员工具中得到反馈。当然,严格地说来,Google网站管理员工具只是反映您的网站在Google中的情况,在其他搜索引擎中可能有所不同,不过,主流搜索引擎的绝大多数规则、策略都是相通的,除非您是极端的SEO主义者。 :P 不过您也可以尝试其他搜索引擎提供的类似工具如Yahoo! Siteexplorer或其中文版等。
  • SEO不是Spam。如果说以不相称的内容而强要自搜索引擎获得大量访问可视作具有某种spam趋向并不可取的话,那么,当博客具有足够的内容——包括质量与数量——时,却不能让搜索引擎看到自己的价值,同样不可取。通过Google网站管理员工具,您可以帮助Google更高效、更迅速地发现博客的重要内容,同时,它也会帮助您解决博客存在的问题,这种与搜索引擎的良性互动最终将让Google更有序地组织您的信息,向需要的用户展现,其意义是双赢的。

这样的回答满意么? :P

废话不多说,让我们开始Google网站管理员工具之旅。

如何开始?

要使用Google网站管理员工具,非常简单,只要您具有一个Google帐户。相信大多数Blogger都会或多或少地使用过Google的某项服务,比如说Gmail、Google Reader、 Adwords、AdSense、Analytics、iGoogle等,直接使用在那些服务中的帐户登录即可。

当然,如果确实没有,可至Google帐户免费注册。

控制台

控制台

首先我们需要添加网站。在“添加网站”对话框中输入博客的网址,博客即出现在网站列表中。

需要注意的是,在输入Url时请使用网站“正确”的网址,不仅仅指拼写正确,还包括网站的首选域,即你的网站是否使用“www”前缀,以博客学堂为例,URL为“http://blogsdiy.org”,并没有“www”,而如果此在添加网站时输入的URL为“http://www.blogsdiy.org”,则会在以后上传sitemap时出现问题:Google只会尝试在含“www”的域下查找Sitemap文件。

要想得到网站的详细信息如博客网页的完整统计信息和抓取错误,需要您验证该网站属您所有或在您的管理之下。——当然,即使未验证,仍可使用网站管理员工具提交 Sitemap 并查看关于 Sitemap 的详情以及网站基本信息。

验证的方法有两种,一是在网站首页源文件header部分添加具有唯一值的元(meta)标记,二是往网站指定目录——一般为根目录——上传给定命名的空文件,这两种方法都可以让Google确保您对该网站的所有权或管理权,避免网站隐私数据外泄露。

验证过程很快,一般不会超过一分钟,验证成功后会在控制台相应网站行显示“对号”。需要记住的是,验证成功后相应的验证文件或主页中的元标记应继续保留,而不能删除,Google会定期检查,如果其未发现相应的验证标记,那么网站便又会回到“未经验证”状态。

当然,您也可以将其中的某个网站从列表中“删除”。——很显然,并不意味着将该网站从Google索引中删除。

控制台工具

在控制台的右侧面板中,列有如下工具:

  • 邮件中心:与Google联系。您可以通过此寻求支持,以及——据称——Google也会在发现您的网站异常比如说存在spam嫌疑时给予警告提醒等。
  • 下载所有网站数据:Google网站管理员工具提供的网站信息,虽然全面,但有时略嫌纷杂,您可能需要进一步的梳理,在此可下载同一帐号下的所有网站信息包括摘要数据、Sitemap明细、出错明细、统计信息等,格式为 .txt 或 .csv 文件,下载后您可以将其导入本地的数据库或电子表格中,进行更细致的分析。
  • 报告索引中存在的垃圾网站:向Google举报您发现的作弊网站。与一般的“匿名”举报相比,从这里举报的优先度高些。
  • 举报付费链接:如果您发现其他网站存在买卖链接的情况,可在此举报。 :P
  • 请求重新审核:如果您发现自己的网站被Google惩罚——当然,最严重的是在Google索引中完全消失,而轻些的降级则需仔细观察才能发现——那么,应仔细检查您的网站是否存在问题,如有,改正后至此审请重新审核。——:要求重新审核的网站必须已通过验证。
    一点题外话:如果您的网站没有违背Google的管理员指南,但无论排名及索引都出现问题应怎么办?也许您仍应考虑申请重新审核。毕竟,许多人坚信只要能打击同领域的竞争对手,便会带来自己的成功 :P ,举个例子,您的博客中总会有指向他站的链接,比如说blogrolls,那么,便未尝不会有其他人举报您的blogrolls中包含出售的链接,当然,我相信Google会竭力避免让类似的“阴谋”得逞,但总会有霉到家的倒霉蛋。

概述

网站概述

在控制台点击某个网站,即进入“概述”页。在这里,您可以一目了然地对网站状态有个整体把握,比如说网站是否被Google索引、收录,Googlebot最近一次访问您的主页是什么时候,特别是Google在索引您的网站时遇到什么错误,这往往是了解网站状态的基本标志。

比如说,如果发现有大量的“未找到”报告,那么,便需要小心检查网站是不是哪儿出了些问题,将错误链接修复——需要说明的是,这类错误不一定由您的网站导致,即问题并非一定出现在您的网站自身,也可能是其他网站在链接至您的网站时使用了错误的url,尽管对这样的问题blogger自身往往无法控制,但如果404链接数量较多的话,不妨考虑设置相应的301 重定向,让其跳转至适当的或正确的网址,这样,一则给予用户更好的访问体验,免得用户的访问过程被“找不到网页”所打断;二则也可以让这些链接“废物利用”,不然不是暴殓天物嘛。 :)

诊断

事实上,在概述页直接点击相应的抓取错误“详情”即进入“诊断”页面。在这里,您可以详细地查看产生相应错误的网页url及错误发生的原因,从而有的放矢地调整、修改。同时,如果您的网站具有移动版本,除标准的网络抓取错误外,您还可在此页检查移动网络抓取的情况。

当然,对具体情况应该具体分析。比如说,如果您的网站服务器恰恰在Google尝试抓取时出现宕机,那么,便有可能出现大量的抓取错误,但这一般而言并不是什么大问题——除非服务器频繁宕机——只须等待Googlebot下一次访问,成功后类似错误便自然消失;再比如说,对“网址受 robots.txt 限制”错误,尽管有时确可能由不当的robots.txt设置所致,但更多的时候可能只是因为您不愿意类似的页面被Google索引,是您自己的选择设定。

统计信息

网站统计信息

“统计信息”项提供相当丰富的信息,诸如热门搜索查询、Googlebot会查看哪些内容、抓取统计信息、索引统计信息、订阅用户统计信息等。老实说,其中有些相当重要的信息,而也确有意义不大的部分,比如说订阅用户统计信息,根据您的需要与网站具体情况,有所侧重地关注。

  • 热门搜索查询:可以根据时段、搜索类型及位置查看您的网站在热门搜索中出现的位置及点击情况,让您对博客在Google搜索中的表现有个清晰的轮廓。
  • Googlebot会查看哪些内容:总感觉有些怪异的翻译,也许,英文版本中的“What Googlebot sees”更不易引起混淆,即在Google 眼中您的网站是什么样子,提供的信息包括指向您的网站的外部链接和网站自身的内容链接所使用的链接文本(Anchor Text)、网站内容中的关键字、外部链接中的关键字等。对于调整及优化网站相当重要,举个简单的例子,如果您的博客希望面对的是计算机技术爱好者,但Google看到更多的,包括从网站自身及外部链接中,则是与汽车相关的内容,那么,肯定说明哪儿出了问题,需要您作出调整。
  • 抓取统计信息:网站内PageRank的分布情况,及PageRank最高的网页。
  • 索引统计信息:提供网站在Google索引库中的基本信息。当然,直接在Google搜索中同样也能得到相应的信息,只不过在这儿不必自己输入搜索命令而矣。
  • 订阅用户统计信息:给出博客 Feed 的订阅量统计,包括Google Reader、 Orkut 与 iGoogle 。不过,单纯地看这个数字似乎没有太大的意义,1、blogger更关心Feed的订阅总数,而不仅仅Google一家,这个数字无论高低事实上都不重要,也许您的博客目标用户群更多地使用其他RSS订阅工具呢 :) ;2、这里给出的统计数字只反映在已验证域上的Feed的订阅,而相对而言,大多数博客都使用第三方的Feed托管报务如FeedBurner——虽然FeedBurner已属Google——因此,更多的订阅出现在其他域中的feed上,如博客学堂的“http://feeds.feedburner.com/blogsdiy”及使用FeedBurner之MyBrand服务后的“http://feeds.blogsdiy.org/blogsdiy”,但无论“feeds.feedburner.com”还是“feeds.blogsdiy.org”都是blogger所无法验证的。

链接

网站链接信息

随着Google将网页搜索中的“link:”命令返回信息逐步“缩水”,不能真正反映网站的链接情况,网站管理员工具中的“链接”统计的意义越来越重要。几乎成为网站管理员工具的一个“卖点”,从某种程度上说,这也许可视为Google“变相地”强迫网站建设者包括blogger注册、使用网站管理员工具的手段之一 :P

在“链接”页,我们可以查看:

  • 含外部链接的网页:在这里您可以看到网站获得的外部链接,包括链接总数以及相应的每页获得的链接数量、来源等。这是非常有用的信息,外部链接对于网站SEO的意义当然不必多说,点击链接数字可以显示相应的链接来源。
    需要强调的是,对这个链接数字需要客观看待,单纯的链接数量并没有太大意义,链接质量更为重要,关键还要看链接来源网站及链接来源页面与目标网站的内容是否相关,以及链接使用的Anchor Text。此外,也应清楚,上述链接数字包括“nofollow”链接在内,如在其他博客留言时所获得的链接,而这类链接对最终的网页排名基本没有意义。
  • 含内部链接的网页:尽管理论上说,内部链接对最终的SEO效果所起的作用没有外部链接那么大,但也许这里提供的信息也许对blogger更有意义。一方面,可以让您了解网站的结构及Pagerank传递路线是否合理、最否达到最佳化;其次,可以有效的检查博客内的重要页面是否得到适度的强调,何况,相对而言,获得怎样的外部链接对blogger而言是无法控制的,但内部链接则完全取决于blogger,这是可以充分发挥主观能动性的部分。 :P
  • 网站链接:如果您的博客具有足够的规模与影响力,那么,Google可能会在针对特定关键词的搜索中为您的网站提供附加链接。在这里您可以检查Google认为可列入网站链接的重要网页,以及根据需要决定是否将某个出现在网站链接但并不太合适的页面“排除”。需要注意的是,排除某个页面并不意味着Google会以其他页面增补该页留下的空缺,而是将您的博客“应有的”网站链接数量减一,因此,应慎用网站链接的“排除”功能

Sitemaps

这是网站管理员工具相当重要的部分,网站管理员工具在最初的时候命名为Google Sitemaps便因为此。从理论上说,您应该在网站验证通过后即至此来提交sitemap,不然,上述的统计信息中也许会缺失很多内容。

需要注意的是,这里所言之sitemap,是指xml格式的sitemap,而非一般意义上html格式的“网站地图”。至于如何创建sitemap,不同的博客平台有不同的选择,对基于WordPress的博客而言,可直接使用Sitemap Generator插件,其他平台可选择合适的第三方工具或直接使用博客输出的RSS文件,当然,要记住RSS文件只包括博客的最新内容,只能提供最近的网址信息。

Sitemap信息

Sitemap提交后,您可在这里检查其状态,包括最后一次提交时间、Google最新下载时间、已提交的网页等,以及Google读取Sitemap时是否出错等等。

工具

谷歌网站管理员工具

在此项中提供了一系列与网站应用、管理相关的工具:

  • 分析 robots.txt:在这里您可以检查robots.txt 文件是否设置无误,比如是否阻止了不欲阻止的网页,或者,希望阻止的网页却在不经意间对Google“开放”。同时,也可在此模拟修改robots.txt并查看效果,当然,既然为“模拟”,最后您还得按测试成功的设置修改位于服务器上的robots.txt文件。——不过,最近我对其结果的准确性则持一定的怀疑态度,即在此处的测试是否完全与Googlebot的索引行为相一致,参见我遇到的灵异事件,建议您修改robots.txt后仔细检查语法确保正确无误,而不要轻信这里的测试结果。
  • 管理网站验证:上面已经介绍过,如果您将网页中的验证码或验证文件删除,Google则会将网站重新标记为“未经验证”状态,这时,您便需要至此处来重新验证了。
  • 设置抓取速度:在这里您可以查看过去90天 Googlebot 在您网站内的活动,包括每天抓取的页数、每天下载的千字节数以及每天下载页面所耗的平均时间,以及这些数据的平均值、最大值和最小值。如果数据显示Googlebot在网站内的活动太频繁,您可以在此降低其访问频率;反之,则可以考虑提高其访问频率——不过,应考虑服务器的承受能力,别让Google耗去太多的资源。
  • 设置目标地理区域:从理论上说,可在此进行设置将网站与某特定地域相关联,以帮助Google确定网站目标用户所在区域,从而也许能让网站在Google当地搜索比如Google UK中强调突出。不过,我个人很怀疑这项设置对中文用户的必要性,毕竟,我们的本地谷歌与其他区域的Google有着先天上的区别,中文网站无论是否设置,国内用户访问时都优先定位到google.cn。
  • 设置首选域名:简言之,也许您同时使用含“www”与“不含www”的域名,在这里可通知Google哪个是您的标准域或称规范域,这样,假设您象博客学堂一样使用不含“www”的域名,那么即使外部链接指向您的url中包含”www”,Google也会将其正确地定位到不含“www”的版本,避免PageRank的损失。
    这里需要提醒的是,即使您通过这种方法设置了首选域,也要清楚,其仅对Google有效,其他搜索引擎仍然不能整合“www”与“不含www”两种版本的Url,您仍然需要设置301重定向告知其他搜索引擎。——当然,也包括用户,避免用户访问时出现“找不到网页”的情况。
  • 启用增强的图片搜索:这是个挺有趣的功能,但从个人的角度,更像个玩具或游戏。根据Google的说法,启用增强型图片搜索后,Google 的 Image Labeler 等工具将允许其他用户为您的图片添加标注,从而在图片与标签间建立某种程度上的相关性,让其在图片搜索中获得优势。但这个过程似乎连Google自身也不可控的因素也太多了吧?
    Anyway,您不妨试试这个功能,即使您不太关心Google图片搜索的结果,但考虑到Universal Search(官方翻译似为“整合搜索”?)日渐步入主流,也许这样能给您带来额外的访问量。
  • 删除网址:一般而言,对于网站内不欲被Google索引或收录的页面,我们可以通过robots.txt阻止或在网页中使用 noindex 标签,但有时百密难免一疏,如果您发现某个不欲被Google收录的网页进入了Google索引库,那么可在此将其删除。——当然,操作要慎重 :)

小结

总而言之,Google网站管理员工具是一款对网站建设者包括blogger相当重要的工具,通过它可以让您的博客网站实现与Google的良性交互——如本文开头所言,大多数搜索引擎在技术与方法上是相通的,也基本上可以至少保证您在其他搜索引擎中不犯错误——同时,其提供许多有价值的信息,诸如您的网站结构是否合理、用户如何在google中发现您的博客等,可以让您更有针对性地调整博客优化与推广的策略、方法及步骤。

此外,上面的介绍未必全面,Google网站管理员工具也始终在调整及扩充功能,可在其官方博客Google Webmaster Central Blog随时了解更新信息。当然,如果您懒得看英文或无法访问的话,也可查看这个中文版本——虽然我曾质疑过其官方的身份,并因此引发与朱健飞先生在某些事情上的不同看法,不过,目前谷歌的确是将其作为官方或十分接近官方的方式使用的,不能因个人争执而丧失必要的客观,汗死! :oops:

→ 版权声明分类: 博客工具与服务

  • 欢迎订阅博客学堂RSS Feeds

当前共计7 回复 ↓

  • 1 幺幺 | 2007/11/18 1:49 pm

    MyAvatars 0.2

    介绍的很详细,学习了。

  • 2 刀客 | 2007/11/20 12:50 am

    MyAvatars 0.2

    先学习下,以后有时间再添加吧!

  • 3 | 2007/12/27 11:13 am

    MyAvatars 0.2

    Google网站管理员工具 是很重要的,

    但对于静态网站好像吃亏了点

  • 4 freeche | 2008/04/10 6:38 pm

    MyAvatars 0.2

    1.我在wordpress后台中根本就找不到 和 ,元标记往哪插啊?
    2.wordpress又不允许上传HTML文件。
    怎么办啊,不晓得怎么搞。帮帮我啊,可以给我发邮件么,谢谢啊

TrackBacks ↓

  1. wordpress blog creation and optimization | 重剑无锋
  2. 转载:博客创建、优化教程全系列 | 重剑无锋
  3. » 转载:博客创建、优化教程全系列 » Blog Archive 重剑无锋

留下您的评论

[→ 留言须知]