56338 条 (56338 未读) 共 11 feeds
WebHosting
(39126 未读)
Google
(1357 未读)
Blogger
(677 未读)
SEO
(90 未读)
Web
(15088 未读)
发表者: Charlene Perez, Juliane Stiller
原文:How to start a multilingual site
发表于:2008年8月7日星期四,上午9:50
您考虑过使用不同语种建立一个或多个网站么?比如说您想做一个关于在欧洲背包旅行的旅游网站,而且您想把自己的内容提供给使用英语、德语和西班牙语的访问者。您或许希望把网站结构、地理和语言定位以及内容组织等方面都考虑进来,下文就将为您一一介绍。
网站结构
您首先需要考虑的就是: 是否需要为您开展业务的所有有关国家购买针对各个国家的顶级域名(TLD)。如果回答是肯定的话,您的域名可以选择ilovebackpacking.co.uk,ichlieberucksackreisen.de和irdemochilero.es.es。如果您想把自己的网站定位在与每个顶级域名相对应的国家的话,您可以选择这种被称为地理定位的方式,在这种情况下,地理定位的方式对您是有利的。地理定位是与语言定位不同的,关于语言定位我们稍后会专门介绍。打个比方说,您的德语内容是专门为德国用户设计的,而不适合于来自奥地利或瑞士的讲德语的访问者。在这种情况下,您应该注册一个.de顶级域名。德国用户会把这个域名看作是本土的域名,从而更加信赖这个域名。但是,地理定位也有一些不尽人意之处,比如专门购买特定国家对应的域名可能花费不菲,而且更新和维护也颇费精力。所以,如果您的时间和资源有限,您可以考虑购买一个非特定国家的域名,用它来涵盖您网站的各种语言版本。在这种情况下,我们建议您考虑以下两种选择:
如果您想查看您网站中有多少页是被认定为某种特定语言的网页,您可以进行基于指定语种的网站搜索(site search)。举例来说,您可以到google.de 对google.com 做一下网站搜索(site:google.com),选择如下图所示的选项您就可以只展示那些属于德语的搜索结果。
如果您对这一话题有其他疑问的话,欢迎您加入谷歌网站管理员支持论坛得到更多的帮助。
发表者: Matt Cutts, 软件工程师
原文:Using data to fight webspam
发表于:2008年6月27日星期三 下午4:51
这篇博客是讲述我们如何利用所收集的数据来改善我们的产品和服务的系列文章中的最新一篇。
作为谷歌反网络垃圾小组的负责人,我的职责是确保您得到的搜索结果尽可能的相关与翔实。也许您没有听说过网络垃圾,网络垃圾就是搜索结果中的垃圾结果,这些垃圾结果要么狡猾地骗取了搜索结果中较高的排名位置,要么违反了搜索引擎质量指南。如果您从来没有见过网络垃圾,下面是一个很好的例子:如果您在搜索结果中点击了这样一个垃圾链接,就可能会看到以下画面(点击可浏览大图)。
您可以看到,这是一个没有任何价值的网页。这个例子中的网页几乎没有任何原创内容,还充斥着大量无关链接以及对用户没有多大用处的信息。我们努力确保您不会看到这样的搜索结果。可以想象,如果您点击了一个谷歌搜索结果的链接却最终看到了这类网页会是多么的不愉快。
现在,搜索用户并不会经常在搜索结果中看到这样露骨的、纯粹的网络垃圾。但是,早在谷歌普及之前,在我们找到有效的反网络垃圾的方法之前,网络垃圾就已经是一个大问题了。一般而言,网络垃圾真的令人非常恼火,例如您搜索自己的名字,返回结果的链接却指向了色情网页。而对于许多非常注重获得相关性信息的搜索来说,网络垃圾成了一个严重的问题。例如,一个关于前列腺癌的搜索,获得的结果却充斥着网络垃圾而不是相关信息的链接,这会大大削弱搜索引擎作为一种有用工具的价值。
来自搜索日志的数据是我们用来与网络垃圾作斗争,力求返回更纯净、更相关的搜索结果的一种工具。IP地址和cookie信息等日志数据,使建立和使用指标系统、从不同方面衡量我们的搜索质量(例如索引的规模和覆盖范围、结果的"新鲜"程度,垃圾链接的数量等)成为可能。
每当我们创建新的衡量指标时,很重要的一点是能够审阅我们的日志数据,并利用先前的查询或搜索结果生成衡量网络垃圾的新的指标。我们使用搜索日志实现"时间回溯",看看谷歌几个月来在用户查询方面改进了多少。当我们建立了一个新的指标能够更加精准地衡量一种新型的网络垃圾时,我们不仅可以跟踪今后我们阻击这种网络垃圾的进展情况,更可以使用日志数据分析我们在几个月前甚至几年前对同一类型网络垃圾的处理效果。
IP和cookie信息非常重要,它们能帮助我们把这种方法的应用范围仅限于"合法"的用户搜索,而不是那些由机器产生的搜索以及其他虚假搜索。举例来说,如果一个自动程序一遍又一遍地将相同的查询发送至谷歌,那么在我们衡量用户看到了多少网络垃圾之前,就应把这些搜索查询剔除出去。所有这一切——日志数据、IP地址和cookie信息——都会让您得到的搜索结果更纯净、更相关。
如果您认为网络垃圾已经不再成为一个问题了,请再仔细想想吧。去年,谷歌的索引体系遭遇了来自.cn顶级域名的网络垃圾的疯狂攻击。一些网络垃圾制造者大量购买廉价的.cn域名,并在这些网站上堆满故意拼错的词汇和色情词汇。资深的用户可能还记得曾经读过几篇与此相关的博客,但绝大多数普通用户甚至可能从来没有注意到这些。普通的搜索用户没有注意到这些异常搜索结果的原因,是因为谷歌及时识别出了这些.cn网络垃圾,并通过一个快速跟踪项目,很好地应对了此类网络垃圾的攻击。如果没有日志数据帮助我们识别问题发生的速度和范围,可能会有更多的谷歌用户受到此类攻击的影响。
理想的情况是,绝大多数用户甚至不需要知道谷歌有这样一个反网络垃圾小组。如果我们的工作做得很出色,您可能偶尔会看到质量不高的搜索结果,但您无需面对恶意的JavaScript重定向、令人反感的色情内容、充斥着无意义内容的页面或其他类型的网络垃圾。我们的日志数据有助于确保我们追踪到网络垃圾的新动向,并且在它们影响您的搜索体验之前采取相应的行动。
Q:你还记得第一次与网络垃圾接触的情形是怎样的?
A:我第一次接触到的网络垃圾是一个色情网站。在我们的印象中,如果一个网站有较高的 Page Rank ,它应该是一个比较好的网站。可是我遇到的这个色情网站,却有着很好的反向链接结构和很高的 Page Rank ,这使我第一次意识到原来网络垃圾制造者们是可以通过一些不正当方式针对任何搜索引擎提高自己的搜索排名的。由于第一次接触的网络垃圾就是一个色情网站,所以我印象深刻。
Q:你认为在未来的五年内,搜索引擎面对的最大挑战是什么?
A:搜索引擎面临着很多挑战,其中一个很大的挑战恐怕是人们对搜索引擎的期望越来越高。Udi Manber, Google 的一位工程事务副总裁,曾经对此做出了很有趣的总结:几年前对我们来说是很难的那部分搜索查询,如今看起来已经不那么难了,因为我们对搜索查询的理解和处理能力有了很大的提升。但是与之相对应的是,用户对搜索引擎的期望也越来越高,他们不断提出难度越来越高的搜索查询。虽然我们的处理能力在不断进步,但是要不断满足用户日益提高的检索要求,挑战性还是很大的。
Q:中小网站的网站管理员怎样才能与互联网市场中的大型网站相抗衡?
A:在中小网站成立的初期,他们通常是很难与那些大型网站直接竞争的。在这种情况下,他们或许可以更精确地为网站定位。打个比方说,或许我不能制造所有种类的鞋子,但是或许我可以专门为那些脚型特别大的人制造鞋子。当您逐渐成为某一专门领域的专家和领导者后,那么您就可以逐步扩展自己的事业了。另外,作为中小网站,可以充分发挥自己富有创造性和决策迅速灵活的特点。这是中小网站与大网站相比,最具有优势的地方。中小网站可以积极尝试各种新的技术和经营形式,如果它们可行,就要果断地执行,或许不久您就会发现自己已经成为这一领域的权威来源了。
Q:每一个网站管理员都应该知道的是….?
A:网站管理员中心!这或许带有一点个人倾向,不过它确实提供了很多非常棒的功能,比如您可以查询自己的网站有哪些反向链接,用户是用什么搜索词进行检索时找到您的网站的,您的网站有没有失效的链接被 Google 抓取到等等。。。除此之外,您还可以看到很多关于您网站的统计数据。我个人最喜欢的一个功能是,如果您的网站上有隐藏文本或 Google 认为您的网站有垃圾结果嫌疑或您网站上有被黑掉的页面,那么您会在消息中心收到来自 Google 的讯息,提醒您注意并积极处理这些问题。另外,您还可以向Google举报您发现的可疑垃圾结果。网站管理员中心是我个人非常推荐您使用的工具,它们不仅功能强大,而且完全是免费的!
Q:你有没有这样的习惯,检查每一个日常生活中你遇到的网站,看有没有付费链接等问题?
A:呵呵,我确实有这样的职业习惯。我们经常开玩笑说,当你知道如何寻找和发现网络垃圾的时候,你会用一种不同于普通用户的视野,对每一个你遇到的网站,研究他们有什么好的地方,有什么不好的地方,为什么他们会把某些链接放在那里,等等。同时,我很高兴我们能够从我们的用户那里得到很多反馈意见,比如他们会举报自己发现的垃圾搜索结果,或者提出其他的建议。即使很多人仅仅是日常在网上冲浪,他们同样在探索怎样使 Google 变得越来越好,我们对此由衷感谢。
Q:你在各种会议上被问到的最有趣的问题是什么?
A:我记得曾经有一个与会者提问说:我有很多不同的网站,可是在 Google 和 Yahoo 的排名情况都不好,我应该怎么做才能改善我在搜索引擎的排名呢? Yahoo 的代表在回答问题之前首先反问这个网站管理员大约有多少网站,是五个还是十个呢?没想到这个网站管理员左顾右盼,迟疑了许久,才回答说:我有大约 1500 个不同的网站。全场人都惊呆了,他居然有这么多网站!
我还记得一个很有趣的问题是,有人问我 Google 对以不正当方式提高搜索排名的忍耐底线是什么?我觉得这就好比一个学生缠着老师,反复询问某某题目是否会出现在今后的试卷上。实际上,只要您建立了一个好的网站,用合理的方式对它进行推广,您就可以安枕无忧,不必担心什么是我们的忍耐底线了。
Q:如果 Google 最终把所有的网络垃圾都消灭了,你突然有了很多的时间,那么你会做什么呢?
A:我对各种各样的开源程序和小工具( Gadgets )很感兴趣,另外,我还非常喜欢各种各样的插件,比如Firefox插件, Photoshop 插件等等。如果我有大把的时间,或许我会写很多这样的插件,帮助人们实现和改善软件的功能,这是一件非常有趣的事情。
发表者: Mariya Moeva, 搜索质量组
原文:Requesting reconsideration using Google Webmaster Tools
发表于: 2008年7月2日星期三 上午9:49
如果您的网站没有出现在Google搜索结果内,您可能会有一点担心。在这里,我们收集了一些信息,帮助您确定何时及如何为您的网站提交一份申请重新审核的请求。
您可以按照Bergy(我们的视频资料中example.com网站的管理员)的做法,在片中他试图确定是否需要为自己的古罗马政治博客提交一份重新审核的申请。当然,并非所有网站管理员的问题可以追溯到Wysz (-:,但下面列出的简单步骤可以帮助您根据自己的情况找到正确的解决方案。
检查可访问性方面是否存在问题
您可能希望检查您的网站是否存在任何不能正常访问的问题——您可以登录到您自己的网站管理员工具账户,完成这项检查。在概述页面上,您可以看到Google机器人上次成功抓取到您网站主页的时间。另一种方式是检查您网站主页的快照日期。如需了解有关Google机器人如何抓取您网站的更详细信息,可以查看抓取速度图示(您可以选择:工具>设置抓取速度)。
在概述页面上,您还可以查看是否发生过任何抓取错误。例如,当我们试图访问您的网站时,如果您的服务器处于正忙或无法使用的状态时,您就会看到一个"网址无法访问"的错误讯息。另外一种可能是,您网站中有些URL被robots.txt文件屏蔽了。您会看到"网址受 robots.txt 限制"的字样。如果列出的网址中有些是您不希望被抓取的,您可以打开"工具",并选择"分析robots.txt" ——在这个选项中,您可以确认自己的robots.txt文件使用了正确格式,并且仅屏蔽您的网站上不希望被Google抓取到的部分。
除上述例子以外,还有其他几种类型的抓取错误——例如HTTP错误和URL超时错误等。尽管在这里我们并没有单独强调它们,但您仍能在网站管理员工具账户内的概述页面上看到所有这些错误的警示。
检查是否有未读消息
如果Google访问您的网站时没遇到任何问题,请查看网站管理员工具账户的消息中心内是否有未读消息。在这里Google会就有关您的网站管理员工具账户以及您所管理的网站等重要信息与您沟通。如果我们注意到您的网站出现了某些问题,我们可能会向您的消息中心发送消息,详细说明一些您需要修正的问题,使您的网站符合网站管理员指南的要求。
阅读网站管理员指南
如果您在消息中心内没有看到任何消息,那么请检查您的网站是否有哪些地方违反了网站管理员指南。您可以通过我们的"帮助中心"获得更多信息。
修复您的网站
如果您的网站违反了网站管理员指南,而且您认为这可能会影响Google对您网站的收录,您最好及时提交一份申请重新审核的请求。但在此之前,请修改您的网站,使它符合我们指南的要求。
提交重新审核的请求
现在您可以提交一份重新审核申请。请登录到您的网站管理员工具账户。在"工具"界面上点击"请求重新审核"并完成后续步骤。请务必解释清楚您认为您的网站的问题出在哪儿,以及您已经采取了哪些步骤来修复。
一旦您提交了请求,您将会在消息中心收到由我们发出的邮件,确认我们已收到请求。然后,我们将审核您的网站是否符合网站管理员指南的要求。
我们希望这篇文章能帮助您了解何时及如何申请重新审核。如果您不能确定Google为什么没有收录您的网站,我们的网站管理员支持论坛是一个寻求帮助的好地方。在那里,您会遇到许多既有丰富经验又很友好的的网站管理员和Google员工,他们会很乐意查看您的网站,并为您提出如何修复网站的建议。您可以在google.cn/webmasters/上找到指向帮助中心和网站管理员支持论坛的链接。
发表者:Ron Adler, Janis Stipins, Maile Ohye
原文:Improved Flash indexing
发表者:Sven Naumann,搜索质量组
原文:Duplicate content due to scrapers