Google 搜索联盟

显示标签为“seo”的博文。显示所有博文
显示标签为“seo”的博文。显示所有博文

2008年8月12日星期二

《Google网站管理员指南》的名言

Google网站管理员指南》名言:请不要为了提高搜索引擎排名而弄虚作假。 一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。 另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助? 如果不存在搜索引擎,我是否还会这样做?"

2008年8月2日星期六

给网站管理员的建议:创建可利用的、可抓取的网站

转载自:网站管理员博客

对于Accessible search,网站管理员们最经常问的一个问题就是:我怎样才能提高我的网站在Accessible Search上的排名?同时,网站管理员们还会问一个与之类似、但更为宽泛的问题:怎样才能提高我的网站在Google搜索上的排名?
我很高兴地告诉大家,这里有一个一举两得的办法:您可以建立和完善一些关键的网站特性,比如网站导航,这样它就能为所有用户服务,其中自然也包括谷歌机器人。下面是一些小建议,您可以参考。

确保所有重要的内容都能正常访问

为了使用户获取到内容,必须确保这些内容是可以访问的。用户及搜索引擎机器人都是借助超文本链接获取页面内容的,所以关键的第一步是确保您网站上的所有内容都可经由纯HTML超文本链接访问到,并避免网站的关键部分被JavaScript或Flash等技术隐藏起来。

纯超文本链接是指通过HTML锚元素<a>生成的链接。下一步,我们要确保所有超文本链接指向的目标,即<a>元素,都是真实的URL,而不是一个空的、真正的链接行为已经被转到点击触发控制器上的链接。

简而言之,要避免下列超文本链接的形式:

<a href="#" onclick="javascript:void(...)">Product Catalog</a>

我们推荐更简单的链接,如:

<a href="http://www.example.com/product-catalog.html">Product Catalog</a>

确保内容的可读性

只 有具有可阅读性,网站内容才能发挥作用。请确保您网站上所有的重要内容都以HTML文件的形式呈现,并且在无须评估页面脚本的前提下就可以获取。对于谷歌 机器人和绝大多数不知情的用户而言,Flash动画背后隐藏的内容和由可执行性JavaScript在浏览器端所产生的文本仍然是无法读取的。

确保内容按照适于阅读的顺序提供给读者

在获取可读内容后,用户希望能够按照合乎逻辑的阅读顺序跟进内容。如果您网站中的大部分内容采取了复杂的多栏布局设计,不妨退回去考虑一下您如何才能实现预期的效果。例如,使用深层嵌套的HTML表格会使人们难以将相关的文本按照合乎逻辑的顺序联系起来。

在HTML内使用CSS以及合乎逻辑、有组织的
元素,可以取得同样的效果。同时作为一个额外的收获,您会发现您的网站运行得更加快捷高效。

补充所有的视觉内容――不必担心重复!

让所有人都可以获得您的信息并不意味着让您把网站"降格"成为最简单的文本格式。最大限度地重复您的信息是很重要的,因为只有这样才能确保页面内容最大限度地帮助所有用户。这里有几个简单的小建议:

• 确保在图片缺失的情况下,用户仍然可以获得那些通过图片传播的内容。这不仅要在相关的图片上添加适当的ALT属性,还要确保图片周围的文字能够详细地介绍背景,让读者了解为什么这张图片会出现在这里;同时详细给出您期望人们看到这个图片后所得出的结论。简言之,如果您想确保每个人都知道此图片表现的是一座桥梁,那么您最好把该图片周围的文字也以拱形排列。

• 添加相关的摘要和标题,让读者在钻研细节之前可以获得高屋建瓴的信息概述。

• 在数据展示之类的视觉形象旁边添加详细的文字总结。

采纳上述建议可以大大提高用户登陆页面的质量。同时,作为一个额外的收获,您还很有可能惊喜地发现您的网站得到了更好地索引!

2008年2月28日星期四

Google PR 正在更新

版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
刚刚在点石看到Google PR 正在更新一文。
看到这篇文章,检查了一下自己的PR,似乎没有变化。也许是我的网站更新还没有开始还是PR不更新了。
最近的Google PR有点怪异。PR上个月才更新过,这次更新才隔了一个多月,似乎并没有按照往常的3个月一次。不知道Google是不是不按照那种有规律的更新了?

2008年1月31日星期四

隐藏 robots.txt

robots.txt 会暴露目录结构的问题,今天找到了答案。用 urlrewrite

RewriteCond %{HTTP_USER_AGENT} ^(Mozilla|Opera)
RewriteCond
%{HTTP_USER_AGENT}!(Slurp|surfsafely)
RewriteRule ^robots\.txt$ /someotherfile [L]

或者干脆 urlrewrite 到 cgi 或者 php 文件。
如果不想 urlrewrite 的话还可以设置txt伺服类行为应用程序,application/x-httpd-php .txt,对 .txt 当成 php 处理。注意:这时候站点内的其它 .txt的第一句都要有

详细说明在 Advantages of a smart robots.txt file

2008年1月26日星期六

申请从谷歌的索引中删除内容

转载自谷歌中文网站管理员博客
(译者注: 本文讲述了如何申请从谷歌的索引中删除内容,包括你自己拥有的内容及其他你所不拥有但是包含特殊信息的内容,如不健康内容或你的个人信息)

作为网站拥有者,网站的什么内容被搜索引擎索引,你完全可以控制。当你想让搜索引擎知道什么样的内容您不希望它们索引时,最简单的方法是使用robots.txt文件或robots元标记。但有时候,你想要删除已经被索引的内容。有什么最好的方法来做到这一点呢?

同以往一样,我们的回答总是这样开始:这取决于你想要删除的内容的类型。我们的网络管理员帮助中心提供了每种情况的详细资料。每当我们重新爬行该网页, 我们就会从我们的索引中自动移去你要删除的内容。但如果你想更快地删除你的内容,而不是等待下一次的爬行,我们刚刚有了一些方法使做到这一点变得更为容易。

如果你的网站已经通过了网站管理员工具帐号的网站拥有者验证,你就会看到在"工具"下有一个删除网址链接。要想删除,你可以点击删除网址链接,然后再点击新增删除请求。请选择你想要的删除类型。

单个网址
如果你想移除一个URL或图像,请选择此项。一个可以删除的URL必须符合以下条件之一: 如果一个URL可以被删除了,你输入该URL,看看它是否出现在我们的网页搜索结果或图像搜索结果里。然后点击添加。您可以一次添加多达100个URL的请求。当你添加完所有你想删除的URL后,点击“提交删除请求”。

单个目录
如果你想删除你站点的一个目录下的所有文件和子目录,请选择此选项。例如,如果你请求删除以下内容:

http://www.example.com/myfolder

这将删除所有以该路径为开头的URL,譬如:

http://www.example.com/myfolder
http://www.example.com/myfolder/page1.html
http://www.example.com/myfolder/images/image.jpg

为了使目录可以被清除,你必须用robots.txt文件来阻截搜索引擎。例如,上面的例子中, http://www.example.com/robots.txt可以包括以下内容:

User-agent: Googlebot
Disallow: /myfolder


你的整个网站
只有当你想从Google索引删除你的整个网站时,才选 择此选项。此选项将删除所有子目录及文件。对于你网站的被索引的URL中你不喜欢的版本,请不要使用此选项来删除。举例来 说,如果你想你的全部URL只有www的版本才被索引,请不要使用这一选项来请求删除非www的版本。你可以使用设置首选域名工具来指定你希望被索引的版本(如果可能的话,做一个301重定向到你喜欢的版本)。使用此选项,你必须使用robots.txt文件拦截或删除整个网站

缓存副本

要删除你的网页在我们索引中的缓存副本(又称网页快照--译者注),请选择此项。你有两种方法来使你的页面符合删除页面缓存的条件。

使用noarchive元标记来要求快速删除
如果你根本不想让你的页面被缓存,你可以在该页面上加一个noarchive元标记,然后再在工具中要求快速删除缓存副本。通过使用工具来要求删除缓存副本,我们会立刻执行。由于添加了noarchive元标记,我们将永远不会有该页的缓存版本。 (当然,如果你以后改变主意,你可以去掉noarchive元标记)。

改变网页内容
如果你的某一页面已被删除,你也不想让它的缓存版本存在于Google的索引中,你可以在工具里请求删除缓存。我们会先检查一下该页的现有内容是否真的有别于缓存版本。如果是,我们就会清除缓存版本。我们会在6个月后 自动显示最新的缓存页面版本(6个月后,我们可能已经又爬行过你的页面,缓存版本会反映最新的内容) ,或者,如果你发现我们早于6个月重新爬行了你的页面,你可以用工具要求我们早一点重新包含缓存版本。


查阅删除请求状态
你的删除请求状态将是“等待中”,直到他们被处理。处理后的状态变化,要么是“被拒了”或者是“删除了”。一般来说,如果被拒绝,它一定是不满足被删除的条件。

请求内容的重新收录

如果请求是成功的,它就会出现在删掉的内容栏里。你可以随时重新收录你的网页,只要删掉robots.txt中的相关内容或相关页上的robots元标记,然后点击Reinclude。删除内容的有效期是六个月。六个月后,如果我们重新爬行网页时网页内容仍然是被阻截的或者返回一个404或410状态信息,它就不会被重新索引。不过,如果六个月后该页面可以被我们的抓取工具抓取,我们将再次把它列入我们的索引。

请求删除不是你拥有的内容

如果您想要求删除的内容在不属于你的网站上,怎么办呢?现在做到这一点更容易了。我们的新的网页删除请求工具逐步和你完成每个类型的删除过程。


因为Google仅仅索引网页,并不能控制网页的内容,我们通常不能从我们的索引中随便删除一些结果,除非网络管理员阻截Google、修改了内容或删除了页面。如果您想删除某些内容,你可以和网站所有者进行一下沟通,然后用此工具来加速从我们的搜索结果删除。

但是,如果您发现搜索结果中包含特定类型的个人信息,你可以请求删除,即使你不能和网站所有者沟通。对于这种类型的删除,请提供您的电子邮件地址,以便我们能够与您直接沟通。




当启动健康内容搜索时,如果您发现一些搜索结果中有不健康的内容,你也可以使用工具通知我们。


你可以查阅“等候中”请求的状态。在当前网站管理员工具的版本中,一旦请求被处理,请求状态将会变成“已删除”或“拒绝”。一般来说,如果被拒 绝,它一定是不满足被删除的条件。对涉及个人信息的请求,您看不到任何状态,但是你会收到一封电子邮件来要求你为以后的步骤提供更多的资料。

老的URL删除工具中的请求会有什么样的结果呢?
如果您已经用老的URL删除工具提交了删除请求,你仍然可以登录来查阅这些请求的状态。但是,如果你有新的请求,请使用现在的新的和改进的工具版本。

2008年1月24日星期四

子域名和子目录

转载自谷歌中文网站管理员博客

(译者按: Matt Cutts, 谷歌反网络垃圾组的带头人。本文译自Matt Cutts的个人博客,供读者参考)
原文: Subdomains and subdirectories
发表于:2007年12月10日上午12时17分

Pubcon会议接近尾声时,我发现 的文章在谈论Google对子域名和子目录的处理。也许我在会上没有把这一方面说清楚,我在这里再详细谈谈这个主题。

从以往记录来看,使用子域名与子目录的时间几乎是对等的。顺便提示一下,在一个象subdomain.example.com/subdirectory/的网址中 ,子域名是"subdomain",子目录是"subdirectory" (有时也被称为文件夹)。如果您还不清楚,你也许可以阅读一下我的“一个URL的组成部分的辅导材料”

如果你把你的内容放在子目录里,通常的原则是所有信息都存储在同一空间里。这可以使找到/编辑/更改代码变得很容易。同时,它也不难把代码从一个地方移到另一个地方。然而,一个子域名往往是一个域名系统(DNS)的别名。子域名的设置对网络管理员新手来说可能有点难,特别是如果"CNAME"对你来说不意味着任何意思。子域名可以分开管理,对你来说可以是一个好事(如果你想转移你网站的一部分,你可以使用DNS来和子域名脱钩),也可以是个头疼的事(DNS的设置相当麻烦,不像使用子目录一样仅仅使用几个命令就可以建立或移动目录)。以我为例,当我开始建我的博客时,我决定用一个子目录(mattcutts.com/blog/),仅仅是想使事情变得简单。

几年来,Google使用了一个所谓的"密集主机(host crowding)"算法,它意味着,对一个域名的每个主机名(hostname)或子域名,Google至多显示两个结果。这种办法(从一个子域名内显 示1-2个结果)一直运行非常良好,但我们也收到这样的投诉:对一些类型的搜索 (如生僻或长尾搜索),Google的一个搜索页面上可能出现很多结果都来自同一个域名的情况。在过去几个星期里,我们改变了我们的算法,使这一现象在未来再也不太可能发生。

这一变化并不会彻底改变有些搜索结果全部来自同一域名的情况;如果某个域名相关性确实非常强,我们仍可能从那个域名中返回多个结果。举例来说,如果一个搜索是[ibm],用户可能确实喜欢并想看到从ibm.com的结果。注意我们的算法变化是一个相当微妙的变化,并没有影响到我们绝大部分的搜索。事实上,这种变化已经存在了几个星期左右,到现在也没有人注意到。:)我在PubCon上谈及此变化的唯一原因是因为有人想听听我对子域名与子目录的意见。

对子域名和子目录,我个人更喜欢子目录。这是因为 我通常倾向于子目录为我的大部分内容提供的方便。一个子域名可有效分离出完全不同的内容。例如,Google为完全不同的产品使用子域名,例如news.google.com或maps.google.com。如果你是一个网络管理员或搜索引擎优化业者新手, 我建议你使用子目录,直到你对你的网站结构有足够的信心。在这一点上,您将可以对你的网站有更好的理解,从而作出正确的决定。

2007年10月27日星期六

Google PR大规模更新

早上起来一看Google Toolbar 上面的绿块,很多站的PR都已经刷新,这是很多SEOer期待已久的事情。

随便看了一些站,观察了一些5月份后增加的栏目和文章,PR由原来的0升到2-3不等,不过有点意外的是有几个8月份注册的域名PR也都上升到3了,也有部分由3降低至2,当然,本次更新来的比较突然,仿佛就在一夜之间,关于还会不会有什么新的变化或者调整,我们继续关注中,赶快Check一下你的站点吧!

作者: 枫林&SEO博客

2007年9月19日星期三

How we use spam reports

Google Webmaster Tools not only help us communicate with webmasters, but also provide a channel for you to inform us about spam sites you find online. Thanks to you, we’ve received many spam reports that have helped us improve search quality by showing more relevant, useful sites in our results.It's easy to submit a spam report via either of two channels, authenticated and unauthenticated. We give a higher priority to the reports that are submitted through an authenticated channel such as Webmaster Tools. Or you can submit unauthenticated reports. Since the unauthenticated reports are reported anonymously, we may give it lower priority to process.Here's how a spam report submitted from Webmaster Tools is processed:
We evaluate the spam report
We take spam reports very seriously, and we have dedicated staff to timely process reports.
We primarily evaluate spam reports in reference to our webmaster guidelines. We determine whether we agree or disagree with the user's report.
A spam site commonly uses illicit techniques to mislead search engines to (mis)lead users to certain websites. The Webmaster Guidelines cover most (but not all) common forms of behavior that we consider deceptive or manipulative. We suggest you review our webmaster guidelines listed in our Webmaster Help Center. These will help you create a search-engine friendly website that both Google and users would view as spam-free. There are cases where we disagree with the spam report's evaluation, and those reports are then disregarded. The confirmed reports are forwarded to our engineering teams.We take action on confirmed spam reports
We take action on many confirmed spam sites, either manually and/or algorithmically. Furthermore, the extent of our action is dependent on the severity of the violation -- a confirmed spam report doesn't necessarily mean the entire site will be removed from the index.Taking action on spam by improving our algorithmsIt's most efficient for us to combat spam through our algorithms. We use spam reports about one site to create algorithmic improvements detecting spam in all sites similar to the report. We then extensively test our changes before we push our new code into production. This engineering process takes time. When people ask the question "Why haven't you penalized the spam site I've reported?", if we confirmed their spam report, then it's likely that we're working, or will be working, on an algorithmic solution.Taking manual action on a spam siteWe may also take manual action on confirmed spam sites. This process is obviously much faster, but it's not as robust a method to improve our search quality as the algorithmic approach.We can contact webmasters to correct their site
If we believe that a reported spam site is in violation of the webmaster guidelines but is otherwise legitimate, we may try to contact the webmaster to correct their site. We contact webmasters via email and, if they have a verified site in Webmaster Tools, we can also send them a note through the Message Center. Our goal is to deliver the most relevant results to users. We hope that our users and webmasters keep reporting spam sites, as it helps us to improve our algorithms and improve search quality. If you have questions about what's spam, visit our Help Center or post your question in our discussion group. And, of course, if you find a spam site, please let us know!

2007年9月18日星期二

Google(谷歌)是怎样处理垃圾网站举报?

自从谷歌中文网站管理员博客开站以来,感觉的到谷歌跟站长们的沟通越来越近,不象以前那样跟google反垃圾组沟通总是觉得怎么遥远。最近谷歌中文网站管理员博客发了一篇《我们怎样处理垃圾网站举报?》,以下是官方站点内容:

发表者 谷海一粟, WebSpam 组转载自谷歌中文网站管理员博客
谷歌网站管理员工具不仅能帮助我们和网站管理员沟通,也提供了举报垃圾网站的在线渠道。感谢我们的用户,我们收到了很多垃圾网站举报。这些举报对我们改进搜索质量,给出更相关、有用的结果有很大帮助。谷歌用户可以很方便地通过两个渠道(认证的和不需认证的)进行垃圾网站举报。我们往往优先处理通过认证的渠道(譬如站长工具)递交的垃圾网站。当然,你也可以提交未经认证报告。由于未经认证报告是匿名举报,我们给他们赋予的优先级会相对较低。
这里我们想讲一讲我们是如何处理从站长管理员工具得到的垃圾网站举报的。
我们评估垃圾网站举报
我们非常重视垃圾网站的举报,并有专门人员及时处理。
我们主要根据我们的网站管理员指南来处理垃圾网站举报,确定是否赞同或不赞同用户的举报。
垃圾站点通常使用作弊手法来误导搜索引擎使之错误地把用户带入某些网站。谷歌网站管理员指南包含大部分(但不是全部)常见形式的欺骗性或操纵行为。我们建议你经常阅读我们网站管理员帮助中心上的网站管理员指南。该指南内容将不但帮助你创建一个对搜索引擎友好的网站,而且避免了谷歌和你的用户把你的网站看作是垃圾网站。
在有些情况下,我们并不赞同用户的举报内容,被举报的网站将不会受到任何影响。对确认作弊的垃圾网站我们会将他们转交给我们的软件工程师作出相应的惩罚。
我们对确认的垃圾网站进行惩罚
对确认作弊的网站,我们会人工地或从算法上采取一些行动。当然,我们对作弊网站的惩罚度会视网站违反质量指南的严重程度而定,也就是说,对确认作弊的网站并不总是把他们全部从我们的索引中移去。
改进反垃圾网站算法反垃圾网站算法是我们打击垃圾网站最有效的方法。对某一网站的举报可能改进我们对所有类似垃圾网站的处理算法。当然,在我们使用我们的新代码之前,我们会大量地测试新代码。这个过程需要时间。当人们问”为什么我举报的网站没有受到惩罚?”,如果是我们确认的垃圾网站举报,很可能是我们正在给出,或者将会给出一个算法上的处理。
人工处理一个垃圾站点我们也可能人工处理一个确认了的垃圾网站。这个过程显然要快得多,但它并不是一个健全的方法。我们更愿意使用算法改善我们的搜索质量。
我们可能联系网站管理员,让他们改正他们的网站
如果我们发现一个被举报的垃圾站点可能无意中违反了谷歌网站管理员指南,我们会试图联络网站管理员来以纠正他们的错误。我们可能通过电子邮件来联系网站管理员。如果他们已经在网站管理员工具上确认了他们的网站,我们会通过信息中心来传递我们的信息。
我们的宗旨是为用户提供最相关的结果。我们希望我们的用户和网站管理员继续举报垃圾网站。它对我们改进算法和改善搜索质量是有很大帮助的。如果您还不了解什么是垃圾网站,请访问我们的帮助中心或者在我们的讨论组上发表你的问题。当然,如果你发现一个垃圾网站,请告诉我们

2007年9月16日星期日

使用Google工具条有助于网站收录

很多站长都怀疑Google工具条是否有助于新站的收录,之前风采依扬也问过SEOer,Google工具条是否有利于网站的收录?答案比较模糊,有的人说:Google tool有可能会把信息发送到google服务器上,但必须大量使用。有的人说:之前Matt Cutts跟Philipp打过赌做试验,最后是Matt Cutts胜出。

今天风采可以告诉大家,google工具条是有利于收录新的页面。我们来看一下Google工具条的设置选项,如图:

在设置选项中”向Google发送使用统计信息”,用户可以选择自己电脑上Google 工具栏是否向 Google 自动发送标准的、数量有限的信息。而Google官方网站也指出:“这些信息可能会保留在 Google 的服务器日志中。除非您启用工具栏的高级功能,否则工具栏不会发送任何有关您访问网页的信息(如网址)。”
风采依扬今天也在车东的博客上看到:基于Google工具条的新内容发现,车东在文章中说:我做了个一个测试网站,但是这个地址是是我刚打开的,只通过我的浏览器访问过后,Googlebot很快就跟过来了。能发现这个地址的,应该只有Google工具条了。
所以进一步的证实google toolbart是有助于新的页面更容易让Google收录!
Google为什么在google tool使用统计信息?
我们知道Google搜索是注重用户体验的,网站用户体验不好在SE上也不会获得有好的排名,同时google 网站管理员指南中也指出:网站应实用且信息丰富,网页文字应清晰、准确地表述要传达的内容。要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。Google是拥有一大批用户体验专家,专门负责对Google各项网络技术产品进行易用性改进。因此google toolbart选项中”向Google发送使用统计信息”可收集用户体验数据同时也有助于新站的收录。
有兴趣的SEOer可以一起探讨一下,SEOer也可以做做实验。^_^

作者: 风采依扬 原载: 点石互动搜索引擎优化博客版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

2007年9月11日星期二

有利于用户体验和SEO的TAG写法

本文并没有高深的知识,很多朋友对TAG的理解已经非常好。写这么一篇“有利于用户体验和SEO的TAG写法”,起因是发现有的朋友对TAG的理解和使用非常糟糕,所以KYW总结一些规律,仅供参考。

什么是TAG?Tag是一种分类系统,也可以说是一种关键词标记。通过tag可以把有相关性的文章联系起来。
为什么要写TAG?从用户角度来说,TAG可以帮助用户很快找到相同主题的文章,增加用户粘度和人均PV。从SEO角度来说:1. 增加网站收录数量。2. 提供给搜索引擎一个主题鲜明的TAG页面,以获得排名,从而带来流量。这里我们以土豆网的TAG举例,你会发现搜索某些热门关键词,特别是影视名称时,都会看到土豆的排名,例如关键词“花样少年少女”GOOGLE排名第三


百度排名第二

TAG的使用经验分享:1. 首先TAG一般来说是名词,形容词、动词等做TAG就不太好。
2. TAG的应该有精确到小分类。例如“时尚 汽车 设计”这些词属于大分类,完全可以成为网站频道的,做TAG就很不合适。TAG需要进一步细分,一方面可以给用户提供精确的相关内容,用户点击TAG后呈现的就是用户想要的内容。上面的TAG改成类似“时尚衣着 汽车价格 设计大赛”,这样就好很多。当然细分也有个尺度问题,如你细分到“大众汽车轮胎螺丝”,那会很长一段时间,这个TAG页面只会显示一篇文章。
3. TAG文字最好能在正文中精确匹配(完整的出现)几次。例如把“时尚手机”作为TAG,但正文中提到手机提到时尚,但没有连续出现“时尚手机”,那也不是最好。
4. 一篇文章的TAG数量没有标准,不需要说规定死每篇文章一定写3~5个,完全可以由编辑自由发挥。例如本文只有一个TAG,我不会生搬硬套的往上加。
上面就是KYW的TAG经验分享,每个人都有自己对文章的理解,所以大家写出来的TAG多少会不太一样。现在博客很流行,TAG在博客中应用非常广泛,一些大网站的TAG也用的非常好,如果您公司有编辑人员,给编辑多些时间去这些网站逛逛,然后让编辑对比门户网站的TAG和自己写法的不同,会有进步的。

作者:Kyw@SEO-搜索引擎优化实验室原载: 点石互动版权所有,转载请以链接形式注明作者及原始出处。

2007年9月9日星期日

网站改版应注意的事项

网站改版无非是为了使自身的站点能更好的吸引访问者,留住访问者,当然提升网站在搜索引擎中的表现也是很重要的,总之网站改版是为了在原有的网站上获得更好的表现。

在网站改版中SEOer最怕的就是现有的排名、某些关键词的排名会受到影响,那么我们应该怎样去避免这些风险呢?
一、检查之前的排名情况:
我们可以利用流量统计或由搜索引擎查询来检查原有的网站排名情况,如果是某些特定的关键词那就更了解现有的排名情况,可用记事本、Word来记录好,之前网站的排名情况及网页的标题、关键字等。风采依扬之所以把检查排名情况放在第一步,是因为在建新站时,这些页面的标题、内容、关键字密度尽量少改动,避免在新改版后排名的浮动。
二、保留原有的网页命名/PR值:
保留原有网页,即使网页的结构和内容被更改,搜索引擎蜘蛛还是可以按“原路”找到页面。这种方式能让蜘蛛更快的重新收录原页面中的新内容,也保护了原有的排名及页面的PR值。当然,如果有些页面不合理的,不适合搜索引擎或因设计需要的可以删掉。
三、保留旧网站结构和内容:
在新站建立后,不应马上删掉旧的网站内容,应在原来的旧网站页面中,建立合适的链接指向新的网页。如果原有的网页被删除,就要做404页面避免蜘蛛来时扑空,如果某些页面的排名或PR值高,而因设计的需要非删不可,可使用301永久转向到新的网页。
四、Sitemaps 更新:
能让搜索引擎更好、更快的收录新站,建议建立Sitemaps,告诉搜索引擎我的网站在改变,牵引搜索蜘蛛去收录新的页面。
五、避免站点内容的冲突:
风采依扬经常会发现,一些新改版的网站的内容跟旧版本的内容几乎是一样的,这样对搜索引擎是不友好的,另外加上新、旧网站的网站结构不一样,搜索引擎有可能要花更多的时间来观察、分析你目前的网站情况。所以应该处理好新、旧站之间的链接、内容的关联性,避免出现内容重复。
六、新站维护:
以上工作基本上完成后,一个崭新的网站就出来,在些期间应对网站的内容及时更新。同时去寻找几个高质量的链接,让搜索引擎尽快的收录新站的页面。另外新站的建立后有可能会造成流量的损失,不妨考虑做PPC广告来弥补目前流量的损失。
作者: 风采依扬 原载: 点石互动搜索引擎优化博客版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

2007年9月8日星期六

robots

http://blog.pcxingxing.net.ru/robots.txt
User-agent: *
Disallow:

2007年8月30日星期四

Google对交换链接的态度改变了么?

链接是Internet之所以成为Internet的基础,也顺理承章地成为搜索引擎判断网页重要性与权威度的主要依据。相对于Yahoo!与Live搜索,Google的排名算法对链接的依赖性更强——至于Baidu,因本人能力所限,不敢判定,但从其当年铺天盖地大唱绕口令来看,也许在其算法中那神奇的“中文分词技术”起着更关键的作用——更易受各类“人工链接”的影响,也正因为此,Google在如何解决非自然链接对排名的影响方面也是最努力的,客观地说,效果还是很显著的,比如说明确反对付费链接,直接让诸如Text Link Ads之类的生存空间几乎完全被压缩。

最近,细心的朋友可能已经注意到,Google在网站管理员中心对可能导致惩罚的链接方案给出了详细的限定,其中,明确地指出“你链接我我链接你”的链接交换或互惠链接将会为最终的网页排名带来负面影响,一位朋友因此发来邮件询问,这是不是意味着Google对交换链接的态度发生了根本性的改变,是不是意味着今后在SEO中应避免交换链接。
下面谈谈我们对此的看法。
交换链接:低效但普遍存在
虽然从个人角度,我对交换链接一直持排斥的态度,SEO探索也从未接受过任何关于交换链接的请求,但那主要是因为个人认为交换链接并不能保证SEO的效率,交换得来的链接不仅很难保证相关性,而且链接价值也极易缩水,并不能称为一种可靠的SEO手段。这点相信不存在争议,毕竟,交换链接的实施门槛很低,几乎可以说任何网站只要愿意都可以采用,易于实施的必然结果便是意义不大。
但另一方面,正因为交换链接实施的低门槛,也使得其在Internet上是普遍存在的,几乎绝大多数的网站都或多或少地存在着交换链接的行为。虽然我们不能由此而说“存在的就是合理的”,但是,以Google的聪明,真的会对这么一种普遍存在的行为动刀?似乎有点堂吉诃德战风车的嫌疑。
Google将惩罚交换链接?
让我们具体来看看Google在该名为链接方案的网页中是怎么说的(以中文版为例):

但是,某些网站管理员利用链接交换方案,单纯为交叉链接而建立合作商网页,而不顾链接(来源)的质量及其对自有网站的长期影响。这种做法违反 Google 的网站管理员指南,可能对网站在搜索结果中的排名产生负面影响。链接方案的示例包括:
* 旨在操纵 PageRank 的链接* 链接到网络上的违禁网站或”恶邻”* 链接交换和互惠链接方案(”你链接我,我链接你。”)* 购买或销售链接


首先,从该页的ID号“66356”来看,该页应该是在前段时间Google网站管理员指南更新时新加入的,当时我们曾介绍过ID为“66355”的隐藏真实内容或欺骗性的重定向手段和ID为“66357”的自动查询,却漏过了这一篇。颇为有趣的是,在更新后的Google网站管理员指南页中,新加入了ID自“66353” ~ “66361”(注:“66360”不存在)的其他全部内容,而惟独没有该页,不知道说明了什么。——声明,绝非暗喻该页由实习生撰写之意 。
该页的行文也颇有意思:按一般理解,其所列的四条“示例”,应为并列的,即至少不能是互相包含的,但客观地分析一下,其第三项“交换链接和互惠链接”及第四项“购买或销售链接”难道不都是“旨在操纵 PageRank 的链接”的子集么?——也许有的朋友对此有异议。举例来说,也许认为购买或销售链接并不都是不当的,但如果购买或销售链接时按Google的要求使用 nofollow 属性或将链接重定向至被 robots.txt 文件拦截的中间网页上的话,其便完全不应该出现在“可能导致惩罚的示例列表”中啊!——这四项究竟是怎样的一种逻辑关系啊?简直令人崩溃!甚至要怀疑李前著名副总裁在教导“中国学生”之余也在同时教导“美国学生”了(当然,前提是该页内容由美国人率先在英文版本中创建。不过本人不敢确定,毕竟谷歌目前也相当牛,比如说著名的AdSense域名保护列表不是由谷歌率先推出的嘛。)。
也许,勉强说得过去的解释只能是,尽管3、4均为1的子集,但Google仍将3、4与1并列,意在强调对交换链接、付费链接的明确态度:从之前的含含糊糊转变了明确的反对?
“从善如流”的Google
虽然这个新加入的“链接方案”页在中文SEO领域未引起太大关注——还是我孤陋寡闻没有看到?——不过,在英文领域似乎引发了不小的反弹,许多人对此展开了讨论。
很快地,可能是为了安抚SEOers,也可能Google自己也意识到某些不妥,大约在8/16左右,悄悄地将上述列表中第三项关于交换链接的内容进行了修改(英文版本),从最初的:
Link exchange and reciprocal links schemes (”Link to me and I’ll link to you.”)
改成了:
Excessive reciprocal links or excessive link exchanging (”Link to me and I’ll link to you.”)
即加上了一个修饰语,“Excessive”,让挑剔者们统统哑口无言。
但是,这是不是意味着Google的态度又有了新的改变?恐怕很难说,加上“Excessive”也许只是为了让表述更加严密,不让人找出漏洞而矣。同时,又带来另一个关键的问题:究竟怎么的交换链接建设才是适度的?这里面有没有个标准尺度?不然,便会闹出类似于“打哪指哪”的笑话:受惩罚的便是交换链接过度而未受惩罚便代表着交换链接未过度?
此外,截止到目前为止(8/22),谷歌的中文版本中仍未予更新。——似乎除English外的其他语言版本均未更新,包括English (UK),当然,我也看不懂其他语言。
我们对交换链接的建议
再次重申,我们不建议交换链接。如果您有其他可行的SEO策略与方案,建议远离交换链接。
如果您的网站中存在一定的交换链接,倒也不必因此而过度惊慌。但必须看到,链接是Google算法的核心,而目前各类不当链接的泛滥已经从根本上影响到Google的搜索质量,这点是Google亟待解决的,因此,不要低估Google可能采取的力度。而与其他类型“旨在操纵 PageRank 的链接”相比,如付费链接难以发现Google希望通过用户举报的方式找出,交换链接在搜索引擎中几乎是无所遁形的,最易判断。网站即使不因交换链接受到惩罚,搜索引擎也可以很简单地将其价值“清零”。
从个人角度,相对于网站“主动的”交换链接,我倒是建议朋友们应警惕无意中形成的交换链接:
许多blog网站为了鼓励用户留言,而取消了留言中链接的“nofollow”属性,这大大增加了网页中链接的不可控性:即使您对正文中出现的链接多么谨慎,但留言中的链接则有着很强的不确定性,很容易在无意中与其他网站中的页面构成事实上的交换链接;
更有甚者,许多blog也许为了吸引链接,取消了Trackback的“nofollow”属性,这带来的后果几乎是百分之百的交换链接:只要接收到链接到该页的对方网站发来的PingBack / TrackBack并予以发布,两个网页间链接的交换便形成了。
当然,上述所举的只是针对blog的简单例子,但是,类似这样的情况,即使不是您有意而为之,如果在您的网站中频繁发生,后果也许便会变得很严重。

作者: highdiy原载: 点石互动搜索引擎优化博客

2007年8月12日星期日

Matt Cutts是谁?

Matt Cutts是Google公司资深的高级工程师。他在2000年加入Google,据他自己说他应该是最前100名的Google员工之一。Matt Cutts拥有数学和电脑的博士学位,毕业于北卡罗莱那大学。Google的家庭过滤器(也可以称为成人或色情过滤器,用来过滤掉色情网站内容)就是 Matt Cutts写的。

Matt Cutts虽然工作于技术部门,负责程序的编写,但是长时间以来,他也无形中承担了Google和站长之间的桥梁。在某种意义上来说,充当着技术方面发言 人的角色。这个角色并不是正式的或是官方任命的,而是长久以来因为他经常在著名的站长论坛上发表一些意见,经常代表Google参加在世界各地举办的搜索引擎研讨会等。

从2005年开始,Matt Cutts开始写他自己的博客。在他的博客上,他讨论的内容还是很广泛的,包括旅游,电视,音乐,甚至食物等。当然,由于他的特殊身份,最受人关注的内容还是 搜索引擎优化和Google排名算法

所有的搜索引擎都把他们的排名算法视为极度的商业秘密,外界根本不可能得到任何确定的排名算法的信息。在搜索引擎自己的网站上,你也很难找到明确的细节的关于排名算法的说明。Matt Cutts的个人博客就成了几乎唯一的半官方性质的信息来源。

从他的博客内容当中,我们可以得到以下几方面的好处:

1) 关于Google的排名算法及更新等情况的预告。大家都知道Google经常进行数据和算法更新,而在这些算法更新当中,网站排名会上下波动。如果你很清 楚的知道目前正在更新当中,就不必紧张了。Matt Cutts会在他的博客上面经常预告或者证实这些Google更新,比如Matt Cutts在2006年3月22号提到,不久我们将会看到PR更新。

2)从他的博客当中,我们可以确认某些搜索引擎排名技术。虽然这些技术往往是显而易见的,但是我们却没办法确认。比如说哪些技术被认为是恶意作弊技术,在Matt Cutts的博客里面,他举出了一些非常具体的确实的属于恶意试图操纵搜索结果的技术。

3)另外,我们也能经常从他的博客里看到他的一些暗示。虽然并不能100%的确信,但是经常可以从某一方面验证搜索引擎排名技术。

4)在他的博客里面,尤其是当Google正在更新的时候,他们需要站长的反馈意见来完善他们的算法。如果我们确实看到很严重的问题,也可以在他的博客里提出意见。更重要的是Matt Cutts确实看那些评论,而且会采取行动,比如通知相关部门等。

Matt Cutts的博客是非常重要的信息来源,但他的博客是英文的,因为语言的关系,很少看到中文的对这方面的介绍。我将会翻译他的重要的关于搜索引擎技术的博客,适当的时候加上我的一些看法和评论。

2007年7月31日星期二

如何提高网站转换率?

最近风采依扬发觉把网站带来了流量是远远不够的,很多人都做娱乐网站、垃圾站可以带来很大的流量,但是转换率不高。光做SEO是远远不够的,只有将网站的访客变为顾客,才能将更高的访问量变为更高的收益!至今越来越多的人将网络视为获取产品和服务信息的首要途径,他们通过网络搜索引擎来找到自己感兴趣的企业网站或者产品信息。如果企业希望将这些网站访问者转变为自己的顾客,就需要三个方面下功夫,也就是风采依扬接下来要说的重点。

一、关键词研究 关键词研究放在首位,研究访问者在“关键词—广告词—网站”过程中所遵循的原则,去站在访问者的角度去考虑研究用户搜索习惯。
1、 放弃热门关键词热门的关键词是非常之诱人的,每个人都想把这热门的关键词做上去。但是我们不是八十年代的爆发富,不会一夜之间用户搜索者就涌进你的网站。在SEO服务中我跟客户承诺我每天可以给你带多少个客户给,而不是承诺某个热门的关键词排名所以说不要被最热门的关键词的高访问量所迷惑,要去寻找你网站最适合网站的关键词,哪怕这些关键词不是最热门的,对网站“正好合适”一定要以他们为目标。
2、 不要选择太冷门的关键词有时候冷门的关键词很少或者是没有人会搜索到的,即使你可以排到第一位,但是没有搜索者去搜索的话也是毫无意义的。但是有些冷门关键词的选择实际上是有意义的,我们可以利用百度指数,谷歌趋势、雅虎风向标等工具来获知用户的需要。去选一些搜索者去搜索的冷门关键词。
3 、 选择正好合适的关键词为什么正好合适的关键词起作用?其实并不难理解。搜索引擎实际上为每个搜索者寻找网页方面做得很好,搜索者看到的结果上点击合适的网页。也就是说如果你的目标关键词真的与你站点相关,那这就是你要的合适的关键词。风采依扬在之前的一篇“网站页面内容优化”有详细说到怎么去对关键词分析。
二、满足访问者的期望提高网站转化率的首要策略是了解你的顾客,先满足了目标顾客的需求,才能实现自己的目标。如果你向网站访问者提供了他们所需要的信心、舒畅感、便利和合理价值,他们便会响应你的行动呼吁方案。具体指导如下:1、将企业联系电话及其它联系方式放在网站各页面的最佳位置。2、多以“你”和“你的”的口吻来描述企业,让访问者觉得网站将给自己带来好处,而不是用“我们”3、无论是BtoB或B2C企业,网站转换战略都应关注如何方便、清晰、一致地满足访问者的需求,用户体验(UE)这块很重要。4、设计各种内容专集、网页标题、页面布局、版面设计及其它网站元素。
三、了解顾客生命周期价值这点风采依扬拿企业网站为例:当多数企业只关注顾客第一次购买行为所产生的价值时,采用平均顾客生命周期价值战略的企业关注的是同一顾客所购买行为所产生的价值。顾客生命周期价值是指顾客在与企业保持合作关系的整个生命周期内,为企业创造的价值总和,整个生命周期是指顾客从开始在你这里购买到他最后一次在你这里购买之间的时间。对于成立不久的企业来说,顾客生命周期的长短是根据对顾客忠诚度的预测而估计出来的。要计算平均顾客生命周期价值,企业需要收集以下数据:1、企业的经营里长2、顾客首次购买行为和最后一次购买行为之间的时长3、企业的销售总额4、企业网络顾客的总数
企业网站转化率=达成的交易笔数/网站被点击次数(即访问总数)作者: 风采依扬 原载: 点石互动搜索引擎优化博客

2007年7月20日星期五

Google的”unavailable_after”标签的使用方法

上周我们预告了Google将会增加一个新的Meta标签“unavailable_after”,它允许我们手动指定某个网页的失效日期,以提醒Google的爬虫在该日期后不再抓取含该标签的网页。不过上周我们并不清楚这个标签到底是怎样使用的。SEL今天从Google的产品经理Dan Crow那里了解到这个标签的详情用法,下面和大家分享一下。

要使用“unavailable_after”标签,只需要在网页的头部加入以下的Meta语句即可:
< META NAME="GOOGLEBOT" CONTENT="unavailable_after: 日期 时间 时区" >
其中的日期、时间、时区(缩写)分别用23-Jul-2007、19:18:17、EST这种格式。当Google的爬虫看到网页里包含这个标签时,它不仅会不再抓取这个网页,还会在一天左右的时间内将网页从Google的搜索结果里除去。值得注意的是,Google Cache里的相关的网页快照依然会存在。要想移除Google Cache里的记录,得给网页加上noarchive标签
本文转载自:G速客原文地址:Google的“unavailable_after”标签的详细使用方法

2007年7月17日星期二

链接分析技术与网站排名

所有对搜索引擎优化稍有了解的人都知道,链接是网站排名的重要因素,但却不一定完整理解链接分析是从哪些方面影响搜索引擎排名的。今天简单介绍一下我的观察和想法。
首先有两点要强调:
1)链接分析技术的含义比Google PageRank要广泛的多。因为Google的光环和对PR的宣传,使得很多人把PR看的异常重,以为PR是链接分析中的主要内容,其实搜索引擎对链接的分析要广泛的多。
2)链接分析包含了导入链接和导出链接。我下面只谈导入链接,以后有时间再谈导出链接。但必须要明确的是,适当的指向权威网站的导出链接有助于网站排名,而不像很多人以为的,导出链接会使本网页的PR损耗,从而降低网页排名。

搜索引擎对导入链接的分析很可能包含以下这些方面
导入链接数目
导入链接本身的重要性,也就是链接向你的网页本身的重要性
(这两点也就形成了Google PR,但后面的这些因素都和PR没有直接关系。)
反向链接增加的速度
反向链接所在网站本身的内容主题
反向链接所在页的内容是否相关
反向链接的链接锚文字
反向链接锚文字前后周围的文字
链接在页面的位置
反向链接所在的域名年龄
反向链接所在的域名是否曾经转手
反向链接所在页第一次被收录的日期
反向链接所在页页面内容是否曾经有变化?有什么样的变化?
反向链接第一次出现在页面上是什么时候
链接文字是否曾经变化?变化是什么?
反向链接所在页还链接向哪些其他网站?这些其他网站内容是否相关?质量怎么样?
反向链接是否有垃圾链接嫌疑?比如来自论坛签名,博客等地方。
链接点击率
用户点击链接后在你的网站停留多长时间

网页的重要性/权威度/能量

现在很多人相信搜索引擎都给网页赋予一个权威度值,名称有不同的看法,不管叫重要性值,还是叫信任级别,还是叫权威度,还是叫强度,或者叫能量。甭管叫什么,很多排名的研究表明,网页本身除了PR值之外,还有一个综合了很多因素所构成的一个与搜索词无关的权威度值。

前几天SEOmoz开发出一个测量网页权威度值的工具,他把它叫Page Strength,大家可以测一下自己的网页能量值是多少。
这个工具采集几个数据:
雅虎所收录的指向这个URL的链接数
雅虎收录的指向这个域名的反向链接数
反向链接数还是各个搜索引擎非常看重的一个因素,是和PR值最有关联的一个因素。
网页标题中前四个单词在Google的排名情况

一般来说标题Title前面的词就是这个网页的目标关键词。那么这个网页在Google中搜索目标关键词时的排名自然是这个网页权威度的指标。
但有时候这个指标也不准,因为有的网页可能把关键词放在标题的靠后,有的时候取前四个单词反而由于分词不同破坏了关键词。
域名年龄
不过这个域名年龄指的不是域名注册时的年龄,而是Wayback Machine所收录的网页第一次出现的时间。
从.edu和.gov来的反向链接
前面说过很多人认为搜索引擎给.edu和.gov域名更大的权重,因为这两个域名都不是一般人所能注册的,所以有更高信任度
Alexa排名
尽管Alexa排名太容易被作弊了,但到目前为止也还是唯一一个能大致判断流量的指标。
在Google数据库中你的域名被提到的次数
这里指的并不仅仅是反向链接,也包括不是链接的只是提到你的域名的情况。
内部链接的情况
你的整个域名指向这个所测试的URL的链接比例,如果是主页的话,一般都是百分之百。这是看你网站的内部链接结构把这个所测试的页放在一个什么重要的程度。
网摘del.icio.us出现URL的次数
前面说过搜索引擎现在越来越看重用户行为模式,网摘,书签等就是用户行为方式的重要指标之一。
是否被收录进开放目录
雅虎和开放目录是两个最大的由人工编辑的网站目录,由人所判断的网站质量和重要性比机器自然要准确。
在wikipedia中出现URL的次数
同样也是用户行为方式之一。

最后一个才是Google PR值

seo spam

常见搜索引擎优化作弊手法



今天简单列出一些常见的搜索引擎优化作弊手法。

有的时候,这些作弊手法是有意被站长使用,企图操纵和欺骗搜索引擎。但有的时候,可能很多站长会无意中使用这些手法。本来他的目的是为了达到其他的效果,但却无意中违反了搜索引擎所要求的规范。

无论网站拥有人雇用其他设计师,还是自己设计网站, 都需要注意自己的网站不能使用这些SEO作弊手法。

桥页(doorway pages)

通常是用软件自动生成大量包含关键词的网页,然后从这些网页做自动转向到主页。目的是希望这些以不同关键词为目标的桥页在搜索引擎中得到好的排名。当用户点击搜索结果的时候,会自动转到主页。有的时候是在桥页上放上一个通往主页的链接,而不自动转向。

大部分情况下,这些桥页都是由软件生成的。你可以想象,生成的文字是杂乱无章,没有什么逻辑的。如果是由人写出来的真正包含关键词的文章,就不是桥页了。

关键词堆砌(keyword stuffing)

在网页中大量堆砌关键词,希望提高关键词密度,提高网页针对关键词的相关度。关键词堆砌可以在很多地方,比如在用户可以看到的文字本身中,也可能是在标题标签Title Tag,关键词标签,说明标签中。

应该说随着搜索引擎算法的改进,关键词密度已经不是一个重要的因素。这种作弊手法只能给你网站带来麻烦。

隐藏文字(hidden text)

隐藏文字是在网页的HTML文件中放上含有关键词的文字,但这些字不能被用户所看到,只能被搜索引擎看到。可以有几种形式,比如说超小字号的文字,与背景同样颜色的文字,放在评论标签当中的文字,放在表格input标签里面的文字,通过样式表把文字放在不可见的层上面等等。

其目的也都是想提高网页的相关性。

有的时候,有的人还在这些地方放上与网站内容无关的,但是很热门的关键词,希望网页能在这些热门关键词下得到好的排名和流量。

隐藏链接(hidden link)

隐藏链接隐藏文字相似,但是区别是把关键词放在链接里面,而这个链接也是用户所看不到的。

隐藏页面(cloaked page)

有的网页使用程序或脚本来检测来访问的是搜索引擎还是普通用户。如果是搜索引擎,网页就返回经过优化的网页版本。如果来访的是普通人,返回的是另外一个版本。

这种作弊方式,通常用户无法发现。因为一旦你的浏览器去看这个网页,无论是在页面上还是在HTML源文件中,你所得到的都已经是与搜索引擎看到的不同的版本。检测的方法是,看一下这个网页的快照。

购买的链接(link buying)

虽然在其他网站买广告是很正常的一件事,但有的时候如果所购买的广告链接纯粹是为了提高网页级别PR或为了操纵搜索引擎排名的话,也会被当作作弊手段。

在怎样区别正常广告和作弊手段之间有一个很模糊的界限。但是这样做的人自己心里很清楚。如果你的网站被认为是通过购买链接来作弊,也没办法去和搜索引擎去争辩。因为搜索引擎的决定就是最后的决定。
当然更严重的是,如果你的网站是出卖链接的那个网站,你的麻烦就更大了。