<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>上海SEO &#187; 搜索引擎算法</title>
	<atom:link href="http://www.cndozz.com/mytags/%e6%90%9c%e7%b4%a2%e5%bc%95%e6%93%8e%e7%ae%97%e6%b3%95/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.cndozz.com</link>
	<description>又一个 WordPress 博客</description>
	<lastBuildDate>Mon, 02 Nov 2009 03:30:15 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
		<item>
		<title>别再纠结META标签了</title>
		<link>http://www.cndozz.com/article/meta-tag-about-site/</link>
		<comments>http://www.cndozz.com/article/meta-tag-about-site/#comments</comments>
		<pubDate>Mon, 02 Nov 2009 03:30:14 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站排名]]></category>

		<guid isPermaLink="false">http://www.cndozz.com/?p=364</guid>
		<description><![CDATA[到目前为止，新接触SEO的人最喜欢做的就是在meta上花功夫，其实写meta真的很简单，不懂SEO的人都可以写得很好。最可怕的是有人觉得SEO就是写写meta标签的。要说服这些人还真不容易，所以Googl... ]]></description>
			<content:encoded><![CDATA[<p>到目前为止，新接触SEO的人最喜欢做的就是在meta上花功夫，其实写meta真的很简单，不懂SEO的人都可以写得很好。最可怕的是有人觉得SEO就是写写meta标签的。要说服这些人还真不容易，所以Google出马了。看下Google官方的文章吧。</p>
<p><strong>谷歌不会将关键词元标记用于网页排名</strong></p>
<p> 2009年10月25日 下午 10:14:00<br />
 发表者: Matt Cutts, 搜索质量工程师</p>
<p> 原文: Google does not use the keywords meta tag in web ranking<br />
 发表于: 2009年9月21日星期一，上午10:00</p>
<p> 最近我们收到一些关于谷歌如何使用（或者更准确地说，如何不使用）“关键词”元标记来进行网页搜索结果的排名。假设有两名站长，A和B。A经营A公司，而B经营着B公司。一天，A浏览B的网站时发现B拷贝了她的“关键词”元标记中的某些词条。更有趣的是，B将A公司加进了他自己的“关键词”元标记中。A该不该担忧此事呢？</p>
<p> 起码对于目前（2009年9月）谷歌的网页搜索结果来说，答案是否定的。谷歌不会将“关键词”元标记用于网页搜索结果的排名。请看下面的这些问答。</p>
<p>
 <strong>Q: 谷歌是否曾经使用“关键词”元标记来进行网页搜索排名?</strong></p>
<p> A: 一句话，没有。谷歌的确推广“谷歌搜索服务器”(Google Search Appliance)，并且这一产品有能力匹配元标记，这也包括关键词元标记。但这是一款企业搜索工具，同我们主要的网页搜索完全分隔。我们的网页搜索（即被广泛知晓并且每天有数亿人使用的Google.com以及Google.cn）完全忽略关键词元标记。因此目前它们对于我们的搜索排名没有任何影响。</p>
<p>
 <strong>Q: 为何谷歌不使用关键词元标记?</strong></p>
<p> A: 大约十年前，搜索引擎仅依据页面内容来评定网页，其它任何被称作“页面外”的因素——比如指向一个页面的链接——都不会被考虑。在那个时代，有些人会大量使用许多不相关的关键词作为其页面的关键词元标记，而访问者甚至无法在页面上找到这些关键词的相关内容。正因为关键词元标记被大量地滥用，许多年前谷歌开始忽略关键词元标记。</p>
<p>
 <strong>Q: 这是否意味着谷歌忽略所有的元标记？</strong></p>
<p> A: 不，谷歌支持几种其它的元标记。这个“元标记”页面包含更多我们所使用的元标记的信息。例如，我们有时会使用“描述”元标记作为我们搜索结果摘录栏的文字内容，如以下的截屏：</p>
<p> 即便有时会将“描述”元标记用于我们的搜索结果摘录栏，我们仍然不会将其用于我们的排名。</p>
<p>
 <strong>Q: 这是否意味着谷歌将一直忽略关键词元标记？</strong></p>
<p> A: 谷歌或许会在将来利用这些信息，但这不太可能。谷歌忽略关键词元标记已经有数年之久，并且目前我们没有发现有需要修改这一策略。</p>
<div id="_mcePaste" style="overflow: hidden; position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px;">
<h3><a name="2561720847401237363">谷歌不会将关键词元标记用于网页排名</a></h3>
<p class="byline-timestamp"><span id="time2561720847401237363">2009年10月25日 下午 10:14:00</span></p>
<p><script type="text/javascript">// <![CDATA[
   uT("time2561720847401237363");
// ]]&gt;</script><br />
<span class="byline-author">发表者</span>: Matt Cutts, 搜索质量工程师</p>
<p> 原文: <a id="m:cv" title="Google does not use the keywords meta tag in web ranking" href="http://googlewebmastercentral.blogspot.com/2009/09/google-does-not-use-keywords-meta-tag.html">Google does not use the keywords meta tag in web ranking</a><br />
 发表于: 2009年9月21日星期一，上午10:00</p>
<p> <span style="color: #000000;">最近我们收到一些关于谷歌如何使用（或者更准确地说，如何不使用）“关键词”元标记来进行网页搜索结果的排名。假设有两名站长，A和B。</span><span style="color: #000000;">A</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">经营</span><span style="color: #000000;">A</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">公司，而</span><span style="color: #000000;">B</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">经营着</span><span style="color: #000000;">B</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">公司。一天，</span><span style="color: #000000;">A</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">浏览</span><span style="color: #000000;">B</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">的网站时发现</span><span style="color: #000000;">B</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">拷贝了她的“关键词”元标记中的某些词条。更有趣的是，</span><span style="color: #000000;">B</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">将</span><span style="color: #000000;">A</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">公司加进了他自己的“关键词”元标记中。</span><span style="color: #000000;">A</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">该不该担忧此事呢？</span><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal; color: #000000;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal; color: #000000;" align="left"><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">起码对于目前（</span><span style="color: #000000;">2009</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">年</span><span style="color: #000000;">9</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">月）谷歌的网页搜索结果来说，答案是否定的。谷歌不会将“关键词”元标记用于网页搜索结果的排名。请看下面的这些问答。</span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span class="Apple-style-span" style="color: #000000;"><strong><br />
 </strong></span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal; color: #000000;" align="left"><strong><span style="color: #000000;">Q: </span></strong><strong><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">谷歌是否曾经使用“关键词”元标记来进行网页搜索排名</span></strong><strong><span style="color: #000000;">?</span></strong></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal; color: #000000;" align="left"><span style="color: #000000;">A: </span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">一句话，没有。谷歌的确推广“谷歌搜索服务器”(<span class="Apple-style-span" style="font-family: Georgia,serif;">Google Search Appliance</span>)，并且这一产品</span><span style="color: #000000;"><a href="http://code.google.com/apis/searchappliance/documentation/50/help_gsa/serve_filters.html"><span style="font-family: 宋体;" lang="ZH-CN">有能力匹配元标记</span></a></span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">，这也包括关键词元标记。但这是一款企业搜索工具，同我们主要的网页搜索完全分隔。我们的网页搜索（即被广泛知晓并且每天有数亿人使用的</span><span style="color: #000000;">Google.com</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">以及</span><span style="color: #000000;">Google.cn</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">）完全忽略关键词元标记。因此目前它们对于我们的搜索排名没有任何影响。</span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span class="Apple-style-span" style="color: #000000;"><strong><br />
 </strong></span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><strong><span style="color: #000000;">Q: </span></strong><strong><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">为何谷歌不使用关键词元标记</span></strong><strong><span style="color: #000000;">?</span></strong></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;">A: </span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">大 约十年前，搜索引擎仅依据页面内容来评定网页，其它任何被称作“页面外”的因素——比如指向一个页面的链接——都不会被考虑。在那个时代，有些人会大量使 用许多不相关的关键词作为其页面的关键词元标记，而访问者甚至无法在页面上找到这些关键词的相关内容。正因为关键词元标记被大量地滥用，许多年前谷歌开始 忽略关键词元标记。</span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span class="Apple-style-span" style="color: #000000;"><strong><br />
 </strong></span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><strong><span style="color: #000000;">Q: </span></strong><strong><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">这是否意味着谷歌忽略所有的元标记？</span></strong><strong><span style="color: #000000;"> </span></strong></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;">A: </span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">不，谷歌支持几种其它的元标记。这个</span><span style="color: #000000;"><a href="http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=79812"><span style="font-family: 宋体;" lang="ZH-CN">“元标记”</span></a></span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">页面包含更多</span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">我们所使用的元标记的信息。例如，我们有时会使用“描述”元标记作为我们搜索结果摘录栏的文字内容，如以下的截屏：</span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><a href="http://www.googlechinawebmaster.com/uploaded_images/1-737728.PNG" onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 320px; height: 192px;" src="http://www.googlechinawebmaster.com/uploaded_images/1-737723.PNG" border="0" alt="" /></a><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">即便有时会将“描述”元标记用于我们的搜索结果摘录栏，我们仍然不会将其用于我们的排名。</span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;"> </span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span class="Apple-style-span" style="color: #000000;"><strong><br />
 </strong></span></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><strong><span style="color: #000000;">Q: </span></strong><strong><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">这是否意味着谷歌将一直忽略关键词元标记？</span></strong><strong><span style="color: #000000;"> </span></strong></p>
<p class="MsoNormal" style="margin-bottom: 0.0001pt; text-align: left; line-height: normal;" align="left"><span style="color: #000000;">A: </span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">谷歌或许会在将来利用这些信息，但这不太可能。谷歌</span><span style="color: #000000;"><a href="http://searchengineland.com/meta-keywords-tag-101-how-to-legally-hide-words-on-your-pages-for-search-engines-12099"><span style="font-family: 宋体;" lang="ZH-CN">忽略关键词元标记已经有数年之久</span></a></span><span style="color: #000000; font-family: 宋体;" lang="ZH-CN">，并且目前我们没有发现有需要修改这一策略。</span></p>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/meta-tag-about-site/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>关于GOOGLE PR的算法新变化</title>
		<link>http://www.cndozz.com/article/google-pr-new-changes-in-the-algorithm/</link>
		<comments>http://www.cndozz.com/article/google-pr-new-changes-in-the-algorithm/#comments</comments>
		<pubDate>Thu, 18 Jun 2009 08:51:54 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站PR值]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=283</guid>
		<description><![CDATA[Google的PR算法总是很好玩，经常会出现各种不符合常理的现象，比如新站上线不久没等PR更新，PR就是6了，比如网站的一个无名的内页PR 比首页还高，比如稍微做几个友情链接PR就能到7……这些... ]]></description>
			<content:encoded><![CDATA[<p>Google的PR算法总是很好玩，经常会出现各种不符合常理的现象，比如新站上线不久没等PR更新，PR就是6了，比如网站的一个无名的内页PR 比首页还高，比如稍微做几个友情链接PR就能到7……这些现象都是Chris.DL亲身经历的，说明什么呢，PR的算法也在一直更新。</p>
<p>Matt的文章<a href="http://www.mattcutts.com/blog/pagerank-sculpting/">http://www.mattcutts.com/blog/pagerank-sculpting/</a> 提到了不少关于Google PR算法的内容，建议大家看下。</p>
<p><a href="http://seo.g2soft.net/2009/06/16/google-pagerank-algorithms-change.html">David Yin的文章</a>中提炼了一些内容：</p>
<p>1）Google PageRank的确在传递过程中有衰减因子的作用，估计有时间因素，还有比例关系等等。</p>
<p>2）重要的是nofollow属性的改变。<br />
Google再次重申nofollow的确不传递pagerank，也不传递锚文本。但在过去某些系统漏洞的情况下，锚文本还是有传递的个案。</p>
<p>这 个例子说明，当一个页面的PR权重为10点，该页面有10个指向其它网站的链接，其中5个是有nofollow的链接，过去的算法是五个没有 nofollow的链接，每个会传递出2点的PR权重，也就是均分到这5个链接。而在一年前，Google改变了他们的做法，5个没有nofollow的 链接每个也只有1点权重被传递出去。那么原来的10点只传递出5点，消失的就是另外5点权重，这样的结果也就表明，在网站内部链接使用nofollow， 并不能节约pagerank，也不可能把PageRank权重按照自己的设计，以nofollow做为导向的工具，这没用，只有反效果，结果就是丢失PR 权重。</p>
<p>按照Matt的建议，基本上不用把nofollow放在一个重要的地方，就让链接在网站中自由流动就好，只要网站的架构是易于导航的，那就没有什么问题。如果一定要说nofollow放在哪里好，那就是注册页面之类的页面。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/google-pr-new-changes-in-the-algorithm/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google官方：指定规范的URL</title>
		<link>http://www.cndozz.com/article/the-specified-url-specification/</link>
		<comments>http://www.cndozz.com/article/the-specified-url-specification/#comments</comments>
		<pubDate>Mon, 02 Mar 2009 08:46:09 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站URL]]></category>
		<category><![CDATA[网站排名]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=278</guid>
		<description><![CDATA[在大型网站优化中，有时难以避免URL后端需要带上统计参数的事情，原本是个很头痛的事，因为带参数的URL会分流核心页面的权重，现在Google已经给出了一个很好的解决方法，推荐大家了解一... ]]></description>
			<content:encoded><![CDATA[<p><span class="byline-author">在大型网站优化中，有时难以避免URL后端需要带上统计参数的事情，原本是个很头痛的事，因为带参数的URL会分流核心页面的权重，现在Google已经给出了一个很好的解决方法，推荐大家了解一下。</span></p>
<p>原文: <a href="http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html">Specify your canonical</a> <br />
 发表于: 2009年2月12日星期四,12:30 PM</p>
<p><span style="font-size: 100%;">您可能会对URL形式不同造成的<a href="http://www.googlechinawebmaster.com/2008/10/blog-post.html">重复内容有所担心</a>， 谷歌现在支持一种新的功能，使您可以指定您喜欢的URL格式。如果您的网站通过多种不同形式的URL向访问者提供完全相同或非常类似的内容，那么通过这种 功能您可以自主控制出现在搜索结果中的您网站的URL格式。同时这也有 助于将那些影响您网页声望值的因素更固定地指向您所青睐的URL格式上。</span></p>
<p><span style="font-size: 100%;">让我们以一个<a href="http://bp2.blogger.com/_o5Na_9269nA/RuleCxWoOXI/AAAAAAAAAuU/akzGuAnW5nQ/s1600-h/swedish-fish.jpg">出售瑞典鱼的网页</a>为例，假设我们所青睐的URL格式和所对应的内容是下面这样的： <br />
 </span> <br />
 <span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish</span></span></p>
<p><img class="alignnone size-full wp-image-279" title="swedish-fish1-740961" src="http://www.cndozz.com/wp-content/uploads/2009/09/swedish-fish1-740961.jpg" alt="swedish-fish1-740961" /></p>
<p><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">然而，访问者和谷歌机器人实际上可以通过另外的URL形式访问到这一内容。尽管URL的核心部分与您青睐的URL格式很相近，但是他们依据排序的参数或分类浏览种类的不同而向用户提供略有差别的网页。</span> <br />
 </span></span> <br />
 <span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish&amp;category=gummy-candy </span></span></p>
<p><img class="alignnone size-full wp-image-280" title="gummy-candy-swedish-fish-6-794591" src="http://www.cndozz.com/wp-content/uploads/2009/09/gummy-candy-swedish-fish-6-794591.jpg" alt="gummy-candy-swedish-fish-6-794591" /></p>
<p><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">或者，也有可能他们有着完全相同的内容，但是URL看起来并不相同，比如下面的URL还带有跟踪参数或者会话ID：</span> </span></span></p>
<p><span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish&amp;trackingid=1234&amp;sessionid=5678 </span></span></p>
<p><img class="alignnone size-full wp-image-281" title="swedish-fish1-723830" src="http://www.cndozz.com/wp-content/uploads/2009/09/swedish-fish1-723830.jpg" alt="swedish-fish1-723830" /></p>
<p><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">现在，您可以将如下语句</span></span></span><span class="Apple-style-span" style="color: #006600;"><span style="font-family: 'Courier New';"><strong>&lt;link rel=&#8221;canonical&#8221; href=&#8221;http://www.example.com/product.php?item=swedish-fish&#8221;/&gt;</strong></span></span> <br />
 <span style="color: #006600;"><span style="font-family: 'Courier New';"><strong> </strong></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">加入到其他您不倾向于在搜索引擎出现的URL的</span></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">&lt;head&gt;</span></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">代码中，就能指定您喜欢的URL格式。 </span></span></span></p>
<p>比如您不希望以下两种URL格式在搜索结果中出现： <br />
 <span style="color: #006600;"><span style="font-family: Arial;">http://www.example.com/product.php?item=swedish-fish&amp;category=gummy-candy <br />
 http://www.example.com/product.php?item=swedish-fish&amp;trackingid=1234&amp;sessionid=5678 </span></span></p>
<p><span style="color: #000000;">只要您将上文中的</span><span style="font-family: Arial;"><span style="color: #006600;"></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">语句加入到上述两个网页的&lt;head&gt;代码部分，那么谷歌就会知道以上两个网址实际上是被建议指向您指定的标准URL: </span></span></span><span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish</span></span>上。 其他的URL属性，比如PageRank和相关的其他因素，也都会自动指向该标准URL。</p>
<p>这个标准同时也被其他搜索引擎在抓取和索引您网站时所接受和使用。</p>
<p>以下我们将以FAQ的形式，解答一些您可能存在的疑问：</p>
<p><strong>从强制性与否来说，请问rel=&#8221;canonical&#8221;是一个建议，还是一个指令？</strong> <br />
 是一个建议。这是一个我们非常自豪的功能，您可以以此提示搜索引擎考虑您对URL格式的喜好。</p>
<p><strong>我能用相对路径来指定我的URL规范么，比如 </strong><strong><span class="Apple-style-span" style="color: #006600;"><span> &lt;link rel=&#8221;canonical&#8221; href=&#8221;product.php?item=swedish-fish&#8221;/&gt;</span></span></strong><strong>? <br />
 </strong>可以，在这里使用相对路径是可以被正确识别的，如果您在代码中指定了link，那么相对路径都会以此base URL为基础。</p>
<p><strong>我可以将URL范式使用在不是完全相同内容的其他网页上吗？</strong> <br />
 我们允许这些网页之间有些细微差别，比如归在不同类目下的同一产品网页。</p>
<p><strong>如果被指定为规范格式的URL返回404，怎么办呢？</strong> <br />
 我们会继续访问和抓取您的内容，并应用一些联想功能去寻找一个URL范式，但是我们强烈建议您将一个可访问的URL设置成URL范式。</p>
<p><strong>如果我指定的URL范式并没有被索引会怎样？</strong> <br />
 就像网络上所有的公共内容一样，我们会努力发现和寻找您指定的URL范式，一旦我们索引到它，我们就会立即将您的rel=&#8221;canonical&#8221;付诸考虑。</p>
<p><strong>我的URL范式可以是一个重定向URL么？</strong> <br />
 可以，您可以指定一个发生重定向的URL作为URL范式，谷歌会继续跟踪这个重定向并尝试去抓取它。</p>
<p><strong>如果我不小心指定了互相矛盾的URL范式怎么办？</strong> <br />
 不用担心，我们的算法是很聪明并宽容的，我们会跟踪抓取这个URL范式链，但是我们还是强烈建议您尽快将URL范式指定为特定单一URL形式，从而确保您的搜索结果早日得到优化。</p>
<p><strong>这个link tag可以被用来建议一个在其他域名上的URL么？</strong> <br />
 不可以。如果您需要转移到一个不同的域名上，那么301永久重定向对您来说更合适。谷歌现在只能认可在不同子域名下的URL范式的指定。所以，站长们可以将<span style="font-family: Arial;"><span style="color: #006600;">www.example.com</span></span>和<span style="font-family: Arial;"><span style="color: #006600;">example.com</span></span>, 及<span style="color: #006600;"><span style="font-family: Arial;">help.example.com</span></span>互相指定为范式，但是不能将<span style="color: #006600;"><span style="font-family: Arial;">example.com</span></span>和<span style="color: #006600;"><span style="font-family: Arial;">example-widgets.com<span style="color: #000000;">互相指定为范式。</span> </span></span></p>
<p><strong><span style="color: #000000;">听起来不错，能给我举一个现实中的例子么？</span></strong> <br />
 <span style="color: #000000;">我们有一个真实的例子<a href="http://wikia.com/">wikia.com</a>。比如，您在</span><span style="color: #000000;"><span style="font-family: Arial;">http://starwars.wikia.com/wiki/Nelvana_Limited 的源代码中可以发现，该网页已经把</span></span><span style="color: #000000; font-family: Arial;">http://starwars.wikia.com/wiki/Nelvana指定为了URL范式。通过使用</span>rel=&#8221;canonical&#8221;，两个网页的PageRank被整合计算，避免了分散计算的流失，同时搜索结果中也只会包含网站管理员所指定的URL形式。</p>
<p>如果您未能应用URL范式指定您心仪的URL形式，您也不要担心，我们会尽我们最大努力，选择一个更优化的URL形式，并将声望等属性值进行相应转移处理，就像我们<a href="http://googlewebmastercentral.blogspot.com/2007/09/google-duplicate-content-caused-by-url.html">以前做的那样</a>(英文)。</p>
<p>补充：这个link tag现在也被Ask.com,微软Live Search和Yahoo!搜索等搜索引擎所支持。</p>
<div id="_mcePaste" style="overflow: hidden; position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px;">原文: <a href="http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html">Specify your canonical</a> <br />
 发表于: 2009年2月12日星期四,12:30 PM</p>
<p><br class="spacer_" /></p>
<p><span style="font-size: 100%;">您可能会对URL形式不同造成的<a href="http://www.googlechinawebmaster.com/2008/10/blog-post.html">重复内容有所担心</a>， 谷歌现在支持一种新的功能，使您可以指定您喜欢的URL格式。如果您的网站通过多种不同形式的URL向访问者提供完全相同或非常类似的内容，那么通过这种 功能您可以自主控制出现在搜索结果中的您网站的URL格式。同时这也有 助于将那些影响您网页声望值的因素更固定地指向您所青睐的URL格式上。</span></p>
<p><span style="font-size: 100%;">让我们以一个<a href="http://bp2.blogger.com/_o5Na_9269nA/RuleCxWoOXI/AAAAAAAAAuU/akzGuAnW5nQ/s1600-h/swedish-fish.jpg">出售瑞典鱼的网页</a>为例，假设我们所青睐的URL格式和所对应的内容是下面这样的： <br />
 </span> <br />
 <span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish</span></span> <br />
 <a href="http://www.googlechinawebmaster.com/uploaded_images/swedish-fish1-740985.jpg" onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 335px; height: 279px;" src="http://www.googlechinawebmaster.com/uploaded_images/swedish-fish1-740961.jpg" border="0" alt="" /></a><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">然而，访问者和谷歌机器人实际上可以通过另外的URL形式访问到这一内容。尽管URL的核心部分与您青睐的URL格式很相近，但是他们依据排序的参数或分类浏览种类的不同而向用户提供略有差别的网页。</span> <br />
 </span></span> <br />
 <span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish&amp;category=gummy-candy <br />
 </span></span><a href="http://www.googlechinawebmaster.com/uploaded_images/gummy-candy-swedish-fish-6-794613.jpg" onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 327px;" src="http://www.googlechinawebmaster.com/uploaded_images/gummy-candy-swedish-fish-6-794591.jpg" border="0" alt="" /></a><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">或者，也有可能他们有着完全相同的内容，但是URL看起来并不相同，比如下面的URL还带有跟踪参数或者会话ID：</span> </span></span></p>
<p><span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish&amp;trackingid=1234&amp;sessionid=5678 <br />
 </span></span><a href="http://www.googlechinawebmaster.com/uploaded_images/swedish-fish1-723841.jpg" onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 320px; height: 290px;" src="http://www.googlechinawebmaster.com/uploaded_images/swedish-fish1-723830.jpg" border="0" alt="" /></a> <br />
 <span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">现在，您可以将如下语句</span></span></span><span class="Apple-style-span" style="color: #006600;"><span style="font-family: 'Courier New';"><strong>&lt;link rel=&#8221;canonical&#8221; href=&#8221;http://www.example.com/product.php?item=swedish-fish&#8221;/&gt;</strong></span></span> <br />
 <span style="color: #006600;"><span style="font-family: 'Courier New';"><strong></strong></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">加入到其他您不倾向于在搜索引擎出现的URL的</span></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">&lt;head&gt;</span></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">代码中，就能指定您喜欢的URL格式。 </span></span></span></p>
<p>比如您不希望以下两种URL格式在搜索结果中出现： <br />
 <span style="color: #006600;"><span style="font-family: Arial;">http://www.example.com/product.php?item=swedish-fish&amp;category=gummy-candy <br />
 http://www.example.com/product.php?item=swedish-fish&amp;trackingid=1234&amp;sessionid=5678 </span></span></p>
<p><span style="color: #000000;">只要您将上文中的</span><span style="font-family: Arial;"><span style="color: #006600;"></span></span><span style="font-family: Arial;"><span style="color: #006600;"><span style="color: #000000;">语句加入到上述两个网页的&lt;head&gt;代码部分，那么谷歌就会知道以上两个网址实际上是被建议指向您指定的标准URL: </span></span></span><span style="font-family: Arial;"><span style="color: #006600;">http://www.example.com/product.php?item=swedish-fish</span></span>上。 其他的URL属性，比如PageRank和相关的其他因素，也都会自动指向该标准URL。</p>
<p>这个标准同时也被其他搜索引擎在抓取和索引您网站时所接受和使用。</p>
<p>以下我们将以FAQ的形式，解答一些您可能存在的疑问：</p>
<p><strong>从强制性与否来说，请问rel=&#8221;canonical&#8221;是一个建议，还是一个指令？</strong> <br />
 是一个建议。这是一个我们非常自豪的功能，您可以以此提示搜索引擎考虑您对URL格式的喜好。</p>
<p><strong>我能用相对路径来指定我的URL规范么，比如 </strong><strong><span class="Apple-style-span" style="color: #006600;"><span> &lt;link rel=&#8221;canonical&#8221; href=&#8221;product.php?item=swedish-fish&#8221;/&gt;</span></span></strong><strong>? <br />
 </strong>可以，在这里使用相对路径是可以被正确识别的，如果您在代码中指定了link，那么相对路径都会以此base URL为基础。</p>
<p><strong>我可以将URL范式使用在不是完全相同内容的其他网页上吗？</strong> <br />
 我们允许这些网页之间有些细微差别，比如归在不同类目下的同一产品网页。</p>
<p><strong>如果被指定为规范格式的URL返回404，怎么办呢？</strong> <br />
 我们会继续访问和抓取您的内容，并应用一些联想功能去寻找一个URL范式，但是我们强烈建议您将一个可访问的URL设置成URL范式。</p>
<p><strong>如果我指定的URL范式并没有被索引会怎样？</strong> <br />
 就像网络上所有的公共内容一样，我们会努力发现和寻找您指定的URL范式，一旦我们索引到它，我们就会立即将您的rel=&#8221;canonical&#8221;付诸考虑。</p>
<p><strong>我的URL范式可以是一个重定向URL么？</strong> <br />
 可以，您可以指定一个发生重定向的URL作为URL范式，谷歌会继续跟踪这个重定向并尝试去抓取它。</p>
<p><strong>如果我不小心指定了互相矛盾的URL范式怎么办？</strong> <br />
 不用担心，我们的算法是很聪明并宽容的，我们会跟踪抓取这个URL范式链，但是我们还是强烈建议您尽快将URL范式指定为特定单一URL形式，从而确保您的搜索结果早日得到优化。</p>
<p><strong>这个link tag可以被用来建议一个在其他域名上的URL么？</strong> <br />
 不可以。如果您需要转移到一个不同的域名上，那么301永久重定向对您来说更合适。谷歌现在只能认可在不同子域名下的URL范式的指定。所以，站长们可以将<span style="font-family: Arial;"><span style="color: #006600;">www.example.com</span></span>和<span style="font-family: Arial;"><span style="color: #006600;">example.com</span></span>, 及<span style="color: #006600;"><span style="font-family: Arial;">help.example.com</span></span>互相指定为范式，但是不能将<span style="color: #006600;"><span style="font-family: Arial;">example.com</span></span>和<span style="color: #006600;"><span style="font-family: Arial;">example-widgets.com<span style="color: #000000;">互相指定为范式。</span> </span></span></p>
<p><strong><span style="color: #000000;">听起来不错，能给我举一个现实中的例子么？</span></strong> <br />
 <span style="color: #000000;">我们有一个真实的例子<a href="http://wikia.com/">wikia.com</a>。比如，您在</span><span style="color: #000000;"><span style="font-family: Arial;">http://starwars.wikia.com/wiki/Nelvana_Limited 的源代码中可以发现，该网页已经把</span></span><span style="color: #000000; font-family: Arial;">http://starwars.wikia.com/wiki/Nelvana指定为了URL范式。通过使用</span>rel=&#8221;canonical&#8221;，两个网页的PageRank被整合计算，避免了分散计算的流失，同时搜索结果中也只会包含网站管理员所指定的URL形式。</p>
<p>如果您未能应用URL范式指定您心仪的URL形式，您也不要担心，我们会尽我们最大努力，选择一个更优化的URL形式，并将声望等属性值进行相应转移处理，就像我们<a href="http://googlewebmastercentral.blogspot.com/2007/09/google-duplicate-content-caused-by-url.html">以前做的那样</a>(英文)。</p>
<p>补充：这个link tag现在也被Ask.com,微软Live Search和Yahoo!搜索等搜索引擎所支持。</p>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/the-specified-url-specification/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google官方：动态网址与静态网址</title>
		<link>http://www.cndozz.com/article/dynamic-and-static-url/</link>
		<comments>http://www.cndozz.com/article/dynamic-and-static-url/#comments</comments>
		<pubDate>Mon, 20 Oct 2008 08:40:12 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站URL]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=272</guid>
		<description><![CDATA[谷歌中文管理员博客又带来了一篇好文章，上海SEO咨询中心又要给大家推荐了，同样，中大型网站的SEO要多关注一下... ]]></description>
			<content:encoded><![CDATA[<p>谷歌中文管理员博客又带来了一篇好文章，上海SEO咨询中心又要给大家推荐了，同样，中大型网站的SEO要多关注一下。</p>
<p>来源: <a href="http://www.googlechinawebmaster.com/2008/10/blog-post_16.html">http://www.googlechinawebmaster.com/2008/10/blog-post_16.html</a><br />
原文: <a href="http://googlewebmastercentral.blogspot.com/2008/09/dynamic-urls-vs-static-urls.html">Dynamic URLs vs. static URLs</a><br />
发表于：2008年9月22日，下午3: 20</p>
<p><span style="font-style: italic;">在 跟网络管理员沟通时经常会出现这种情形，一些广为传播的理念可能在过去是正确的，但是可能已不再切合目前的情况了。当我们最近在跟几个朋友谈及关于网址的 结构时就碰到这种情况。其中一个朋友很担心动态网址的使用，甚至认为“搜索引擎无法处理动态网址”。另外一个朋友觉得动态网址对搜索引擎来说完全不是问 题，那些都是过去的事了。还有一个甚至说他从来都搞不懂动态网址和静态网址相比有什么区别。对于我们来说，这一刻使我们决定要好好研究一下动态网址和静态 网址这个话题。首先，让我们来界定一下我们要谈论的主题：</span></p>
<p><span style="font-weight: bold;">什么是静态网址？</span><br />
一个静态网址，顾名思义，就是一个不会发生变化的网址，它通常不包含任何网址参数。例如：http://www.example.com/archive/january.htm。您可以在搜索框里输入 <a href="http://www.google.cn/search?source=ig&amp;hl=en&amp;rlz=&amp;=&amp;q=filetype%3Ahtm&amp;btnG=Google+Search&amp;meta=">filetype:html</a> 在谷歌上搜索静态网址。更新此种类型网址的页面会比较耗费时间，尤其是当信息量增长很快时，因为每一个单独的页面都必须更改编译代码。这也是为什么网站管理员们在处理大型的、经常更新的网站，像在线购物网站、论坛社区、博客或者是内容管理系统时，会使用动态网址的原因。</p>
<p><span style="font-weight: bold;">什么是动态网址？</span><br />
如果一个网站的内容存储于一个数据库，并且根据要求来显示页面，这时就可以使用动态网址。在这种情况下，网站提供的内容基本上是基于模板形式的。通常情况下，一个动态网址看起来像这样：<a href="http://code.google.com/p/google-checkout-php-sample-code/issues/detail?id=31">http://code.google.com/p/google-checkout-php-sample-code/issues/detail?id=31</a>。 您可以通过寻找像? = &amp; 这样的符号识别出动态网址。动态网址有一个缺陷是不同的网址可以拥有相同的内容。这样导致不同的用户可能链向含有不同参数的网址，但是这些网址却都含有相 同的内容。这也是为什么网络管理员有时候想要将这些动态网址重写成静态网址的原因之一。</p>
<p><span style="font-weight: bold;">我是不是应该让我的动态网址看起来是静态的呢？</span><br />
在处理动态网址时，希望您能了解以下几点事实：</p>
<ol>
<li>要正确地生成和维护从动态网址到静态化网址的重写转变实际上是一件很难的事情。 </li>
<li>将原始的动态网址提供给我们会比较安全，请让我们来处理诸如探测和避开那些有问题的参数的事情。 </li>
<li>如果您想重写网址，请去掉那些不必要的参数，同时请保持它动态网址的样子。 </li>
<li>如果您想提供一个静态网址代替动态网址，那么您应该切实地生成相应的静态内容。 </li>
</ol>
<p>
<span style="font-weight: bold;">静态和动态网址，Googlebot对于哪一个识别得更好呢？</span><br />
我 们碰到过很多网站管理员，像我们的朋友那样，认为静态或者看起来是静态的网址对于网站的索引和排名是有优势的。这种看法是基于这样一个假设，即认为搜索引 擎在抓取和分析含有会话标识(session ID)和来源追踪器(source tracker)的网址时是有问题的。然而，事实是，谷歌在这两个方面都有了相当的进展。就点击率来说，静态网址可能略微有些优势，因为用户可以很容易地 读懂这个网址。但是，就索引和排名来说，使用数据库驱动网站并不意味着明显的劣势。相比较将参数隐藏以使他们看起来是静态的网址来说，我们更希望网站将动 态的网址直接提供给搜索引擎。</p>
<p><span style="font-style: italic;">现在，让我们来看一些有关动态网址的广为传播的看法，并且来纠正一些蒙蔽网站管理员的假说。:)</span></p>
<p><span style="font-weight: bold;">传说：“动态网址不能被抓取。”</span><br />
<span style="font-weight: bold;">事实：</span>我们可以抓取动态网址并且解释不同的参数。如果您为了让网址看起来像是静态的，而隐藏那些可以给谷歌提供有价值信息的参数，这样做反而会给该网址的抓取和排名带来麻烦。我们的建议是：<span style="font-weight: bold;">请不要将一个动态网址改换格式以使其看起来是静态的</span>。尽可能地使用静态网址来显示静态内容是可取的，但在您决定展示动态内容的情况下，请不要将参数隐藏起来从而使他们看起来像是静态的，因为这样做会删除掉那些有助于我们分析网址的有用信息。</p>
<p><span style="font-weight: bold;">传说：“动态网址的参数要少于3个。”</span><br />
<span style="font-weight: bold;">事实：</span>对于参数的数量是没有限制的。但是，一个好的经验是<span style="font-weight: bold;">不要让您的网址太长</span>（这 个适用于所有的网址，不论是静态的还是动态的）。您可以去掉一些对于Googlebot来说不重要的参数，给用户一个好看一点的动态网址。如果您不能确定 可以去掉哪些参数，我们建议您将动态网址中所有的参数都提供给我们，我们的系统会弄明白哪一些是不重要的。将参数隐藏起来会影响我们正确地分析您的网址， 我们也就不能识别这些参数，一些重要信息可能也因此丢失了。</p>
<p><span style="font-style: italic;">下面一些是我们认为您可能会存在疑问的一些问题。</span></p>
<p><span style="font-weight: bold;">这是否意味着我应该完全避免重写动态网址？</span><br />
这 是我们的建议，除非您能确保您只是去掉多余的参数，或能够把所有有可能有不良影响的参数完整地删除。如果您把自己的动态网址任意修改使其看起来像是静态 的，您要清楚这样做是有风险的，有可能会导致有些信息不能被正常地编译和识别。如果您想给您的网站再增加一个静态的版本，请您一定要提供一个真正意义上的 静态的内容，比如生成那些可以通过网站相应路径而获取的文件。如果您仅仅是修改了动态网址的表现形式，而没有真正提供静态的内容，那么您有可能适得其反。 请直接把标准的动态URL提供给我们，我们会自动找出那些冗余的参数。</p>
<p><span style="font-weight: bold;">你能给我举一个例子么？</span><br />
如 果您有一个像下面这样标准格式的动态网址：foo?key1=value&amp;key2=value2，我们建议您不用改动它，谷歌会决定哪些参数可 以去掉；或者您可以为用户去掉那些不必要的参数。不过要慎重，仅仅去掉那些不重要的参数。这里有一个含有多个参数的动态网址的例子：</p>
<p>www.example.com/article/bin/answer.foo?language=en&amp;answer=3&amp;sid=98971298178906&amp;query=URL</p>
<ul>
<li>language=en – 标明这篇文章的语言 </li>
<li>answer=3 – 这篇文章含有数字3 </li>
<li>sid=8971298178906 – 会话标识代码是8971298178906 </li>
<li>query=URL – 使这篇文章被找到的查询是[URL] </li>
</ul>
<p>并不是所有的参数都提供额外的信息。所以将这个网址重写为www.example.com/article/bin/answer.foo?language=en&amp;answer=3 可能不会引起任何问题，因为所有不相关的参数都去掉了。</p>
<p>下面是一些经过认为修改而看起来像是静态网址的例子。相比较没有重写、直接提供动态网址来说，这些网址可能会引起更多抓取方面的问题。</p>
<ul>
<li>www.example.com/article/bin/answer.foo/en/3/98971298178906/URL </li>
<li>www.example.com/article/bin/answer.foo/language=en/answer=3/ sid=98971298178906/query=URL </li>
<li>www.example.com/article/bin/answer.foo/language/en/answer/3/sid/ 98971298178906/query/URL </li>
<li>www.example.com/article/bin/answer.foo/en,3,98971298178906,URL </li>
</ul>
<p>如 果您将动态网址重写成如上所述的示例的话，可能会导致我们很多不必要的抓取，因为这些网址中都含有会话标识(sid)和查询(query)参数的可变值， 这无形中生成了很多看起来不同的URL，而他们包含的内容却是相同的。这些格式让我们很难理解通过这个网址返回的实际内容和参数URL以及 98971298178906是无关的。不过，下面这个重写的例子却将所有无关的参数都去掉了：</p>
<ul>
<li>www.example.com/article/bin/answer.foo/en/3 </li>
</ul>
<p>尽 管我们可以正确地处理这个网址，我们还是不鼓励您使用这样的重写。因为它很难维护，而且一旦一个新的参数被加到原始的动态网址，那么这个网址就需要马上更 新。不这样做的话就会再次导致生成一个隐藏了参数的貌似静态网址的URL。所以最好的解决方法是通常将动态网址保持他们原来的样子。或者，如果您去掉不相 关的参数，请记住一定要保持这个网址是动态的:</p>
<ul>
<li>www.example.com/article/bin/answer.foo?language=en&amp;answer=3 </li>
</ul>
<p>我们希望这篇文章能够对您和我们的朋友有帮助，使围绕动态网址的各种推测清晰化。如果您有更多的问题的话，欢迎加入我们的<a href="http://groups.google.com/group/google_webmaster_help-zh-CN">网站管理员支持论坛</a>进行讨论。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/dynamic-and-static-url/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google官方揭秘“重复内容处罚”</title>
		<link>http://www.cndozz.com/article/duplicate-content-penalty/</link>
		<comments>http://www.cndozz.com/article/duplicate-content-penalty/#comments</comments>
		<pubDate>Tue, 14 Oct 2008 08:38:25 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站排名]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=270</guid>
		<description><![CDATA[非常有价值的一篇文章，明确了网站重复内容的一些问题，推荐大家仔细阅读，特别是在管理中大型网站的SEO们... ]]></description>
			<content:encoded><![CDATA[<p>非常有价值的一篇文章，明确了网站重复内容的一些问题，推荐大家仔细阅读，特别是在管理中大型网站的SEO们。</p>
<p>发表者: Susan Moskwa, 网站管理员趋势研究员</p>
<p>来源: <a href="http://www.googlechinawebmaster.com/2008/10/blog-post.html">http://www.googlechinawebmaster.com/2008/10/blog-post.html</a><br />
原文: <a href="http://googlewebmastercentral.blogspot.com/2008/09/demystifying-duplicate-content-penalty.html">Demystifying the &#8220;duplicate content penalty&#8221;</a><br />
发表于: 2008年9月12日星期五，上午8: 30</p>
<p>重复内容始终是一个经常被谈论的话题。我们<a href="http://www.googlechinawebmaster.com/2007/07/blog-post_13.html">不断地</a><a href="http://googlewebmastercentral.blogspot.com/2007/06/duplicate-content-summit-at-smx.html">发表</a><a href="http://googlewebmastercentral.blogspot.com/2007/09/google-duplicate-content-caused-by-url.html">关于这方面</a>的<a href="http://www.googlechinawebmaster.com/2008/07/blog-post.html">文章</a>，人们也在<a href="http://groups.google.com/group/Google_Webmaster_Help-Indexing/t/84e7ecdeff076604">不断地提出问题</a>。特别是，我还听到有很多网站管理员担心自己受到了“重复内容处罚”。</p>
<p>在这里请允许我们把这个问题一次性跟大家讲清楚：根本不存在所谓的“重复内容处罚”。至少，也不是大多数人谈论时所认为的那样。</p>
<p>有一些处罚是和抄袭其他网站的内容有关的，比如完全抄袭并且发布其他网站的内容，或者在完全没有提供任何其他附加价值的情况下发布这些抄袭的内容。这些都是我们不提倡的做法，您可以在<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=35769">网站管理员指南</a>里找到有关此问题的清晰的论述:</p>
<ul>
<li>请不要创建含有大量<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=66359">重复内容</a>的多个页面、子域或者域。</li>
<li>请避免使用那种“一个模子印出来”（cookie cutter）的方式创建网站，比如<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=66361">没有或者很少原创内容</a>的联属计划。</li>
<li>如果您的网站参与<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=76465">联属计划</a>，请确保您的网站可提供附加价值。提供独特且相关的内容，使用户首先有理由访问您的网站。</li>
</ul>
<p>（请注意，我们不希望您从其他网站那里抄袭内容，但是如果其他人抄袭了您的网站就是另外一回事了；如果您担心别人抄袭了您的网站，请您参考<a href="http://www.googlechinawebmaster.com/2008/07/blog-post.html">这篇文章</a>）。</p>
<p>但 是我听到的一些担心重复性内容的网站管理员所谈论的并不是抄袭或者域名农场(domain farms)；他们讨论的是诸如在同一个域上有多个网址指向相同的内容。比 如，www.example.com/skates.asp?color=black&amp;brand=riedell<br />
和www.example.com/skates.asp?brand=riedell&amp;color=black。这种类型的重复性内容可能会对您网站在搜索结果中的表现有潜在的影响，但是它不会使您的网站受到惩罚。下面这段文字来自我们关于<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=66359">重复内容</a>的帮助文章：</p>
<p>除非重复内容看起来意在欺骗用户并操纵搜索引擎结果，否则，我们不会对有重复内容的网站采取特别措施。如果您的网站存在重复内容问题，而您又未遵循上述建议，我们会自行以恰当的方式选择在搜索结果中显示的内容版本。</p>
<p>这种非恶意的重复是比较常见的，特别是很多内容管理系统(CMS)缺省条件下对此处理的并不是很好。因此，当人们谈到此种类型的重复性内容会影响您的网站时，并不是因为您可能会因此受到处罚，而仅仅是由于网站和搜索引擎的工作方式所造成的。</p>
<p>大多数搜索引擎都力求保持一定程度的多样性：他们想在搜索结果页上向您展示十个不同的搜索结果，而不是含有相同内容的十个不同的网址。为此，谷歌试着去掉重复的内容从而使用户较少看到这些多余的重复性的内容。您可以在<a href="http://googlewebmastercentral.blogspot.com/2007/09/google-duplicate-content-caused-by-url.html">这篇博客</a>里了解更多的细节，其中谈到</p>
<ol>
<li>当我们探测重复内容时，比如由网址参数造成的衍生网址，我们会将这些相似的网址放在同一组里。</li>
<li>我们会选择我们认为最能代表这一组的网址在搜索结果里进行展示。</li>
<li>我们还会对这一组网址的特性进行相应的整理，像链接的受欢迎程度，并将其合并到此代表性网址上。 </li>
</ol>
<p>作为网站管理员，上述过程可能会影响到您的是：</p>
<ul>
<li>在 步骤二中，谷歌所认为最具有代表性的网址并不一定和您的想法一致。如果您想控制究竟是 www.example.com/skates.asp?color=black&amp;brand=riedell 还是www.example.com/skates.asp?brand=riedell&amp;color=black出现在我们的搜索结果中的话， 您或许想采取适当措施以减少您的重复内容。告诉我们哪一个是您比较喜欢的网址的有效方法之一就是将其列入您的<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=40318">网站地图</a>(Sitemap) 里。</li>
<li>在步骤三中，如果我们无法探测出某一特定页面的所有重复性页面的话，我们在对其页面特性进行整合时就不可能包括所有这些重复性页面的特性。这可能会削弱这一特定内容的排名竞争力，因为他们被分散分配到了多个网址上。</li>
</ul>
<p>在 大多数情况下，谷歌可以很好的处理此类重复内容。然而，对于那些不同域名上的重复性内容，您或许需要再考虑一下。尤其是，当您决定建立一个网站而它的目的 从本质上来讲就是内容抄袭和重复的话，如果您的商业模式又依赖于搜索引擎的流量，那么除非您可以给用户带来很多的附加价值，不然对于建立此类网站您还是要 三思而后行。举个例子，我们有时听到来自Amazon.com的联盟网站说他们网站上那些完全由Amazon提供的内容很难有好的排名。这难道是因为谷歌 想阻止他们卖《<a rel="no follow" href="http://www.amazon.com/Everyone-Poops-My-Body-Science/dp/0916291456">Everyone Poops</a>》 这本书吗？不；这是因为如果他们的网站提供完全一样的内容的话，他们怎么可能会比Amazon的排名更好呢？对于在线购物来讲，Amazon在很多方面具 有权威性（对于一个典型的Amazon联盟网站来说更是如此），一般的谷歌搜索用户可能想看到的是Amazon上的原始信息，除非这个联盟网站提供了相当 数量的、额外的<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=76465">附加值</a>给用户。</p>
<p>最 后，想一下重复内容给您网站带宽带来的影响吧。重复内容会造成抓取效率低下：当Googlebot在您的网站上发现了十个网址，在它知道这些网址含有完全 相同的内容之前（如上所述，也就是在我们能够对他们进行归类之前），它必须对这十个网址逐一进行抓取。Googlebot耗费在抓取重复性内容上的时间和 资源越多，它用来抓取其他内容的时间也就相对变少了。</p>
<p>总而言之，网站上的重复性内容会以多种方式影响您的网站。但是除非您是恶意抄袭造成内容重复，否则这些方式不会构成对您网站的处罚。这也意味着：</p>
<ul>
<li>当您清除了无恶意的重复性内容时，您无须提交重新收录的请求。</li>
<li>如果您是一个介于初级到中级经验值之间的网络管理员，您可能不需花费过多精力来担心重复性内容，因为大多数搜索引擎都有方法来处理它。</li>
<li>通过澄清和杜绝关于重复性内容处罚的杜撰之说，您可以帮到您的网站管理员同行们！解决重复性内容的方法完全在您的掌控之中，这里有几篇<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=66359">较好的</a><a href="http://www.googlechinawebmaster.com/2007/07/blog-post_13.html">文章</a><a href="http://googlewebmastercentral.blogspot.com/2007/06/duplicate-content-summit-at-smx.html">您可以</a><a href="http://googlewebmastercentral.blogspot.com/2007/09/google-duplicate-content-caused-by-url.html">参考</a>。</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/duplicate-content-penalty/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>网站收录数偏高、浮动的情况分析</title>
		<link>http://www.cndozz.com/article/the-analysis-of-site-index/</link>
		<comments>http://www.cndozz.com/article/the-analysis-of-site-index/#comments</comments>
		<pubDate>Thu, 11 Sep 2008 08:38:14 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站收录]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=268</guid>
		<description><![CDATA[经常碰到客户的网站收录情况变化很大，上下浮动很厉害，客户一般都很着急，觉得这是什么严重的问题，其实不是，结合SEO顾问服务的经验，Chris.DL就这个问题，跟大家分享一下自己的观点... ]]></description>
			<content:encoded><![CDATA[<p>经常碰到客户的网站收录情况变化很大，上下浮动很厉害，客户一般都很着急，觉得这是什么严重的问题，其实不是，结合<a href="http://www.cndozz.com/seo-consultant/">SEO顾问服务的经验</a>，Chris.DL就这个问题，跟大家分享一下自己的观点。</p>
<p>原载：<a href="http://www.cndozz.com/">上海SEO咨询中心</a> 作者：<a href="http://www.cndozz.com/chris/">Chris.DL</a><br />
 原文地址：<a href="http://www.cndozz.com/article/the-analysis-of-site-index/">http://www.cndozz.com<span id="sample-permalink">/article/<span id="editable-post-name" title="点击编辑这部分固定链接">the-analysis-of-site-index</span>/</span></a><br />
 本文为原创，转载必须保留以上链接，违者必究！</p>
<p><strong>先考虑网站的收录数是不是偏高</strong>，会有以下几种可能性：</p>
<p>一、网站很可能因为程序结构方面会导致有很多重复页面，比如部分页面用了伪静态，而原动态页面没有做301到伪静态页面，并且在网站的某些导航处做了原动态页面的链接。</p>
<p>二、网站有组合条件搜索的情况，每个搜索作为一个独立的URL，比如，上海酒店 -&gt; 上海浦东新区酒店 -&gt; 上海浦东新区陆家嘴酒店 -&gt; 上海浦东新区陆家嘴商务酒店……</p>
<p>三、动态生成文档，用计数器、时间戳等进行页面生成，很可能包含了无数重复页面。</p>
<p>四、网址中的参数，例如推介链接，来路标识，排序等</p>
<p>五、 错误的链接路径设置，在网站建设过程中，经常会犯点小错误，比如把全站底部的www.abc.com/about.html 写成了&lt;a href=&#8221;about.html&#8221;&gt; _fcksavedurl=&#8221;"about.html&#8221;&gt;&#8221; 那很有可能在 www.abc.com/efg/ 这个页面底部的链接其实是指向了 www.abc.com/efg/about.html 而更巧的是伪静态的规则里没写好，www.abc.com/efg/about.html 变成一个存在的页面，这就多了N个重复页面   （头晕了……）</p>
<p>这些情况都可能导致网站的收录数明显偏高，比如明明只有1000的内容，结果却有几W的收录，明明只有几W的内容，却有几百 万的收录，既然是虚高，那当搜索引擎发现的时候，必然会去掉多余的收录，那么，网站收录数会有个比较大的向下的浮动，但这样的浮动仅仅是搜索引擎去除了多 余的页面，有内容有价值的页面仍然保留着，这就是为什么有些客户纳闷“为什么我的网站收录减少那么多，但流量却没有下降，有时反而上升了呢？”</p>
<p>既然流量没问题，那就不用担心了，如果你经受不了网站收录数变化带来的心理冲击，那么，我建议从一开始，就要避免网站收录偏高的问题，针对上面的情况可以这样解决：</p>
<p>一、使用伪静态之后，原来动态URL用301至伪静态URL，网站所有导航都链向伪静态URL。</p>
<p>二、无需解决，只要知道这种结构设计可能带来的收录浮动可能性，如果一定要解决的话，必须给该列表页面增加更多条件相关的文本内容。</p>
<p>三和四、尽量避免在网址中使用会话 ID，而应考虑使用 Cookie，通过截掉不必要的参数尽量缩短网址。</p>
<p>五、网站建设的时候留心点。</p>
<p>SEO 的无奈之处在于我们不是规则的制定者，有的时候只能看搜索引擎的脸色，网站在搜索引擎中的表现也由搜索引擎的算法和数据库决定，尽可能的避免一些风险和沿 着搜索引擎质量的轨迹前进，才能给网站带来好的SEO效果，在Chris.DL于大家分享经验的同时，上海SEO咨询中心还提供<a href="http://www.cndozz.com/free-seo-consultation/">免费的SEO咨询服务</a>，咨询入口：<a href="http://www.cndozz.com/blog/info/">http://www.cndozz.com/free-seo-consultation/</a> 欢迎交流。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/the-analysis-of-site-index/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>301重定向和302跳转的区别</title>
		<link>http://www.cndozz.com/article/301-redirect-and-302-redirect/</link>
		<comments>http://www.cndozz.com/article/301-redirect-and-302-redirect/#comments</comments>
		<pubDate>Fri, 29 Aug 2008 08:27:05 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[301重定向]]></category>
		<category><![CDATA[302重定向]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=266</guid>
		<description><![CDATA[301重定向是目前Chris.DL在对每个客户提供SEO服务时，必定会讲到的东西，过程中，往往会发现大家使用的都是302跳转，虽然最终看到的效果是一样的，但对搜索引擎来讲，301和302还是有区别的... ]]></description>
			<content:encoded><![CDATA[<p>301重定向是目前Chris.DL在对每个客户提供<a href="http://www.cndozz.com/seo-consultant/">SEO服务</a>时，必定会讲到的东西，过程中，往往会发现大家使用的都是302跳转，虽然最终看到的效果是一样的，但对搜索引擎来讲，301和302还是有区别的。</p>
<p>301的含义是“永久重定向”，而302的含义是“临时重定向”，参考：<a href="http://www.cndozz.com/article/the-server-status-code-meaning/">服务器状态代码含义</a></p>
<p>那么为什么不能用302呢？下面摘自Zac的一段文章内容</p>
<p>“</p>
<p>302 重定向和网址劫持（URL hijacking）有什么关系呢？这要从搜索引擎如何处理302转向说起。从定义来说，从网址A做一个302重定向到网址B时，主机服务器的隐含意思是 网址A随时有可能改主意，重新显示本身的内容或转向其他的地方。大部分的搜索引擎在大部分情况下，当收到302重定向时，一般只要去抓取目标网址就可以 了，也就是说网址B。</p>
<p>实际上如果搜索引擎在遇到302转向时，百分之百的都抓取目标网址B的话，就不用担心网址URL劫持了。</p>
<p>问 题就在于，有的时候搜索引擎，尤其是Google，并不能总是抓取目标网址。为什么呢？比如说，有的时候A网址很短，但是它做了一个302重定向到B网 址，而B网址是一个很长的乱七八糟的URL网址，甚至还有可能包含一些问号之类的参数。很自然的，A网址更加用户友好，而B网址既难看，又不用户友好。这 时Google很有可能会仍然显示网址A。</p>
<p>由于搜索引擎排名算法只是程序而不是人，在遇到302重定向的时候，并不能像人一样的去准确判定 哪一个网址更适当，这就造成了网址URL劫持的可能性。也就是说，一个不道德的人在他自己的网址A做一个302重定向到你的网址B，出于某种原因， Google搜索结果所显示的仍然是网址A，但是所用的网页内容却是你的网址B上的内容，这种情况就叫做网址URL劫持。你辛辛苦苦所写的内容就这样被别 人偷走了。</p>
<p>”</p>
<p>其实302的跳转本身是没有错的，但因为被一些作弊者用多了，Google当然对这个就比较敏感了，毕竟Google面对的是如此海量的数据，你难道不怕被误杀吗？</p>
<p><a href="http://www.cndozz.com/article/googles-official-guide-how-to-move-site/">Google的官方内容一再强调用301来转移内容</a>，况且，301和302在程序上的设置相差很小，既然如此，何必要冒险用302呢？</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/301-redirect-and-302-redirect/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>某Google员工语录（截止至2008年7月）</title>
		<link>http://www.cndozz.com/article/quotations-from-a-google-employee/</link>
		<comments>http://www.cndozz.com/article/quotations-from-a-google-employee/#comments</comments>
		<pubDate>Wed, 13 Aug 2008 08:22:46 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站排名]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=264</guid>
		<description><![CDATA[不透露具体是谁了，大家自己挖掘一下吧，本文原创整理，转载请保留以下链接... ]]></description>
			<content:encoded><![CDATA[<p>不透露具体是谁了，大家自己挖掘一下吧，本文原创整理，转载请保留以下链接。</p>
<p>作者：<a href="http://www.cndozz.com/">上海SEO &#8211; Chris.DL</a><br />
原文：<a href="http://www.cndozz.com/article/quotations-from-a-google-employee/">http://www.cndozz.com/<span id="sample-permalink">article/</span>quotations-from-a-google-employee/</a></p>
<p>1、<span style="color: #000000; font-family: 宋体;">这些消失的页面并不会对你的其他页面有负面影响。Google的爬虫会慢慢知道你的页面已经不存在了。提示的具体消失时间与爬虫抓取你的网站页面的频率有关。</span></p>
<p><span style="color: #000000; font-family: 宋体;">2、建议你访问一下<a href="http://www.google.cn/support/webmasters/bin/answer.py?hlrm=en&amp;answer=40209">http://www.google.cn/support/webmasters/bin/answer.py?hlrm=en&amp;answer=40209</a>. 请注意以下信息：<br />
“如 果对于 Googlebot 抓取的网址看到此状态（在&#8221;诊断&#8221;标签的 HTTP 错误页面上），则表示 Googlebot 追踪的可能是另一个页面的无效链接（是旧链接或输入有误的链接）。”也就是说，别人链接你的时候没链好。我们的建议是，找出这样的链接（无论是否存在于你 的网站），然后为这些链接建立301重定向，这样会提高你网站的访问流量。</span></p>
<p><span style="color: #000000; font-family: 宋体;">3、谷歌尽可能使垃圾链接的权重降为0。我们有自动的方法来判断一个链接是否相关，以及是网站所有者还是竞争对手在做垃圾链接。我们也不排除用人工的方法去确认网站链接是否自然。</span></p>
<p><span style="color: #000000; font-family: 宋体;">4、 如果页面结构相同,而正文内容是原创的,这不是内容重复。对于搜索引擎优化来说，应避免为了显示一个网站有许多内容而故意设置很多网页和子域名。也就是 说，要在确实需要，有利于用户浏览网页时才使用。关于收录，搜索引擎会根据很多不同的因素来考虑是否索引一个网页。我不清楚你的网站究竟是怎样的，所以不 能准确回答。去掉“补充材料”标记的主要原因是我们一直在试图缩小“补充材料”索引和主索引的差别。这种差别很快就会成为过去。</span></p>
<p><span style="color: #000000; font-family: 宋体;">5、 Google允许一个公司拥有多个网站，例如Google自己就有很多诸如www.google.com和www.google.cn的网站。如果一个公 司的多个域名有相同内容，我们建议使用301重定向。但是多个网站拥有相同的内容，对排名不见得有好处，且Google只会显示其中之一的内容。当然，如 果一个公司采用上百成千的网站来试图增加搜索引擎的流量，其结果会适得其反。我们会清除这样的网站，无论网站大小都是一视同仁。</span></p>
<p><span style="color: #000000; font-family: 宋体;">6、 对于IP和域名同时显示在Google搜索结果中的问题,主要原因是你的网页或其他人的网页中指向你的链接是含IP的URL. Google会认为这是一种内容重复.在显示结果时只显示其中之一.对你的排名是有一点影响的。主要原因是，你的反向链接被分流了。你应该把你的网页中的 所有含有IP的URL都用域名来代替，并想办法让你网站的外链都指向你的含有域名的URL。</span></p>
<p><span style="color: #000000; font-family: 宋体;">7、这种恶意递交毫无意义。对你的已有排名和流量不会造成任何影响。我所提醒你的是，在发布你的网站时，不要既发布域名，又发布IP，因为这会对你的网站的声誉造成分流。</span></p>
<p><span style="color: #000000; font-family: 宋体;">8、Google索引是顺藤摸瓜型，如果你的网站（页）不在藤上，或者在藤上的是一个错误的网址，Google就永远不会索引你的网站（页）。这时候你的SITEMAP就会告诉Google爬虫怎样准确地抓取你的网站。还有其他重要作用请参阅：<br />
<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=40318&amp;topic=8514">http://www.google.cn/support/webmasters/bin/answer.py?answer=40318&amp;topic=8514</a></span></p>
<p><span style="color: #000000; font-family: 宋体;">9、 我们早就注意到了SEO利用垃圾信息陷害竞争对手的问题，我们的算法总是努力删除无用地链接，而不去触及正规网站。我们保留维护我们索引质量和相关性的权 利，对某些不正规的网站进行处理。但是如果你的正规网站被我们错误地惩罚了，请使用我们的站长工具中的重新收录申请表来请求复议。</span></p>
<p><span style="color: #000000; font-family: 宋体;">10、我们的算法在显示搜索结果时，会考虑用户所用的域名。例如：在google.com.tw中搜索可能用户更感兴趣的是台湾的网页。而在google.com中搜索显示用户更感兴趣的是包括台湾网页的所有internet上的网页。</span></p>
<p><span style="color: #000000; font-family: 宋体;">11、 一般来说，如果你确实觉得冤的话，使用网站管理员工具来要求重新收录。在用该工具之前，请一定要确保你已经不再违反Google的网站质量管理员指南。我 们不惩罚“买链接的意图是商业广告,需要带来流量和知名度而已”，但如果你买的链接扰乱Google排名，就有可能被惩罚。所以买链接的时候一定要注意你 的卖主是否是在销售链接以扰乱Google排名。</span></p>
<p><span style="color: #000000; font-family: 宋体;">12、一般来说，即使你的网站是使用模板来生成的，你仍旧可以控制模板文件。我建议您搜索一下互联网，看看如何更改您的模板以使你的所有或单个文章301重定向到新网站。</span></p>
<p><span style="color: #000000; font-family: 宋体;">13、一般来说，如果你的重新收录申请过了一个月还没动静，这说明你的申请被拒了。你可能要彻底检查你的网站，看看你们是否有其他违反Google网站管理员质量指南的东西。彻底清除后再发另一个申请。</span></p>
<p><span style="color: #000000; font-family: 宋体;">14、Google允许用户买卖链接来提高网站流量，但是，买卖链接的目的不能是为了在Google搜索中得到不该有的排名。Google建议卖方使用nofollow标签来去除买卖链接对排名的影响。Google会对通过买卖链接改变排名的网站进行处理。</span></p>
<p><span style="color: #000000; font-family: 宋体;">15、 1. 谷歌对以文章名产生的URL可以识别, 无论它是那种语言。2. 如果一个链接是错误的,谷歌最多是丢弃该链接, 不会对链接和被链接的网站的排名有任何惩罚。3. 对example.com/index.html 和example.com/index.asp, 如果他们的内容是一样的, 谷歌会根据不同的情况收录其中某一页面。</span></p>
<p><span style="color: #000000; font-family: 宋体;">16、Google有识别重复内容的算法，虽然它不是100%的准确。如果你想确保你的搬家之后的文章为原创，最好的办法是使用301重定向。</span></p>
<p><span style="color: #000000; font-family: 宋体;">17、要让搜索引擎准确的判断原创，保持整个网站的高原创性是重要的因素之一。</span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/quotations-from-a-google-employee/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Matt Cutts专谈外部链接建设，Chris.DL记录篇</title>
		<link>http://www.cndozz.com/article/matt-cutts-talk-about-the-link-building/</link>
		<comments>http://www.cndozz.com/article/matt-cutts-talk-about-the-link-building/#comments</comments>
		<pubDate>Tue, 01 Jul 2008 08:15:38 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[Matt]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站排名]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=256</guid>
		<description><![CDATA[Matt Cutts的访谈，关于网站外链建设，原文：http://www.stonetemple.com/articles/interview-matt-cutts-061608.shtml

感谢Zac的翻译，有很多有意义的部分，以下是我在阅读几遍之后所做的记录... ]]></description>
			<content:encoded><![CDATA[<p><img class="alignnone size-full wp-image-257" title="mattcutts" src="http://www.cndozz.com/wp-content/uploads/2009/09/mattcutts.jpg" alt="mattcutts" /></p>
<p>Matt Cutts的访谈，关于网站外链建设，原文：<a href="http://www.stonetemple.com/articles/interview-matt-cutts-061608.shtml" target="_blank">http://www.stonetemple.com/articles/interview-matt-cutts-061608.shtml</a></p>
<p>感谢<a href="http://www.chinamyhosting.com/seoblog/" target="_blank">Zac</a>的翻译，有很多有意义的部分，以下是我在阅读几遍之后所做的记录。</p>
<p>一、Matt Cutts认为，好的外部链接就是能经受住时间考验的外部链接。通常这样的链接都是自愿给的。链接的人给出链接时，实际上含有编辑和投票的意味。</p>
<p>二、 链接诱饵案例：Zappos公司雇用员工，培训一两个星期后，凡是想退出的，发1000块钱。这就是他们的政策。他们想要的员工只是那些真正感兴趣，真正 想留下的。他们宁愿不要那些愿意拿1000块钱离开的人。这就是一个非常独特的客户服务政策，而这个政策给他们带来了很多链接。</p>
<p>三、链接诱饵案例：Danny Sullivan曾经花时间实验了Hotmail，Gmail和雅虎邮箱检测垃圾邮件的能力。他把所有邮件转发到这三个邮箱，计算被检测到的垃圾邮件的准确率。他持续跟踪了几个星期后得出结论，Gmail阻挡了394封垃圾，成功率98%。</p>
<p>四、链接诱饵还可以是独特的资源，词汇术语列表，特殊服务，开源产品，火狐浏览器插件等等。</p>
<p>五、比如一个人运行一个卖二手车的网站，他可能开发一个与二手车没什么关系的火狐插件。这样的链接不是一个特棒的链接，因为不具备相关性。Google需要的是与二手车相关的火狐插件链接到二手车网站。</p>
<p>六、对链接诱饵来说，越是与主题相关，越是有用。相关性高的链接诱饵链接文字通常与你的目标关键词也更相关。</p>
<p>七、Matt Cutts明确说，雇用顾问帮你进入Digg首页，你付费得到的并不是付费链接，你付的费是为了创意。对Google来说，这是完全可以接受的，并不被认为是付费链接。</p>
<p>八、 链接诱饵案例：一个按摩医生David Klein ，在WordCamp大会上与很多人社交，问了这些人的姓名，网站以及最想做什么事，把这些写在一个板子上，拍照留念，然后为这些人特意画了以他们各自最 想做的事为主题的卡通画。David Klein给其他人画了画，贴在自己的博客上。被画的人通常都很高兴的愿意告诉大家，并链接到David Klein的博客上。</p>
<p>九、工具诱饵是好是坏，要考虑的一些问题包括，链接是否是隐藏的？图片是否可以点击？链接是否隐藏在NoScript之类的代码中？这对用户都是不好的事情。</p>
<p>十、 Matt Cutts并没有太明确的回答，只是说工具诱饵与其他普通链接诱饵一样，Google的要求是放链接的人必须知道代码中有链接，知道链接到什么地方，所以 链接是带有编辑投票意义。如果有人是被骗而放上带有链接的工具，而他根本不知道有一个指向垃圾网站的链接，这并不是Google所要的。</p>
<p>十一、还可以通过链接目标判断质量，链接是连到开发小工具的那个网站，还是链接到一个完全无关的第三方网站？这也和是否与主题相关有联系。因为链接向第三方很可能意味着这是一个出售或付费的链接。指向第三方的链接，很容易被检测到。</p>
<p>十二、链接文字也是一个因素。如果链接文字只是网站名称，这就和堆积关键字的链接不一样。还有小工具中包含有多少个链接。如果有一堆链接，就太过分了。</p>
<p>十三、所以Google希望的是，用户充分了解工具中的链接，更理想的是<a href="http://www.cndozz.com/article/google-ranking-factors/" target="_blank">还有相关性（Google排名算法重点）</a>。</p>
<p>十四、接着提到互惠链接（交换链接）。Google大爸爸更新的一个特点就是，大幅降低互惠链接的价值，尤其是过多的互惠链接。</p>
<p>十五、但要注意的是，互惠链接只能在网站全部外部链接中占一部分，不能变成网站的所有外部链接全是交换来的。</p>
<p>十 六、Matt Cutts提到Google前不久曾经改写了他们的质量指南。以前写的是让站长避免互惠链接，后来改成了要避免过量互惠链接。像Google目录，雅虎目 录，可以肯定这两个目录之间有互相链接的情况。从某种意义上来说，Google和雅虎之间是有互惠链接的。所以互惠链接自然发生时是很正常的。</p>
<p>十七、过量互惠链接指的是整个网站外部链接很大一部分都是互惠链接。</p>
<p>十八、Matt Cutts还提到一句，交换链接时不必把全部注意力放在有权威性的网站，而忽略了那些小网站。链接的效能现在已经远远超出了PR值当初的定义。只要用户觉得有用，链接过去，对排名就是有帮助的。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/matt-cutts-talk-about-the-link-building/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google官方：Google搜索质量介绍</title>
		<link>http://www.cndozz.com/article/google-search-quality-introduction/</link>
		<comments>http://www.cndozz.com/article/google-search-quality-introduction/#comments</comments>
		<pubDate>Thu, 05 Jun 2008 08:13:06 +0000</pubDate>
		<dc:creator>Chris</dc:creator>
				<category><![CDATA[SEO分享]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[搜索引擎算法]]></category>
		<category><![CDATA[网站排名]]></category>

		<guid isPermaLink="false">http://herbashow.cn/?p=254</guid>
		<description><![CDATA[搜索质量团队是一支负责Google搜索结果排名的团队。我们的工作非常明确：每天都有数以亿计的人们向Google发出搜索请求 ，Google需要在短短几分之一秒的时间内从数十亿网页中挑选出符合搜索... ]]></description>
			<content:encoded><![CDATA[<div id="item_desc_777757115" style="display: inline;"><span style="font-size: 100%;">发表者:</span> <span style="font-size: 100%;">Udi Manber, <span lang="ZH-CN">工程事务副总裁，搜索质量</span></p>
<p>原文：</span><span style="font-size: 100%;"><a href="http://googleblog.blogspot.com/2008/05/introduction-to-google-search-quality.html" target="_blank">Introduction to Google Search Quality</a><br />
</span><span style="font-size: 85%;"><span lang="ZH-CN"><span style="font-size: 100%;">发表于：2008年5月20日星期二 下午06:20</span></span></span><span lang="ZH-CN"></p>
<p>搜索质量团队是一支负责</span>Google<span lang="ZH-CN">搜索结果排名的团队。我们的工作非常明确：每天都有数以亿计的人们向</span>Google<span lang="ZH-CN">发出搜索请求</span> <span lang="ZH-CN">，</span>Google<span lang="ZH-CN">需要在短短几分之一秒的时间内从数十亿网页中挑选出符合搜索要求的页面，并且以恰当的排序提供给用户。虽然近期我们也在做一些其他工 作，但请允许我以后再向您详细介绍。</span></p>
<p>
<span lang="ZH-CN">虽然很多人都在使用</span>Google<span lang="ZH-CN">的搜索服务，但令人吃惊的是很少有人了解</span>Google<span lang="ZH-CN">的搜索排名。这是我们的过错，但实际上我们是有意进行保密的。坦诚布公地说，很大程度上，我们需要对我们所从事的工作保密 。这主要有两个原因：竞争和欺诈滥用行为。竞争是很容易理解的。没有哪一家公司愿意与对手分享其核心技术；至于欺诈滥用行为 ，如果我们将排名算法公布于众，会使这个搜索系统容易被人为操纵。通过保密来保证安全从来都不是最好的办法，所以我们也不完全依赖 它，但保密措施也确实帮助我们避免了许多被欺诈滥用的可能。</span></p>
<p><span lang="ZH-CN">排名算法的细节从很多方面来说都堪称是</span>Google<span lang="ZH-CN">皇冠上的宝石。我们感到非常自豪也特别注意保护它们。据估计，已有一千多名程序员（科学家）将自己多年的研究成果贡献在它们的 发展中，因而它们的创新速度从没有放缓过。</span></p>
<p><span lang="ZH-CN">但保持完全神秘并不是理想状态，这篇博客就是我们想要改善此状况的一种努力。我们会努力做到定期向大家介绍新产品，讲解已有产品 ，提供建议，传播信息，进而增进交流。现在就让我介绍一些关于我们团队的信息，以此作为与大家沟通的开始。更多的博客也将会陆续发布 。</span></p>
<p><span lang="ZH-CN">借此机会我想简单的介绍一下自己。我的名字是</span>Udi Manber<span lang="ZH-CN">，目前担任工程事务副总裁，负责搜索质量的相关工作。我在</span>Google<span lang="ZH-CN">工作已超过两年，在搜索技术方面已经有差不多</span>20<span lang="ZH-CN">年的从业经历。</span></p>
<p><span lang="ZH-CN">负责精确排名技术的小组是整个团队的核心。对搜索结果进行排名是很困难的，比一般人想象的要难得多。原因之一是语言本身天然具有模糊 性，而记录信息的文档也五花八门，没有一定的法则。目前，还没有一个如何传达信息的统一标准，因此我们需要试图理解任何人 以任何理由写出的所有网页。而且，这只是问题的一部分。我们还需要理解人们提出的、平均少于三个单词的搜索提问，并将它们映射到我们对所有网络文档的理解中。更不用说每个人都有 不同的需要。我们必须尽最大努力在几毫秒内满足这些需求。</span></p>
<p><span lang="ZH-CN">在我们的排名算法中，最有名的部分是</span> <a href="http://www.google.cn/intl/zh-CN/corporate/tech.html" target="_blank">PageRank</a> <span lang="ZH-CN">，它是由谷歌的两位创始人</span>——LarryPage<span lang="ZH-CN">和</span>Sergey Brin <span lang="ZH-CN">开发出来的。目前</span>PageRank<span lang="ZH-CN">仍被使用，只是它已成为了一个更大系统中的一部分。其他部分包括语言模型（处理短语、同义词、符号 、拼写错误的能力等），查询模式（我们不仅要考虑语言本身，还要考虑人们如何使用语言），时间模型（有些问题要靠互联网上仅 仅产生才三十分钟的最新网页来解答，而另一些问题则需由经受了时间考验的网页来解答），和个性化模式（并不是所有人都想得到同样的答 案）。</span></p>
<p><span lang="ZH-CN">在我们的团队中，还有一个小组负责评估我们的工作。评估方式有许多种，但目标都是一致的：提高用户体验 。这不是主要目标，而是唯一目标。这里既有每分钟都在进行的自动评估（确保系统运行正常），对总体质量的周期性评估 ，还有更重要的是为具体算法改进而开展的评估，这也是最重要的。当一名工程师有一个新想法或开发出一种新算法时，我们都会对其想法进行全面测试。我们有一个统计小组专门负责统计 数据，同时评估这些新想法的价值。我们每周都会（有时甚至一周两次）召开专门会议审议这些新想法并且批准新方案的开展。在</span>2007<span lang="ZH-CN">年，我们共推出了</span>450<span lang="ZH-CN">多个新改进，平均每周推出</span>9<span lang="ZH-CN">个。其中的一些改进是简单而明显的</span>——<span lang="ZH-CN">举例来说，我们解决了希伯来语缩写检索词的问题（在希伯来语中，缩写词是由最后一个字符旁的（</span>&#8220;<span lang="ZH-CN">）来标识的，因此，</span>IBM<span lang="ZH-CN">的缩写将是</span>IB&#8221;M<span lang="ZH-CN">）；当然也有一些改进是非常复杂的——举例来说，在一月份我们对</span>PageRank<span lang="ZH-CN">算法做了显著改进。绝大部分时间里我们都在寻求改进搜索结果的相关性，但同时我们也在开展以简化算法为目的的项目。毕竟 ，简单一些总是好的。</span></p>
<p><span lang="ZH-CN">在过去两年中，跨国界搜索一直是我们关注的重点。这意味着我们要精通所有语言，而不仅仅是那些主要的语种。以去年为例 ，我们在阿塞拜疆语上取得了重大进展，而这种语言世界上仅有</span>800<span lang="ZH-CN">万人在使用。在过去几个月，我们进行了多种语言的拼写检查，包括爱沙尼亚语，加泰罗尼亚语，塞尔维亚语，塞尔维亚克罗地亚语 ，乌克兰语，波斯尼亚语，拉脱维亚语，菲律宾他加禄语，斯洛文尼亚和波斯语。我们建立了一个遍布全球的网络体系来为我们 提供反馈意见，同时还有来自</span>Google<span lang="ZH-CN">全球各部分的讲不同语言的员工自愿帮助我们改进搜索结果。</span></p>
<p><span lang="ZH-CN">还有一个小组是专门致力于对搜索特性和用户界面的改进。一个强大的引擎对于一辆好汽车是非常必要的，但并不是足够的 。好车还要舒适和易于驾驶。</span> Google<span lang="ZH-CN">的搜索用户界面非常简洁，很少有用户曾经浏览过<a href="http://www.google.cn/support/?ctx=web" target="_blank">搜索帮助页面</a>，因为不借助它用户也能使用得得心应手（但是阅读这些帮助页面总是 有益的，而且我们一直在努力完善它们）。当我们添加新特性时，我们会努力确保它们具有直观性并且易于每个人使用。过去一年中 ，我们做的最明显的变化是<a href="http://googleblog.blogspot.com/2007/05/behind-scenes-with-universal-search.html" target="_blank"> 整合搜索</a>。其他变化还包括</span><a href="http://www.google.com/notebook" target="_blank">谷歌笔记本</a>(Google Notebook)<span lang="ZH-CN">，<a href="http://www.google.com/cse" target="_blank">自定义搜索引擎</a>(Custom Search Engine)，当然还包括在</span>iGoogle<span lang="ZH-CN">上的改进</span> <span lang="ZH-CN">。用户界面小组由一个专门负责进行用户研究和评估新特性的专家团队组成。他们的足迹遍布世界各地，有时甚至到用户的家中去了解他们最 自然的使用习惯。</span> <span lang="ZH-CN">（不过不用担心，他们是不会搞突然袭击或是不请自来的</span> <span lang="ZH-CN">！）</span></p>
<p><span lang="ZH-CN">我们还有一个小组专门负责与<a href="http://www.google.cn/support/webmasters/bin/answer.py?answer=35769" target="_blank"> 网络垃圾和各种类型的欺诈滥用行为</a>作斗争。他们处理的问题非常广泛：从隐藏文本到充斥大量无用关键词而偏离 主题的网页，以及其他许多旨在提高搜索结果排名的恶意行为。这个小组密切跟踪网络垃圾的最新发展趋势并研究出行之有效的对策 ；与所有其他小组一样，他们的工作也是国际性的。反网络垃圾小组与</span><a href="http://www.google.cn/webmasters/" target="_blank">Google</a><span lang="ZH-CN"><a href="http://www.google.cn/webmasters/" target="_blank">网站管理员中心</a>小组紧密合作，从而能与大家分享他们的心得 ，并听取网站管理员们的意见。</span></p>
<p><span lang="ZH-CN">还有其他一些小组投身于其他的专门项目。总之，我们的组织结构是比较非正式的。人员具有灵活性，新项目随时都有可能开始。</span></p>
<p><span lang="ZH-CN">对于搜索，其中很关键的一点就是用户的期望始终在快速增长。明天的检索查询要比今天的更具挑战性。就像运算速度受摩尔定律支 配，每</span>18<span lang="ZH-CN">个月要成倍增长一样，搜索中也有一个隐形的规律，那就是最难的那部分搜索查询其复杂性在短时间内就会成倍增加，变得更为复杂 。这是不可能进行精确衡量的，但我们都能亲身感受到。我们知道自己不能总停留在现有状态上，我们必须努力工作，迎接挑战。正如我刚才所说的，在未来几个月中我们将继续为您提供 搜索质量改进的最新消息，敬请期待。</span></p>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.cndozz.com/article/google-search-quality-introduction/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
