Tag Archive for 'Google排名'

隐性语义索引与Google排名

Posted on 2009-03-29 in SEO SEMClosed

在昨天的网页标题分隔符的使用和SEO策略一文中提到隐性语义索引一词,下面让我细细道来什么是隐性语义索引

什么是Latent Semantic Indexing(隐性语义索引)?还是让我们来引用一段由 Jon Rognerud撰写的标题为“Learn how this single SEO secret can get you on the first page of Google”的一段原文翻译吧,译文如下:

隐性语义索引不根据搜索词的匹配判断和筛选页面及内容。它把所有文档看作一整体,然后分析判断还有哪些页面含有和整体文档相同的词和表达。 简单地说,这意味着对于文档、外部链接和反向链接,使用隐性语义索引的引擎会查看上下文中的单词和词组,理解文档的主题。如果写了鱼饵,鱼竿,诱饵,渔具,那很可能讲的就是钓鱼。

那么这个东西真的在起作用吗?我想事实是最有力的证据,下面就列举几个本人找到的利用隐性语义索引算法优化的网页,这些例子绝就绝在整个网页不含有在Google中要找的关键词,完全是通过隐性语义索引算法使它们的排位显示在谷歌搜索返回页面的首页。

例子1、在Google中搜“音乐下载”,搜索返回页面首页一项“百度MP3——全球最大中文MP3搜索引擎”与所要搜索的关键词极不匹配,如果你看到在网页内容中虽找不到连续的“音乐下载”,但还是出现了“音乐”两字而感到不服,那么请看例子2。在Google中搜“网站导航”,第一个结果:hao123网址之家,也是这种情况,全页找不到连续的检索词。

例子2、在Google中搜“mp3”,排位比较靠前的结果中“爱问音乐搜索”和“SoGua 搜刮第一音乐娱乐门户”整个网页连一个“mp3”字样的影儿都找不到,尤其是第二个结果,甚至在网页源文件中都找不到“mp3”字样。

类似的例子真的很多!在Google中搜“排行榜”,第一页的结果中“百度-中文搜索风云榜”也是这种情况。但是机器毕竟是机器,程序的智能化也脱离不了机械的运算和判别方式,因此,这个隐性语义索引算法也有出错的时候,在Google中输入“视频”,在返回的搜索结果中有一项“最全的手机铃声汇总”,打开该页,网页的内容是关于手机铃声下载的,与视频无关。当然这只是极特例的情况。

到这里,大家应该相信隐形语义索引这个算法在真正起作用了吧。该算法权重的调整将在很大程度上提高搜索返回结果的匹配程度。还是举个例子来说明这个问题,在谷歌中搜索“网络硬盘”,现在返回的结果中排位靠前的几乎都是真正提供网络硬盘服务的网站,以往一些权重很高的介绍网络硬盘的博客文章几乎毫无例外地被甩到后面去了。谷歌这样做的原因是因为它知道,当人们用“网络硬盘”为关键词搜索时,他们最想获得的是正真的网络硬盘供应商而不是一篇博客文章。按照个人的理解,这里需要强调的是Google所定义的这种语义相关性与人所理解的概念还是有一定差别的,其通过大量的收录网页,发现在同一检索词下返回结果的共同之处。还是这个网络硬盘的例子,当Google索引含有“网络硬盘”这个关键词的网页时,统计出有许多这样的网页都同时含有诸如“上传、下载、浏览文件、帮助、确定、下载进度、上传进度、取消上传/下载

域名信任度与Google排名

Posted on 2009-03-19 in SEO SEMComment

  近两年,域名信任度在Google排名算法中比重很大。很多时候大型,信任度高的网站,内页能占据很多关键词排名,而且毫不费力。域名信任度威力最明显的就是维基百科。

  给予域名信任度这么大权重,Google是为了对付垃圾网站。这个逻辑的前提是,已经获得信任的网站,通常都洁身自好,不会有质量太差的内容。做垃圾网站的都是图短平快,不会花时间把垃圾站做成一个信任度高的网站。

  这固然有它的道理,但副作用现在也越来越明显。比如很多人靠在一些域名信任度高的大网站上创建个内容页,就能取得个好名次。这种例子在一些竞争度很强,黑帽聚集的关键词中很常见。

  无论如何不管好处坏处,这是一个事实,我们做网站的就只能去适应。

  我感觉域名信任度最主要的是下面这几个因素。

  来自其他信任度高的网站的链接

  Google关于TrustRank的最初解释是,人工选出信任度最高的一批种子网站,估计指的是雅虎,纽约时报,维基百科等这些显而易见的高质量网站。然后根据这些高质量网站链接到哪些其他网站,从而找出次一级的被信任域名。也就是说如果你的域名从雅虎,纽约时报等有链接,那么你的域名就获得了第二级信任度。

  以此类推,第二级信任域名又能带出一批第三级,第三级又连向第四级。离核心越远,信任度越低。

  这个概念有点类似于PR值,都是以链接为标志,但它不是PR值。

  最核心的被信任的网站只有100多个。它们都是人工选出来的,而不是按PR值衡量的。这个域名信任度也不是按页面计算,而是按域名计算。所以域名信任度并不是取决于链接的数目,尤其不是垃圾链接的数目。所以以前我就强调,链接最看重的是质量,而不是数量。

  域名历史

  这包括域名最初注册时间,第一次被Google抓取页面的时间。

  很显然,注册越早的域名,被信任度越高。很简单,也很有效。如果你有一个注册已有十年的域名,那是一个威力强大的武器。如果你有一个注册了15年的域名,不管拿它来做什么,很可能无间不摧。

  我自己有的最老的域名,也只有6年而已。这也就是为什么我虽然不满意SEO每天一贴所在的域名,但我并不打算换。就算是两三年的历史,也是新域名无法获得的,这是不可重复的资源。

  网站内容是否原创及更新情况

  最核心的100多个被信任的域名挑选是人工所为。我们可以想象对内容原创性要求一定是占很大比重,而且这些网站一定都是经常更新的。算法可以被糊弄,人可没办法糊弄,尤其是这么重要的事情。

  很难想象有采集站会被当做是信任度高的网站,至少在网站开始时,必须是以原创为主。获得了一定的信任度之后,再加入一些转载的内容,可能无伤大雅。

  当然还有一些其他影响域名信任度的细节,我感觉最主要的就是上面这三个条件。