Java开发网 Java开发网
注册 | 登录 | 帮助 | 搜索 | 排行榜 | 发帖统计  

您没有登录

» Java开发网 » 技术文章库  

按打印兼容模式打印这个话题 打印话题    把这个话题寄给朋友 寄给朋友    该主题的所有更新都将Email到你的邮箱 订阅主题
flat modethreaded modego to previous topicgo to next topicgo to back
作者 Google的网站收录和排名
asdld





发贴: 16
积分: 0
于 2007-12-18 16:05 user profilesend a private message to usersearch all posts byselect and copy to clipboard. 
ie only, sorry for netscape users:-)add this post to my favorite list
Google中文 Google采用新一代的先进技术,根据互联网本身的链接结构对相关网站用自动方法进行分类,为您的每一个查询迅速提供准确的结果。Google以其独树一帜的网页级别(PageRankTM,已申请专利)技术,打破了传统网络分类概念,带来网络搜索的革命。Google搜索速度极快,而且准确率极高。


Google可贮存网页的快照,当网页服务器暂时中断时您仍可浏览到该网页的内容。若找不到服务器,则Google暂存的网页也可救急。从贮存网页快照中找寻资料要比常规链接快得多,尽管所获取的信息可能不是最新的。而且在很多情况下可免受“404 Not Found Error”(找不到网页的错误信息)之苦。

网站登陆:
Google经常在网上漫游,搜寻新资料。Google也可以让您提供新的网站信息。但Google会分析网站内容,所用时间长短不一,用以决定网站信息是否使用。首先输入网址,包括前缀http://,如http://www.google.com/。还可以加上网站简介,但此项说明仅供Google内部参考,并不影响Google对网页的编排。
如果您的网页提供多种汉字代码的用户界面,请选择一个您认为最应该向大家介绍的那一个。

注意:登录网址时,只须提交最上层的网页,其他各页由Googlebot自行查找。Google会定时自动检索并更新所有网站;对于失效网页则将其删除。

关于排名:
作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。Google根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外, Google还要分析为其投票的网页。"重要"网页所投之票自然份量较重,有助于增强其他网页的"重要性"。

重要的、高质量的网页可获得较高的网页级别,从而在搜索结果中可获较高的排位。这样,Google的重要性综合指标为网页级别,而不是根据某一个具体的查询。当然,这代表了该网页本身的特性,是由Google根据网络数据、采用评定链接结构的综合运算法则进行分析的结果。

当然,如果与查询项目不匹配,再重要的网页也毫无意义。因此,Google采用完善的正文匹配技术,为您查找既重要又准确的网页。例如,Google在分析一个网页时,还会同时参考指向此网页的链接描述。

与其他多数搜索引擎 的区别在于:Google只显示相关的网页,其正文或指向它的链接包含您所输入的所有关键字,而无须再受其他无关结果的烦扰。

Google不仅搜索出包含所有关键字的结果,并且对网页关键字的接近度进行了分析。与其他多数搜索引擎的一大区别是:Google按照关键字的接近度区分搜索结果的优先次序,筛选与关键字较为接近的结果。

网站登陆Google的关键:网站外部链接
网友经常有这样的反映:我的网站提交Google很长时间了,怎么就是找不到我的网页呢?有些对搜索引擎工作原理不熟悉的人甚至认为,只需将网页做好,上传到网站空间,就会自动登陆搜索引擎。

对后一种情况可以打个比方,就好象一个人自生下来就成了孤儿,而且又一直独处,不跟任何人接触,突然有一天却愤愤不平地说,为什么谁都不认识我!?网站也是同样,你不进行宣传和推广,它就象茫茫网海中的一座孤岛,被人发现的机会几乎没有。

前一种情况稍好些,至少知道要将网站提交到Google,这种做法在几年前也许有效,但现在就不够了。可以这么说,网站链接是搜索引擎存在的基础。从全文搜索引擎工作原理中可以看出,搜索引擎是依靠跟踪各网站间的链接来找到网站和抓取网页信息的,如果网站都相互独立,搜索引擎的工作效率、所提供信息的广度和质量都会大打折扣。

对Google而言,链接可是它的“命根子”,也是它成***的关键。所以Google一有机会就向你灌输这样的观念:出去找链接吧,不然你的网站是不会被我们接受的。Google曾在一次搜索引擎学术会议上说明了收录网站的最低标准,即当你向Google提交网址时,至少要保证已有一个外部链接。实际上如果网站的外部导入链接足够多的话,你根本用不着直接将网址提交给Google(而且Google也不建议你这么做),这样反而会更快地被Google收录。

现在我们知道了链接在登陆Google时的作用,下面介绍一下获得外部链接的方法。在介绍之前,有必要先将有关链接的概念澄清一下:

网站登录Google与网站设计

对网友来说,没有比Google将自己呕心沥血建好的网站拒之门外更让人郁闷的事了。的确,就目前Google所处的地位来说,将自己的网站登录Google搜索引擎成了站主们心中的头等大事。可有时就是天不随人愿,花好大代价建成的网站,谁见了都被迷得五迷三道,而让对面的Google看过来,它却不理不睬,搞得站主们心里直犯嘀咕:我到底哪儿得罪Google了?

其实在对待收录网站的问题上,Google还是相当宽容的,而且从扫描技术上说它也是最全面的,不过万一你的网站得不到Google的赏识,不仿从以下几个方面找找原因(请首先确认Google的确没收录你的网站):

■ 网站设计是否搜索引擎友好
1、纯Java网站

如果你的网站是用纯Java设计的,那么就要小心了,因为Google曾在一些场合明确表示过不会收录用纯Java技术制作的网站。

2、Flash网站

如果你的网站大量使用Flash,例如首页为一个Flash动画,并且链接内嵌在Flash中,对这种网站Google是不太感冒的,而且一些搜索引擎(Google、Fast/AllTheWeb等)虽然已能解读图象中的内嵌文字和链接,但并未正式使用在对内部网页的检索上。

3、纯图象首页

目前许多网站(尤其是企业网站)将首页设计成仅包含图象的形象页面(splash page),加上网站内容太少,因此常常造成无法成***登录Google。听听Google对此是怎么说的:“We want to point users to content pages,not to doorways or splash screens”。

4、网页框架(frameset)

Google可以检索使用网页框架结构的网站,但由于搜索引擎工作方式与一般的网页浏览器不同,因此会造成返回的结果与用户的需求不符,这是搜索引擎所极力要避免的,所以Google在收录网页框架结构的网站时还是有所保留的。如果你非用框架结构不可,可以将相关内容放在<noframes></noframes>标签中。

5、动态网页

Google是较早支持动态网页检索的搜索引擎之一,但有一定限度,Google的解释是:“because our web crawler can easily overwhelm and crash sites serving dynamic content, we limit the amount of dynamic pages we index”。

不过据我们观察,Google现在对动态网页的支持很好。但如果动态网页存在回路(loop),很容易将spider套住让它无法脱身,所以当你找不到其他无法登录Google的原因时,可以试着将动态网页改成静态html文件。

6、网站内部链接

网页之间的链接最好是文字链接,其次是图象链接。虽然Google已能跟踪和解析JavaScript和Flash中内嵌的链接,但从搜索引擎友好的角度讲还是不要大量采用JavaScript和Flash链接。

网站/网页访问是否正常

1、网站访问速度

你也许想不到,网站访问速度太慢也是影响成***注册Google引擎的原因。这方面我们是有“血”的教训的。如果发现网站响应速度过慢,建议你赶快换一个主机。如果你对登录Google是认真的,多花些钱还是值得的。

2、网页大小

虽然网页大小不是最关键的因素,但从搜索引擎友好的角度说,下载越快的网页被成***收录的几率也就越大。至于网页字节数多少合适没有一个正式的标准,一般说法是不超过50K,不过有一点是肯定的,如果你做一个100多K的网页,无论对搜索引擎还是普通浏览者来说都不是件好事吧?

3、更改文件名

对网站进行调整时要注意,不要对网页文件名做过多地更改。当Google探测到用户点击的多数是无效连接时,会将你的网页从搜索结果中摘除。如果你必须大面积更改文件名,可以使用主机的301转发***能,将原来的链接指向新的文件(切记不要在原页面设置META Refresh转发)。

网站提交Google注册应注意的问题

Google对网站链接非常重视,这一点也反映在对导出链接(out-going/outbound links)的评估上。首先你要保证你的网站“properly linked to other sites”,也就是说如果你的网站只有外部反向链接而没有导出链接的话,即使不一定影响你成***注册Google搜索引擎,也会对你的网站在搜索结果中的表现带来负面影响。

当然网站中连一个导出链接都没有的情况非常罕见,除非你是刻意这么做。正常情况下大家都会自然地在网页中加上一些其他网站的链接,带领访问者去到我们认为重要或能够提供更多有价值信息的地方,这就是所谓的“搜索引擎第二定律”。

就在你将好不容易吸引来的访客拱手让给别人的时候,不仅是帮了Google一个忙,而且从信息检索总体来说,你也为其他搜索者做了件好事,因为你的链接会让包括Google在内的搜索引擎们能够更准确地判断哪些是对用户最有价值的信息。所以Google才会建议你“link to other sites”。

但请注意前面一修饰词:“properly”,就是说你连向其他网站没问题,不过不要随心所欲,不然Google会给你好看!那么怎样做才算是“properly”?

首先一点,也是最重要的一点,就是要将链接连向你认为访问者最感兴趣的东西。这方面大家自然会做到,无须赘言。

第二一点,不要在首页设置过多的导出链接。这倒不是Google有明确要求,而是我们从实践总结出来的经验。我们不只一次地见到首页几乎全部为导出链接的网站,其PageRank为灰色,很明显被Google定性为无收录价值的网站。

还有一点很容易被我们忽视,就是要检查现有的导出链接是否连向了被Google惩罚的网站,一旦发现要赶快将连接去掉,否则会被Google认为是“bad neighborhood”中的一员,惨遭被惩罚的厄运。




话题树型展开
人气 标题 作者 字数 发贴时间
13561 Google的网站收录和排名 asdld 4535 2007-12-18 16:05

flat modethreaded modego to previous topicgo to next topicgo to back
  已读帖子
  新的帖子
  被删除的帖子
Jump to the top of page

   Powered by Jute Powerful Forum® Version Jute 1.5.6 Ent
Copyright © 2002-2021 Cjsdn Team. All Righits Reserved. 闽ICP备05005120号-1
客服电话 18559299278    客服信箱 714923@qq.com    客服QQ 714923