关于我们 联系我们 加入收藏
首页 网站推荐 新闻中心 网站合作社 在线调查 互联网日报 互联网论坛 博客 流量通  
搜索如何来判断核心内容的思考
文章摘要:
搜索引擎蜘蛛把页面代码送回搜索引擎服务器后,SE是如何判断页面中最核心的内容呢? 先说下Kyw认为的搜索引擎运作过程的前几个步骤: 1.蜘蛛下载A页面,送回服务器; 2.服务器寻找A页面的核心内容位置,然后去除HTML代码; 3.寻找网页核心内容; …… 我不确定GOOGLE、百度、YAHOO!是否...

搜索引擎蜘蛛把页面代码送回搜索引擎服务器后,SE是如何判断页面中最核心的内容呢?

  先说下Kyw认为的搜索引擎运作过程的前几个步骤:

  1. 蜘蛛下载A页面,送回服务器;

  2. 服务器寻找A页面的核心内容位置,然后去除HTML代码;

  3. 寻找网页核心内容;

  ……

  我不确定GOOGLE、百度、YAHOO!是否真的有“判断核心内容”这个步骤,但我相信一定有类似的运算机制,因为如果没这个步骤,搜索引擎将耗费大量资源做重复运算。当然KYW不是搜索引擎工程师,下面只是对搜索引擎的一些思考。

  SE面对一整页HTML代码,如何判断核心内容在哪里呢?

  第一步:拿该页面和同域名、同目录、同文件名格式的页面做对比,去除相似的部分。经过这个步骤,头部的导航条、底部的版权信息、固定位置的广告就被去掉了。我估计搜索引擎在每增加一个新网站的时候,会建立一个对比模板来提高工作效率。如果网站经常改版,在改版刚开始的期间,搜索引擎还没反应过来,就可能造成新收录网页的排名不理想。

  第二步:去掉有大量链接的部分。经过这步,“相关文章”“推荐文章”等都被去掉了,剩下一些包含文字内容的代码。

  第三步:在剩余的代码中判断哪段标签(可能是DIV、TABLE、P或其它标签)中的文字内容最多,因为一般核心内容的文字量会比较多。

  每个页面经过上面3个步骤,应该就能顺利的判断出核心内容所在的位置。经过这样的思考,我们也许可以这样总结:

  1. 同目录下的页面,最好模板一样。

  2. 核心内容文字量不能太少,特别是企业站和B2C网站,只放价格和包含大量说明文字的图片是很不好的。

  3. HTML代码中如果错误很多,可能会影响排名,因为搜索引擎可能在判断核心内容的时候出差错。

  4. 期待你的补充 ^_^

  Kyw把SEO的主要工作理解成帮助搜索引擎更高效的理解网站及页面的内容,所以建议大家有事没事琢磨琢磨搜索引擎,问题想透的越多,SEO的手法也就更加随机应变了。当然也没必要钻牛角尖,有想不通的问题就到我这留言吧。

(互联网观察中心)
上一篇: 论坛发展推广的解决方案
热门专题
提升Alexa排名
热门专题
提升PR值
热门专题
百度搜索优化
热门专题
Google搜索优化
热门专题
提升流量
相关文章
·现在不常用的一个小方法增加你
·电子商务和品牌的网络推广的关
·低成本增加网站流量大法
·短期快速获得网站流量方法
·Web2.0—未来网络营销新
·如果利用Q群提升你的流量(实
·轻松提高网站流量
·08年比提高流量更重要的是什
·新站如何增加网站的外部连接
·站长写软文的意义
·其实菜鸟也能建好网站
·孙子兵法是做网站的宝典
·教你提高百度的排名
·一个菜鸟怎样用SEO做流量
·关键词排名与SEO真正的关系
·新手站长从确定关键词做起
·百度收录网站过程
·原创内容有多重要?
·关于百度所受的谩骂和百度自身
·网站优化的奇招妙技

热门文章
·搞笑图片网的推广方法
·不骗流量 教你怎么做流量
·如何增加PR值,如何提高PR
·多种网络营销方式
·新网站做宣传最好的八种方法
·做一个网站要怎么推广出去
·如何快速提高PR值的方法?
·日ip万以上网站 GG的月入
·上万流量的方法关键揭密
·百度的搜索优化实战案例


推荐下载
Alexa工具条 - 网站必备工具