首页 >> 新闻 >> 谷歌优化

Google是如何预处理你的外贸网站的?
更新时间: 2020-07-09

  

  Google收录了你的外贸网站后,它都在干些什么事情呢?蜘蛛每天抓取的页面非常非常多,但这么多的页面谷歌不可能全部保存。谷歌会通过它的预处理也称索引机制,将蜘蛛所抓取到源代码数据中的核心关键词信息挑选出来。那么谷歌是怎么挑选呢?一起来了解一下吧~您可能感兴趣的文章:Google是如何收录你的外贸网站的?

  提取文字蜘蛛抓取的页面中包含很多源代码,预处理要做的事情首先是先把代码中的文字信息提取出来,包含标签文字、图片替代文字、链接锚文字、正文。

  过滤停止词在提取的文字信息中会包含很多例如the,a,an,to,of的词,这些词就像我们中文的啊、哈、呀的感叹词,出现频率很高,但有没有都不会影响内容中的主要意思,这些词称为停止词,也会被过滤掉的。

  消除噪声在网站的页头、导航、正文、页脚中会存在大量的重复内容,在这些页面中几乎都会有相同的源代码,谷歌会把重复的内容去掉,只留下不重复部分。

  去重复页面大多网站,往往将一个产品覆盖很多关键词并重复发布,几乎产品的详情页都是一样的。但这种方法并不适用于谷歌,因为当用户在搜索浏览前几页内容时多次看到同样的内容,对用户的体验会很差,谷歌是不会对重复内容重复收录的。从这些过程中,谷歌可以判断你的网站质量。