SEO需要简单理解搜索引擎的工作原理,以便更好地进行SEO。

搜索引擎的简单工作大致分为三个步骤。

爬行和抓取

1.蜘蛛:百度捕捉机器人:baiduspider

2.点击链接。深度优先和广度优先两种模式(网站树结构图)

3.吸引蜘蛛。网站或页面的权重、页面更新率、导入链接的数量、与主页的距离

4.地址库,避免重复爬行

5.文件存储

6.爬行的简单内容处理,蜘蛛爬行时可能不包括

预处理(索引)

1.提取文本。从源代码中提取文本

2.中文分词

3.消除噪音。删除与页面主题无关的内容

4.重量去除

5.索引

排名

1.搜索词处理:中文分词、拼写纠正

2.文件匹配

3.初始子集的选择

如何实现搜索引擎的原理

4.相关性计算:关键词的共同度、词频、关键词的位置和形式、链接分析和权重

5.排名显示

6.搜索缓存

7.用户查询和点击日志

评论:

1.搜索引擎是一种索引工具,本质上与图书馆的图书管理工具没有区别

2.搜索引擎是一个程序,其算法由人决定

3.公开了搜索引擎算法。如果你感兴趣,可以去专业网站查询。