揭秘搜索引擎的四个特征:深度索引、精准搜索、智能推荐和实时更新
搜索引擎作为人类的基础,是强大的,但是它也需要分析数据,那么它是怎么来了解数据的呢?
我们说的搜索引擎实际上是一个完全机器化的内容生产平台,并不是基于其他用户的,而是基于搜索引擎的算法逻辑进行排名。
那有人就问了,如何找到搜索引擎的核心算法逻辑?
搜索引擎算法,算法底层算法很简单,只要把一些研究工作做到极致,基本就能从底层开始分析算法。
今天我们就以淘宝和抖音为例,来分析一下搜索引擎的4大核心算法,以便有兴趣的朋友能更深入的了解。
第一大核心算法:索引
百度百科所说的“索引”指的是搜索引擎抓取网页的数量。这个索引量的统计来源于百度百科的官方数据。
比如,在百度百科搜索的信息显示,每10条内容的平均被搜索的次数是40-50条,平均被百度收录的概率是30%。
以淘宝为例,平台会根据数据的变化推送给搜索者,如果他们的“索引”信息被百度收录,则会继续推送给用户,如果用户的信息没有被百度收录,则会继续推送给用户。
第二大核心算法:页面收录
第二大核心算法:PR
PR是谷歌专利中第一个对互联网内容质量的评估标准。
为什么PR呢?因为PR主要用于评估一个网站内容的质量。
例如,我们网站的PR是100,但是PR是10,而搜索结果是10万条,而PR只有1。
如何判断一个网站的质量?首先要看这个网站的PR,然后看看这个网站的质量怎么样。
那么,如何判断一个网站的PR值?我们将从五个方面进行判断。
在这个阶段,我们将查看百度权重。
360的权重也不低,主要用于评估一个网站的PR值。
企鹅的权重低于百度。
搜狗的权重虽然不如百度,但仍然高于百度。
IBMPR值是谷歌专利中第一个对互联网内容质量评估标准的评估标准。
但是,如果这个网站的PR值比百度高,那么这个网站的质量也就差了。
在互联网界,有两个非常经典的关于PR的问题,一个是我认为太有PR值,一个是我觉得太有PR值。
其中一个很明显是我认为我认为没有PR值的网站并不影响我的权重。