商丘做网站,商丘网站优化,商丘网络推广,商丘网络公司
当前位置:

搜索引擎TF-IDF算法

发表日期:2021-05-10 09:49聚圣源浏览次数: 本文关键词:算法,搜索引擎,排名,影响,的是,研究,权重,不稳定

我已经在博客说了学seo研究算法是愚蠢的行为,但是很多人仍旧来问se的算法问题,其中最多的就是问TF-IDF算法,为了能够让大家加深对这个的问题的认知,我因此就深度解析下这个算法的一些问题。

第一点,TF-idf是什么?

TF和IDF是两个不同的概念,tf通过一个文档内词项的重复次数来表示这个词项在所有词项中的重要度,而另一个idf则是一个词在所有文档中出现次数表示这个词项的重要程度,出现的越多也就是常用词,由于主题性不强重复越多重要度越低。TF-IDF是一种统计方法,

用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。

这个百科的解释加上我自己的描述,不知道大家是否很清楚了?总之TF-IDF是通过一定统计意义来表示词项的重要度的。seo为何很关注他呢,因为他可能影响检索词和搜索词的相关性,进而影响排名。

第二点,TF-IDF算法是解决什么的,能起到多大的作用?

其实我们既然研究了这个算法,就不能不去了解这个算法是解决什么的,其实我刚才也说了,它主要解决的就是一个文档中词项权重的问题(很多人都知道这个算法影响排名,却不知道这个算法为何能影响排名的)。那么我们可以再问下,影响词项权重的因素有多少呢?目测大约也就5、6个吧(但是我们都知道几个呢?),TF-IDF在词项中占据什么地位呢?重要度或许可以排在第三位、第四位的样子(也不是最主要的因素嘛)。而且我一直说的,如果你真的要研究算法,就不仅要研究算法是什么,也要考虑下算法的特征和算法特征的处理,因为他们都影响最终的结果,比如这个TF-IDF的算法。

第三点,TF-IDF的算法特征是什么

这是人们很少关注的一点,算法的特征和算法特征的处理之所以重要,是因为凡是算法都会控制因素的影响,或者说进行平滑性处理。这个也不例外,很多人没有注意到这个影响,或者对这个有了过激的思想,那么就会对很多的seo细节耿耿于怀,却不得其解。想学会这点,我觉得那个谷歌的黑板报很多讲算法的时候都说到了,很多实际应用模型和理论模型大多都有一定的差距,这就是现实。

第四点,TF-IDF算法再向上,问题的来源是什么,处于检索的什么地位?

其实,我一直推荐的是跳出算法禁锢,放在更长远的看待这个问题,比如TF-IDF要解决的问题的根源是什么,这个问题可以在检索原理中处于什么样的一个地位,会不会随着时间而改变……。只要你向上思考,慢慢更多的seo浮出来,那个神马的TF-IDF也可以慢慢地放弃了。

第五点,算法之外

TF-IDF是用来研究词项权重的,早期用来进行相关性判断,但是也并不一定一成不变的,比如BM25算法在很多方面都比他更加具有优势。但是随着检索技术的进步,比如语义分析等技术的发展,这个算法也会被渐渐限制了起作用的范围和影响力。这也不能不说研究算法的悲剧。而且,我一直说的是,我们完全可以跳出这个范畴,从问题本身出发去思考问题,或者更深层的站在检索的角度观察这个问题的意义,观察解决这个问题可行性,观察结果和我们所想的差距……嘎嘎,不能再深入……

PS:我最近一直四处飘,也在发力学些新东西,所以时间不是很充裕,你所看到的博客我几乎都是有所想法的时候,花费了大约30多分钟一气呵成的,难免有很多瑕疵,万勿见怪。我会继续更新seo思维进化论系列,里面虽然没有讲技术,但是我觉得还是有些东西值得seoer去思考下的,下面我也打算写一些seo入门的东西,希望能给一些新人有些帮助。我所做的一切,最主要的目的还是希望大家能冷静地看待seo,慢慢地回归正途。

文章来源:公众号SEO实战营(ID:ilottecn),原文链接:https://mp.weixin.qq.com/s/0Nvt7VQRsNDwuj_gWC7Vow

如没特殊注明,文章均来自网络! 转载请注明来自:http://www.jushengyuan.com.cn/news/wzyh/5031.html

网站设计案例推荐

热门文章

企业站可以做聚合页面吗 一般怎...

企业站可以做聚合页面吗? 企业网站可以做聚合页面吗?看网上说基本只有大平台网站才做聚合页面,少于5000个页面就不要做聚合页面是这样的吗? 其实不是。 企业站也可以做聚合页面啊。 比...

日期:2021-02-19 浏览次数:7998

百度搜索结果右侧的相关企业怎...

今天和大家聊聊百度搜索结果右侧的相关企业怎么做的? 首先小编先为大家更正一个错误,搜索结果右侧的相关企业,不是怎么做的,而是不能做。因为他是搜索引擎根据多维度分析后自动推荐的...

日期:2020-11-30 浏览次数:7998

SEO必须了解的网站微调...

当我们优化网站一段时间,应该对现在网站结构、关键词布局、内链建设、首页丰富度、TDK等基本参数等需要进一步调整。当初建立网站所有的优化策略,都是依据以往的实操经验,和现有的用户...

日期:2021-01-30 浏览次数:7996

“SEO+营销”融合,推动企业网络...

网络营销作为当前企业发展中十分重要的推广模式,而今在很多行业都备受众多企业的认可和青睐,而今选择做网络推广排名的企业数量也变得越来越多,通过优质网站排名优化效果,也可以给企...

日期:2021-01-30 浏览次数:7996

详谈百度排名必懂的算法...

网站排名,并不是只做好某一个方面的操作,搜索引擎的算法每天都会更新,针对各行业会有不同的更新周期,能否获取好的排名,先要问问对搜索引擎了解多少,目前90%搜索是信息搜索,但是价...

日期:2021-01-20 浏览次数:7996

相关文章

网站优化之索引量和收录量的区...

一直以来,许多SEO优化师对百度索引量和收录量的概念混淆不清,搞不清二者之间究竟有什么区别和联系。不少人认为索引量就是收录量,或者索引量是搜索引擎收录到数据库中的量,收录是在搜...

日期:2020-11-25 浏览次数:6782

网站优化如何修改网站已经收录...

我们每一位优化师为了能够让网站的排名迅速提升,都会向网站上上传一些高质量文章。做合肥网站优化的时候难免我们文章内容需要更改,那么收录后的文章我们应该怎样去修改呢? 更改的幅度...

日期:2020-11-25 浏览次数:6958

seo高手常用的seo优化技巧...

我们都知道,SEO网站优化是建立在遵循搜索引擎规则上的,所以,了解搜索引擎对网站排名的规则,投其所好去做优化,这样做起来见效比较快,也比较持久,有利于提高企业网站的排名。那常见...

日期:2020-11-25 浏览次数:6160

seo培训公司是怎么教你交换友情...

在网站优化中,不可忽视的就是外链优化,外链优化中作用较大的就是友情链接部分,友情链接具有提升网站流量、提升PR值及提升关键词排名等等效果,但是质量差的友情链接不会起到这些作用...

日期:2020-11-25 浏览次数:6459

seo提高网站收录的方法...

我们在运用一些检测工具检测页面收录率的时候,通常会发现大多都是收录了网站的文章页面或是某一栏目页。如何提高这些页面的收录率呢?下面,懒猫seo教你几招! 1、保持内容更新 内容很重要...

日期:2020-11-25 浏览次数:6776

随机推荐

为什么我一直坚持白帽SEO...

五个网站外链建设的方法...

如何把网站流量做到一万 全文...

逆冬:9月第1天,5个SEO社群小问...

百度会区别对待不同域名前后缀...

SEO问答:新站收录首页多久?百...