搜索推荐知识点

搜索推荐知识点

动态

架构

搜索

搜索难还是推荐难.png

搜索系统的架构和主要模块

  1. 长尾词、精准词以及宽泛词:https://zhuanlan.zhihu.com/p/382001982
  2. 搜索意图识别的做法:https://zhuanlan.zhihu.com/p/563387472?utm_id=0
  3. 类目预测:
  4. 多模态技术?
  5. 无监督的方法-贝叶斯分类算法 https://zhuanlan.zhihu.com/p/26262151
  6. knn算法:
  7. 召回:
  8. 语义召回 https://zhuanlan.zhihu.com/p/475913285
  9. idf: IDF(Inverse Document Frequency,逆文档频率)是一种用于衡量词语在文档集合中的重要性的统计方法。它是信息检索和文本挖掘领域的常用技术,主要用于计算词语在文档中的权重。 IDF的计算方法是:对于一个给定的词语t,IDF是所有文档总数与包含词语t的文档数之比的对数。计算公式如下: IDF(t) = log(文档总数 / (包含词语t的文档数 + 1)) IDF的主要思想是:如果一个词语在很多文档中出现,那么它的区分能力较低,IDF值较小;反之,如果一个词语在较少的文档中出现,那么它的区分能力较高,IDF值较大。通过IDF值,可以筛选出对文档主题有较高贡献的关键词。

推荐

  1. 推荐系统:协同过滤CF和基于内容的推荐CB https://www.cnblogs.com/chason95/articles/10276158.html
  2. 基于内容的推荐算法:https://zhuanlan.zhihu.com/p/80068528

机器学习及各种算法

https://www.zhihu.com/column/tkRobinPan

线性回归,预测函数,代价函数

其他汇总

  1. 收敛:
  2. 梯度下降:

文章

全面理解搜索Query:当你在搜索引擎中敲下回车后,发生了什么?open in new window

Last Updated 2/12/2024, 2:11:33 PM