基于内容和用户画像的推荐个性化推荐,有两个实体:内容和用户。何实画像需要有一个联系这两者的现基性化东西,即为标签。于内用户内容转换为标签即为内容特征化,容和用户则称为用户特征化。推荐
[[165092]]
因此,何实画像对于此种推荐,现基性化主要分为以下几个关键部分:
综合上面讲述的于内用户各个部分即可实现一个基于内容和用户画像的个性化推荐系统。如下图所示:
标签库
标签是容和联系用户与物品、内容以及物品、推荐内容之间的纽带,也是反应用户兴趣的重要数据源。标签库的最终用途在于对用户进行行为、属性标记。是将其他实体转换为计算机可以理解的语言关键的一步。
标签库则是对标签进行聚合的系统,包括对标签的管理、更新等。
一般来说,标签是以层级的形式组织的。可以有一级维度、二级维度等。
标签的来源主要有:
对于内容的关键词提取,使用结巴分词 + TFIDF即可。此外,也可以使用TextRank来提取内容关键词。
内容特征化
内容特征化即给内容打标签。目前有两种方式:
针对机器自动打标签,需要采取机器学习的相关算法来实现,即针对一系列给定的标签,给内容选取其中匹配度***的几个标签。这不同于通常的分类和聚类算法。可以采取使用分词 + Word2Vec来实现,过程如下:
用户特征化
用户特征化即为用户打标签。通过用户的行为日志和一定的模型算法得到用户的每个标签的权重。
隐语义推荐
有了内容特征和用户特征,可以使用隐语义模型进行推荐。这里可以使用其简化形式,以达到实时计算的目的。
用户对于某一个内容的兴趣度(可以认为是CTR):
其中i=1…N是内容具有的标签,m(ci)指的内容c和标签i的关联度(目前都为1),n(ui)指的是用户u的标签i的权重值,q©指的是内容c的质量,暂时使用点击率表示。
责任编辑:Ophira 来源: 后端技术杂谈 用户画像个性化推荐标签(责任编辑:焦点)
中国海油牵头签订国内最大规模液化天然气船舶建造项目 建造金额约160亿元
微软 Windows 11 Dev 预览版 Build 23424 及 Canary 预览版 Build 25330 推送
一文搞懂Undo Log版本链与ReadView机制如何让事务读取到该读的数据
微信安卓版 8.0.16 更新:可进行个性化广告管理、个人信息浏览与导出等