幼儿饰品瑜伽美体用品微软
投稿投诉
微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

作为产品经理不懂一点个性化推荐原理怎么行

  在之前的文章《针对大众点评V10改版的一些看法》里面提到要想提高用户对内容的点击率,可以通过算法来实现个性化推荐。具体到实操阶段,虽然主要涉及到算法,但作为一名产品经理还是有必要了解的,为此我最近梳理出个性化推荐相关内容,不足之处,欢迎大家指正和讨论。
  1。为何要做个性化推荐
  个性化推荐,一方面从用户角度,可以基于用户特征过滤掉无效物品信息,推荐符合用户口味的物品信息,从而提升用户体验,进一步也增加用户点击率,从而为转化提供更多的可能性;另一方面从系统的角度,也可以让更多长尾的物品信息被曝光,从而最大效率的利用资源。如下图所示,可以看出好的个性化推荐比简单热门排序算法有更好的的有效信息覆盖度(图中斜线面积)。
  2。推荐算法的前提断物识人
  通常我们说物以类聚、人以群分,推荐算法也是基于用户喜好物品信息的相似性和同类用户兴趣相同的原理来推荐,这里就涉及到人一物和人人物的关系,为了可量化人与物以及人与人的关系,我们需要做的就是给提炼出人和物的特征即给人和物打上标签,通过标签抽象出事物更具有表意性、更为显著的特点,然后通过标签进行匹配。
  2。1给物打上标签
  标签不只是简单的给物品信息分类,而是代表着分发给不同的用户群体,比如运动、健身类视频就可以在标签中加上球迷健身达人等,有关动漫等二次元的内容,也可以加入些类似宅男萝莉等标签。
  这里补充一下标签和分类的区别,分类是树状的,是自上而下依次划分的。在分类体系里,每个节点都有严格的父子关系,在兄弟节点层都具有可以被完全枚举的属性值,如天猫的商品服务分类(下图)。应用分类时必须考虑分类权威性和信息完备性问题,避免因为子节点覆盖不全或分类错误导致的认知问题。
  标签是网状的,更强调表达属性关系而非继承关系,只有权重大小之分,不强调包含与被包含关系。这就使得相对于分类而言,标签的灵活性更强。在权威性方面,标签是弱化的,每个用户都可参与进来,基于自己的偏好贴标签,从而借助规模效应实现对信息表意完备性的覆盖。因此,在设计系统时,可以先基于产品场景快速覆盖主要标签,再结合标签集合的使用频次、专家建议等因素逐步将部分入口收敛到树状的分类体系中来。
  通过PGC和UGC可以获取物品信息标签。例如人人都是产品经理上文章通过审核后,官方会在文章下面会打上相关标签。有的产品除给物品信息打上标签之外,还会以分值代表这一标签的表征程度,如音乐推荐引擎潘多拉(Pandora)的音乐基因工程中,歌曲体系被抽离出450个标签,细化到如主唱性别、电吉他失真程度、背景和声类型等。每一首歌曲都会经由工作人员耗时二三十分钟,有选择性地标注一些标签,并以05的分值代表这一标签的表征程度。
  而在豆瓣,给电影的标签的是普通网友产出(如下图所示)。群体的力量为豆瓣积累了大量具有语义表意性的标签。当然,由于用户的多样性和编辑的开放性,用户标签系统需要经过特定的清洗和归一处理。
  2。2给用户打上标签
  一个用户行为的数据集一般由一个三元组的集合表示,其中记录{u,i,b}表示用户u给物品i打上了标签b(当然实际中会包含用户属性、物品属性等,更为复杂)。给用户提供标签一般有4种方法:
  给用户推荐一个系统中最热门的标签;
  给用户推荐物品i上最热门的标签;
  给用户推荐他自己经常使用的标签;
  将方法2和方法3融合,通过一个系数将上面的推荐结果线性加权,生成最终的推荐结果。
  实际推荐过程中,为了给用户更精确的推荐,除了用户行为数据外,还会收集用户基本信息、位置信息、搜索等信息建立完整的用户画像。
  3。推荐算法原则物以类聚、人以群分
  3。1物以类聚:基于物的相似性推荐
  基于物的相似性推荐是基础的推荐策略。如果你浏览或购买过某种类型的内容物品,则基于类型或标签给你推荐其他内容物品(如下图)。以内容推荐为例,其用于相似度计算的常见因素有:作者层面的相似性(基于订阅或偏好关系),内容层面的相似性(如关键词、话题、类目、标签等)。
  如果想要进一步细化,那么可以借助TFIDF方式给不同的标签设定权重,其基本思想是一个标签在某内容中出现次数越多,同时在所有内容中出现次数越少,越能够代表该内容,那么这个标签的权重应该较高,反之区分度就没有那么高,权重较低。
  以内容物品属性来推荐:
  (1)优点
  只依赖物品本身的特征而不依赖用户的行为,让新的物品、冷僻的物品都能得到展示的机会。
  (2)缺点
  推荐质量的优劣完全依赖于特征构建的完备性,但特征构建本身是一项系统的工程,存在一定成本;
  基于物品或信息属性推荐没有考虑用户对物品的态度,用户的品位和调性很难得到诠释和表达。比如,市面上关于内容分发的书籍很多,仅从标签词上很难分辨出高下。
  因此,为了在推荐中更好地引入受众反馈因素,提出了基于用户行为的协同过滤概念。
  3。2人以群分:基于用户行为的协同过滤
  协同推荐是目前应用最为广泛的推荐机制,其基于用户行为的特点使我们不需要对内容物品进行完整的标签化分析和建模,从而实现了领域无关,可以很好地发现用户的潜在兴趣偏好。考虑到协同过滤的方式依赖历史数据,新的用户和新的物品会存在冷启动的问题,该问题笔者的《个性化推荐中不得不知道的冷启动问题以内容类产品为例》文章中有相关梳理。
  基于用户的协同其基础思路分为两步:
  第一步,找到那些与你在某一方面口味相似的人群;
  第二步,将这一人群喜欢的新东西推荐给你。
  目前主要包括三个子类:基于用户(Userbased)的协同、基于物品(Itembased)的协同、和基于模型(Modelbased)的协同。
  (1)基于用户的CF(UserCF)
  基于用户的CF的基本思想相当简单,通过用户对内容物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。下图给出了一个例子,对于用户A,根据用户的历史偏好,这里只计算得到一个邻居用户C,然后将用户C喜欢的物品D推荐给用户A(如下图):
  发现偏好相同的用户
  通常用Jaccard公式或者余弦相似度计算两个用户之间的相似度。设N(u)为用户u喜欢的物品或信息集合,N(v)为用户v喜欢的物品或信息集合,那么u和v的相似度为:
  假设目前共有4个用户:A、B、C、D;共有5篇物品或信息:a、b、c、d、e。用户与物品信息的关系(用户喜欢物品信息),如下图左边所示,为计算方便,通常首先需要建立物品用户的倒排表(如下图中间所示),然后对于每个物品,喜欢他的用户,两两之间相同物品加1。例如喜欢物品a的用户有A和B,那么在矩阵中他们两两加1(如下图右边所示)。
  计算用户两两之间的相似度,上面的矩阵仅仅代表的是公式的分子部分。以余弦相似度为例(如下图),到此,计算用户相似度就大功告成,可以很直观的找到与目标用户兴趣较相似的用户。
  推荐物品
  首先需要从矩阵中找出与目标用户u最相似的K个用户,用集合S(u,K)表示,将S中用户喜欢的物品或信息全部提取出来,并去除u已经喜欢的物品。对于每个候选物品i,用户u对它感兴趣的程度用如下公式计算:
  如上面的4个用户,假设我们要给A推荐物品,选取K3个相似用户,相似用户则是:B、C、D,那么他们喜欢过并且A没有喜欢过的物品有:c、e,那么分别计算p(A,c)和p(A,e),通过公式可计算出用户A对c和e的喜欢程度可能是一样的,在真实的推荐系统中,只要按得分排序,取前几个物品就可以了。
  (2)基于物品的CF(ItemCF)
  基于物品的CF的原理和基于用户的CF类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。下图给出了一个例子,对于物品A,根据所有用户的历史偏好,喜欢物品A的用户都喜欢物品C,得出物品A和物品C比较相似,而用户C喜欢物品A,那么可以推断出用户C可能也喜欢物品C。
  ItemCF的算法结构基本与UserCF的算法类似(如下图),只不过由对人的相似度改为了物品之间的相似度,这里不做过多说明了。
  N(i)和N(j)表示喜欢物品i的用户数,ItemCF的算法结构基本与UserCF的算法类似,这里不做过多说明了。
  (3)基于模型的协同
  基于模型的协同过滤推荐就是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测推荐。
  建立好评分规则
  比如,对于一篇内容而言,可能会有以下行为:
  算出用户对物品或信息的偏好
  基于模型的协同最常见的方法为矩阵分解(Matrixfactorization),其示意图如下图左边。矩阵分解通过把原始的评分矩阵R分解为两个矩阵相乘,只考虑有评分的值,训练时不考虑missing项的值,如下图右边所示。其背后的核心思想,找到两个矩阵,它们相乘之后得到的那个矩阵的值,与评分矩阵R中有值的位置中的值尽可能接近。这样一来,分解出来的两个矩阵相乘就尽可能还原了评分矩阵R,因为有值的地方,值都相差得尽可能地小,那么missing的值通过这样的方式计算得到,比较符合趋势。具体案例可参考知乎上关于网易云音乐的歌单推荐算法的回答。
  4。个性化推荐系统的架构
  个性化推荐引擎架构主要包括三部分,如下图所示:
  模块A部分负责从数据库或缓存中拿到用户行为数据,通过分析不同行为,生成当前用户的特征向量(即标签),如果使用非行为特征,就不需要行为提取和分析模块了,该模块的输出就是用户特征向量。
  模块B部分负责将用户的特征向量通过特征物品或信息相关矩阵转化为初始推荐物品或信息列表。
  模块C部分负责对初始的推荐列表进行过滤、排名等处理,从而生成该引擎的最终推荐结果。
  此外,有的推荐系统会将用户行为拆分为数据和事件,其中,数据的时间敏感度更低,事件的时间敏感度更高。基于时间维度,会在推荐系统中增加一个近线层,比如,我在大众点评上输入了野郊公园后,如果希望及时更新用户的推荐列表,那么这次观看动作就会被视作事件型进入近线层,以更快地更新用户画像数据,因此短期内我会收到公园甚至是该公园相关推荐,但是过了一段时间后,公园的频度就会少很多。
  5。小结
  一说到个性化推荐,大家都会觉得这是技术来主导的事情,但是通过前面对个性化推荐的了解后,作为产品经理,还是有不同的优化空间和迭代导向。
  5。1完善用户画像
  完善用户画像既可以通过尽可能多的外部渠道数据塑造用户来实现,也可以借助产品设计和运营活动引导用户多沉淀行为来实现。以支付宝为例,一次过年的集五福活动,就让它收集了数以亿计的关系链数据。而紧随其后的蚂蚁森林、蚂蚁庄园等轻社交游戏,间接地丰富了用户的线下支付数据、用户的健康数据等。
  5。2完善规则系统,优化用户使用体验
  一方面,规则是最快的上线生效途径,可以用于纠偏、提权等操作。比如最新的网络语举个例子,在《中国有嘻哈》开播之前,大众是不知道红花会是什么的。这时,产品经理就该进行规则干预了,标注红花会是一个嘻哈团体。
  另一方面,需要认识到短期的干预是应该逐步被长期的机制所替换的。我们应该下力气解决系统的滞后性,让它能够更快速地实现搜索意图理解的进化,比如监控全网产出的新物品或信息,分析其中的共现词汇特点。
  5。3根据推荐的结果优化推荐结果
  评测推荐系统的指标有:
  用户满意度;
  预测准确度;
  覆盖率;
  多样性;
  新颖性;
  惊喜度;
  信任度;
  实时性;
  健壮性和商业目标。
  因此,基于不同的场景,在使用推荐系统后,产品需要去亲自体验并收集各方面反馈,将反馈同步给技术,并基于反馈,尝试不同推荐方式共同作用,做到查遗补缺,找到更有的推荐方案。

苹果用什么药剂能提高果实品质提高苹果品质的主要措施有哪些?苹果用哪些药剂能提高果实品质?用什么药剂能促进苹果的着色?苹果增色用什么药剂好?以下三农网就作简单介绍,供网友们参考。一、提高苹果品质……修士造句用修士造句大全151、林辰粗略估计,来到这里的修士少说也有数十万之多,这是一个无比庞大的人流数量,人流密密匝匝一大片,漫山遍野皆是修士的身影。152、蛇类生灵,千年化蛟,等同人类五修秘……芒果特色小镇云南华坪荣将镇云南省丽江市华坪县,位于川、滇交界的金沙江中段北岸,辖5乡3镇,面积2200平方公里,有26个民族、18万人口,其中少数民族占33;有丽江市最低的海拔、最高的气温和建筑,年均气……孩子也有自尊教孩子别伤面子孩子都比较敏感,他们通过大人对自己的态度来评价自己在大人心中的形象。可以说,孩子在乎自己的形象,也是要面子的。对于成长中的孩子来说,面子是极为重要的,它关系到孩子的自尊和人格发……政策收紧楼市加快重塑预期四季度,房地产调控面临的宏观经济环境仍然复杂,影响预期的因素不仅是调控政策本身,因此应更加注重保持调控政策的连续性和稳定性。刚刚过去的三季度,房地产调控政策面临的宏观经济……减肥真正减肥的六种水果鸭梨热量:43大卡100g秋冬季节,梨子进入盛产期。其中的鸭梨中果胶含量非常高,可以有益消化,通便。这也是它能成为瘦身水果的主要原因。另外,鸭梨还含有丰富的维生素B……如何有效地获取关键词【绍兴seo】如何有效地获取关键词做搜索引擎优化,其中很重要的一点就是如何有效地获得关键词。关键词是搜索引擎判断一个网页是否有资格成为首页前十的标杆。如一个网页内失去了很……好像上瘾了咖啡因究竟对你的大脑做了什么咖啡因对大脑的一些影响如你所想,但很大一部分可能会出乎你的意料。来看看事情的真相和你心中所想吧。据史料记载,公元前3到8世纪善于发现的牧羊人卡迪尔在埃塞俄比亚发现了咖啡。……全国政务大厅服务国家标准发布实施等近日,《政务服务中心进驻事项服务指南编制规范》《政务服务中心服务现场管理规范》《政务服务中心服务投诉处置规范》发布,将于2018年7月1日实施。《编制规范》从方便群众办事入手,……未来的学校在一次偶然的机会里,我穿越到了2088年那时的学校。跨进学校大门就看到了一幢高楼,有二十几层!那是综合楼,看到它,我心里在想:二十几层楼,要是爬楼梯上去,那多累啊!我好奇……企业档案部门竞争情报价值开发【摘要】竞争情报价值的开发可以帮助企业在发展过程中知己知彼,辅助企业管理者进行决策,更好地制定企业发展战略。本文从竞争情报的概念和特征着手,通过对企业档案部门竞争情报开发的必要……安全生产责任不应留真空安全生产责任是安全生产责任制的核心,安全生产责任制是落实两个主体责任的重要抓手,落实安全生产责任制有利于签约各方更好地履行安全生产职责,有利于形成政府领导、部门监管、企业负责、……
怎样快速瘦小肚腩?做什么运动可以瘦肚腩经常会有人问艾玛怎么减肚子?怎么瘦腿?怎么瘦手臂?如果今天有人告诉你,他能够教你减掉肚子、腿部、手臂的脂肪,那么,恭喜你,你一定是被忽悠了。艾玛告诉大家一个残酷的事实:基本没有……跑步减肥好还是跳绳减肥好?跳绳减肥的好处跳绳是中国的一项全民运动,但其实不仅仅是我们国家,在全球跳绳减肥的方法其实非常的流行,但是是跑步的效果好呢,还是跳绳的效果好,今天小编在这就给大家分析一下吧。跑步减肥好还是跳绳……康宝莱奶昔减肥安全吗康宝莱奶昔减肥的正确吃法康宝莱奶昔减肥是很多人都熟知的,也有很多人通过和奶昔也减肥成功了,那是不是证明这种减肥方法就是很安全的了?康宝莱奶昔减肥安全吗减肥奶昔可以让人产生饱腹感,以此来减少对其它……康宝莱代餐奶昔减肥有用吗康宝莱代餐奶昔减肥原理康宝莱代餐减肥应该是很多人都有听说过的,但是它的价格又让人望而止步,那要是喝康宝莱代餐奶昔减肥的话是真的有效果的吗?康宝莱代餐奶昔减肥有用吗康宝莱代餐奶昔是可以用来减肥的……生酮减肥是什么意思生酮减肥对身体有害吗在众多减肥方法中有一种减肥方法叫生酮减肥法,这生酮减肥法是什么意思?生酮减肥法对身体有伤害吗?生酮减肥是什么意思生酮减肥是由于饥饿,进食少量的碳水化合物或者不进食碳水化合……蛋白质减肥法会增肌吗蛋白质减肥法有平台期吗蛋白质减肥既然对减肥有帮助,那么用蛋白质减肥法会增加肌肉含量吗?用蛋白质减肥法会不会有平台期呢?蛋白质减肥法会增肌吗答案是可以,现在市面上常见的蛋白质粉,都是人们利用技术……蛋白质减肥法有什么危害蛋白质减肥法的利弊蛋白质减肥法是现在很多人都喜欢的一种减肥方式,那么用蛋白质减肥对身体有什么危害呢?蛋白质减肥法有什么利弊?蛋白质减肥法有什么危害1。导致肠胃功能紊乱虽然我们的身体需……蛋白质减肥法会反弹吗蛋白质减肥法怎么吃有一些代餐的减肥原理就是用的蛋白质减肥法的原因,那么靠蛋白质减肥法瘦下来的会出现反弹的现象吗?蛋白质减肥法应该怎么吃才好?蛋白质减肥法会反弹吗蛋白质减肥法是会出现反弹的现……蛋白质减肥法一个月能瘦多少蛋白质减肥的原理和方法减肥的方法有很多种,饮食减肥、代餐减肥什么的,那有没有听说过蛋白质减肥法呢?这个蛋白质减肥法的原理和方法是什么?蛋白质减肥法一个月能瘦多少杜坎减肥法也叫做高蛋白质减肥法,……体脂高会得脂肪肝吗体脂高要注意什么身上的体脂含量过高这就意味着身上的脂肪含量也是过高的,那要是这样的话会不会得脂肪肝呢?体脂高的时候要注意什才好?体脂高会得脂肪肝吗脂肪肝是由于各种因素所引起的肝细胞内脂肪……综合计算工时工作制实施中的若干问题探讨摘要:综合计算工时工作制在实施中一系列问题需要澄清,如工时计算问题、工资支付问题、加班费支付问题以及负工时问题等。对于综合计算工时工作制应以周期为单位计算总的工作时间;在工资支……椰子油哪个牌子好五大天然品牌都在这椰子油推荐Vivalabs这款VivaLabsOrganicExtraVirginCoconutOil采用100的天然原料,冷榨萃取,是原生态未经精炼,没有漂白或者脱臭处……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网