幼儿饰品瑜伽美体用品微软
投稿投诉
微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

使用ML和人在循环中构建Airbnb类别(译文来自Airbn

  Airbnb2022版本引入了类别,这是一种以浏览为重点的产品,允许用户通过浏览围绕一个共同主题的房屋集合来寻找灵感,例如湖畔、乡村、高尔夫、沙漠、国家公园、冲浪等。在我们的第一部分类别博客系列我们介绍了创建类别并在产品中展示它们的高级方法。在第二部分中,我们将更详细地描述ML分类工作。
  在整个帖子中,我们使用Lakefront类别作为运行示例来展示ML支持的类别开发过程。类似的过程适用于其他类别,具有类别特定的细微差别。例如,一些类别更多地依赖兴趣点,而其他类别更多地依赖结构化列表信号、图像数据等。类别定义
  类别开发从产品驱动的类别定义开始:Lakefront类别应包括距湖不到100米的列表。虽然一开始这听起来像是一项简单的任务,但它非常微妙和复杂,因为它涉及利用多个结构化和非结构化列表属性、兴趣点(POI)等。它还涉及训练将它们组合起来的ML模型,因为没有一个这些信号自己捕获了可能候选者的整个空间。列出理解信号
  作为过去各种项目的一部分,Airbnb的多个团队花时间处理不同类型的原始数据,以提取结构化形式的有用信息。我们的目标是利用这些信号进行基于规则的冷启动类别候选生成,然后将它们用作ML模型的特征,以便以更高的精度找到类别候选:房东提供的房源信息,例如房产类型(例如城堡、船屋)、便利设施和属性(游泳池、火坑、森林景观等)。列出位置、标题、描述、图像标题,可以扫描关键字(我们收集了每个类别不同语言的详尽关键字集)。主机指南,其中主机推荐附近的地方供客人参观(例如葡萄园、冲浪海滩、高尔夫球场),其中包含可用于提取POI的位置数据Airbnb体验,例如冲浪、高尔夫、水肺潜水等。事实证明,这些活动的地点有助于确定某些活动相关类别的候选房源。客人评论是可以扫描关键字的另一个来源。我们还收集客人的补充评论,其中客人提供有关房源质量、便利设施和属性的反馈。客人在浏览时创建的愿望清单,例如Golftrip2022、Beachfront、Yosemitetrip,通常与其中一个类别相关,事实证明这对候选人生成很有用。
  图1。airbnb用户创建的热门愿望清单
  使用外部数据进一步丰富了房源理解知识库,例如卫星数据(告诉我们房源是否靠近海洋、河流或湖泊)、气候、地理空间数据、人口数据(告诉我们房源是在农村还是城市)或大都市区)和POI数据,其中包含来自主机指南或我们通过开源数据集收集的名胜古迹的名称和位置,并通过内部人工审查进一步改进、丰富和调整。
  最后,我们利用内部ML模型从原始列表数据中提取更多知识。其中包括ML模型,用于检测列表图像中的设施和对象、对列表图像中的房间类型和室外空间进行分类、计算列表之间的嵌入相似性以及评估物业美学。这些中的每一个都分别在类别开发、候选生成、扩展和质量预测的不同阶段有用。基于规则的候选生成
  一旦定义了一个类别,我们首先利用上一节中描述的预先计算的列表理解信号和ML模型输出来使用一组规则对定义进行编码。然后,我们的候选生成引擎应用它们来生成一组基于规则的候选,并根据类别置信度分数对它们进行优先排序以供人工审核。
  此置信度分数是根据有多少信号使列表符合类别以及与每个规则关联的权重计算的。例如,考虑到Lakefront类别,靠近LakePOIs的权重最大,房东提供的关于直接进入湖泊的信号次之更重要,listing标题、描述、愿望清单、评论中发现的lakefront关键字权重较小,而湖泊和水检测在列表中,图片的权重最小。具有所有这些属性的列表将具有非常高的置信度分数,而仅具有一个属性的列表将具有较低的分数。人工审核流程
  通过从具有最高类别置信度得分的每个类别中选择一定数量的列表,每天将候选人送去人工审查。然后人工代理判断列表是否属于该类别,选择最佳封面照片并评估列表的质量(图3)
  随着人工评论开始涌入,并且有足够多的列表带有确认和拒绝的类别标签,它解锁了新的候选生成技术,这些技术开始贡献自己的候选:基于邻近度:利用到给定类别中已确认房源的距离,例如已确认的Lakefront房源的邻居也可能是Lakefront嵌入相似性:利用列表嵌入来查找与给定类别中已确认列表最相似的列表。训练ML分类模型:一旦代理审查了20基于规则的候选人,我们就开始训练ML模型。
  一开始,只有经过代理审查的列表才会被发送到生产环境并出现在主页上。随着时间的推移,随着我们的候选生成技术产生了更多的候选和反馈循环的重复,它使我们能够使用更多标记数据训练越来越好的ML模型。最后,在某个时候,当ML模型足够好时,我们开始将具有足够高模型分数的列表发送到生产环境(图2)。
  图2。每个类别的生产清单数量和人工审查的分数
  使ML模型与人工审核任务保持一致
  为了扩展审查过程,我们训练了模仿三个人工代理任务中的每一个的ML模型(图3)。在以下部分中,我们将演示每个模型所涉及的训练和评估过程
  图3。用于模拟人工审查的ML模型设置
  机器学习分类模型
  ML分类模型的任务是自信地将列表放在一个类别中。这些模型使用Bighead(Airbnb的ML平台)作为XGBoost二进制分类模型进行训练。他们使用代理类别分配作为标签,并将列表理解部分中描述的信号作为特征。与基于规则的设置相反,ML模型使我们能够通过模型分数阈值更好地控制候选人的精度。
  尽管许多特征是跨类别共享的,并且可以训练单个多类模型,但由于类别大小的高度不平衡和类别特定特征的主导地位,我们发现最好为每个类别模型训练专用的ML。另一个很大的原因是,对单个类别的重大更改,例如定义的更改、大量添加新的POI或标签,不需要我们重新训练、启动和衡量对所有类别的影响,而是方便地在一个孤立的类别。
  湖滨ML模型
  特征:第一步是构建特征,最重要的是到LakePOI的距离。我们从收集表示为单个点的湖泊POI开始,然后添加了追踪湖泊的湖泊边界,这大大提高了能够在边界附近拉出列表的准确性。然而,如图4所示,即便如此,仍有许多边缘情况导致基于规则的列表分配出现错误。
  图4。不完美的POI(左)和复杂地理的示例:湖泊和家之间的高速公路(中)、长长的后院(右)
  其中包括不完美的湖泊边界,可能在水内或陆地之外、湖泊和房屋之间的高速公路、悬崖上的房屋、不完美的列表位置、缺失的POI以及不是真正湖泊的POI,如水库、池塘等。为此因此,事实证明,将POI数据与其他列表信号结合起来作为ML模型特征,然后使用该模型主动改进LakePOI数据库是有益的。
  在这里被证明有用的一种建模方法是特征丢失。由于大多数特征还用于生成由代理评分的基于规则的候选对象,从而产生ML模型使用的标签,因此存在过度拟合和超出规则的有限模式发现的风险。
  为了解决这个问题,在训练期间,我们会从一些列表中随机删除一些特征信号,例如与LakePOI的距离。因此,该模型并没有过度依赖主要的POI特征,这使得列表即使不靠近任何已知的LakePOI也可以获得高ML分数。这使我们能够找到丢失的POI并将它们添加到我们的数据库中。
  标签:正面标签被分配给标记为Lakefront的列表代理,负面标签被分配给作为Lakefront候选人发送以供审查但被拒绝的列表(从建模角度来看是硬底片)。我们还从相关的LakeHouse类别中抽取了负面样本,这些类别允许距离湖泊更远(更简单的负面)和标记在其他类别中的列表(最简单的负面)
  训练测试拆分:70:30随机拆分,我们对距离和嵌入相似性特征进行了特殊处理,以免泄露标签。
  图5。LakefrontML模型特征重要性和性能评估
  我们使用不同的特征子集训练了几个模型。我们对POI数据自身的表现以及其他信号可以提供哪些改进感兴趣。如图5所示,POI距离是迄今为止最重要的特征。但是,当单独使用时,它无法达到ML模型的性能。具体来说,ML模型将平均精度提高了23,从0。74提高到0。91,这证实了我们的假设。
  由于POI功能是最重要的功能,我们通过添加新的POI和改进现有的POI来改进它。这被证明是有益的,因为使用改进的POI特征的ML模型大大优于使用初始POI特征的模型(图5)。
  LakePOI优化的过程包括利用训练有素的ML模型通过检查模型得分高但与现有LakePOI相距甚远的列表来查找缺失或不完善的POI(图6左),以及通过检查模型得分低的列表删除错误的POI分数,但非常接近现有的LakePOI(图6右)
  图6。查找缺失POI(左)和错误POI(右)的过程
  将自信的列表发送到生产环境:使用测试集PrecisionRecall曲线,我们找到了一个达到90Precision的阈值。我们使用这个阈值来决定哪些候选人可以直接投入生产,哪些需要先送去人工审查。封面图片机器学习模型
  为了用ML执行第二个代理任务,我们需要训练不同类型的ML模型。其任务是根据类别上下文选择最合适的列表封面照片。例如,为Lakefront类别选择具有湖景的列表照片。
  我们测试了几个开箱即用的对象检测模型以及几个使用人工评论数据训练的内部解决方案,即(列表id、类别、封面照片id)元组。我们发现,最佳的封面照片选择准确性是通过使用我们的人工审查数据微调VisionTransformer模型(VT)实现的。经过训练后,该模型可以对所有列表照片进行评分,并确定哪一张是给定类别的最佳封面照片。
  为了评估模型,我们使用了一个保留数据集并测试了代理选择的特定类别的列表照片是否在同一类别的前3个最高得分VT模型照片中。所有类别的前3名平均精度为70,我们认为这是令人满意的。
  为了进一步测试模型,我们判断VT选择的照片是否比主持人选择的封面照片更能代表类别(图7)。结果发现,VT模型可以在77的情况下选择更好的照片。应该注意的是,主持人选择的封面照片通常是在不考虑任何类别的情况下选择的,因为它最能代表搜索提要中的列表。
  图7。VisionTransformer与Host选择的Lakefront类别相同列表的封面照片选择
  除了通过ML分类模型为发送到生产的候选人选择最佳封面照片外,VT模型还用于加快人工审查过程。通过按照VT分数的降序排列候选列表照片,我们能够将代理对类别和封面照片做出决定所需的时间缩短18。
  最后,对于一些高度视觉化的类别,例如设计、创意空间,VT模型被证明对直接候选生成很有用。质量机器学习模型
  最后的人工审核任务是通过选择以下四个等级之一来判断列表的质量:最具启发性、高质量、可接受、低质量。正如我们将在博客系列的第三部分中讨论的那样,质量在搜索提要中的列表排名中起着重要作用。
  为了训练可以预测列表质量的ML模型,我们结合使用了参与度、质量和视觉信号来创建功能集和代理质量标签来创建标签。这些功能包括评论评级、心愿单、图像质量、嵌入信号和列表便利设施和属性,例如价格、客人数量等。
  给定具有四个质量等级的多类设置,我们尝试了不同的损失函数(成对损失、一对多、一对一、多标签等)。然后,我们在保留集上比较了不同策略的ROC曲线,二元一对一模型表现最好。
  图8:质量ML模型特征重要性和ROC曲线
  除了在搜索排名中发挥作用外,QualityML分数还在人工审查优先逻辑中发挥作用。有了所有三个ML模型都可以完成所有三个人工审查任务,我们现在可以简化审查流程并将更多候选人直接送往生产,同时还优先考虑一些人进行人工审查。这种优先排序在系统中起着重要作用,因为经过人工审查的列表可能在类别提要中排名更高。
  在确定人工审核列表的优先级时,需要考虑多个因素,包括列表类别置信度得分、列表质量、可预订性和该地区的受欢迎程度。最好的策略被证明是这些因素的组合。在图9中,我们显示了在撰写本文时几个类别的人工审核的最佳候选人。
  图9:列表在4个不同类别中优先审查
  评分后,这些标签将用于在主动反馈循环中进行定期模型重新训练,不断提高类别准确性和覆盖率。未来的工作
  我们未来的工作涉及在几个方向上迭代三个ML模型,包括使用生成视觉模型生成更大的标签集,并可能将它们组合成一个多任务模型。我们还在探索使用大型语言模型(LLM)进行类别审查任务的方法
  作者:MihajloGrbovic,PeiXiong,PratikshaKadam,YingXiao,SherryChen,WeipingPeng,ShukunYang,ChenQian,HaoweiZhang,SebastienDubois,NateNey,JamesFurnary,MarkGiangreco,NateRosenthal,ColeBaker,AaronYin,BillUlammandakh,ShankarShetty,SidReddy,EgorPakhomov
  出处:https:medium。comairbnbengineeringbuildingairbnbcategorieswithmlhumanintheloop35b78a837725

为什么说健脾补肾是中医治疗蛋白尿的基本治法?蛋白尿是肾脏病常见的临床表现,根据蛋白尿的性质可以分为生理性蛋白尿和病理性蛋白尿,前者指在发热或剧烈运动后出现的一过性蛋白尿;而病理性蛋白尿则是肾脏器质性病变造成的蛋白尿,一般……比尔拉塞尔的6号球衣将在整个NBA退役比尔拉塞尔的6号球衣将在整个NBA退役这位标志性的名人堂成员将成为NBA首位退役的球员。比尔拉塞尔将在202223赛季获得NBA球衣肩部的纪念贴片。今天宣布,……黑暗光年神技擒龙手合成攻略!西游传奇美杜莎苍穹灭铭文系统攻略嗨,各位朋友们大家好呀,我是你们最亲爱的朋友毓玉今天给大家分享下一些游戏心得哦小小见解欢迎指正!擒龙手技能是后期的神技,刚开服的小伙伴们就不用想了,一百多天之后才会开放,……90后第一人,29岁狂赚45亿,31岁赚百亿,他的人生就是开一杯奶茶敢卖到30元,居然还有人抢着买?敢这么卖的这个人,正是喜茶老板聂云宸。聂云宸一个29岁就实现财富自由的男人,被90后这一代,称之为吾辈楷模的角色。……京西旧日遗存系列(五)门头沟圈门,记载京西煤业繁盛的过往听好多人提起过圈门,在门头沟当地念作【qun】,颇有京西地方的味道。据说这里是门头沟这个地名的发源地:圈门前头有条沟。带着对发源地这三个字的向往,我们特意去了趟圈门……毛主席从不踏入故宫半步,却三次参观宫墙,背后的原因令人暖心北京故宫是中国明清两代的皇家宫殿,旧称紫禁城,现如今是中国的代表性建筑,同时也是世界文化遗产。毛主席是中国共产党和中华人民共和国的主要缔造者和领导人,也是现代世界历史中最……47岁陈紫函成不老女神,结婚6年想要成为妈妈娱乐聚焦芙蓉不及美人妆,水殿风来珠翠香。说到陈紫函,绝对是演技与容貌并存的女演员。率性纯真的小青、权势滔天的吕雉、碧海青天的胭脂。。。。。。每个角色都令人印象深刻。……您只是老了,不是病了!50岁后,身体若有这几个变化,很正常子曰:吾十有五而志于学,三十而立,四十而不惑,五十而知天命,六十而耳顺,七十而从心所欲,不逾矩。50岁对于大多数人来说是一道坎,是人生从中年阶段步入老年阶段的重要环节,一……大尺寸显示器推荐带鱼屏这样选新平台新显卡虽然离我们不远了,但一推出就全面升级真的有点贵。现在想要升级来增强电脑的使用体验,不如先考虑一下自己桌面上多年没动的显示器吧,比较保值且现在价格真的很香。如今27英……詹姆斯9710万顶薪续约!新赛季揭幕战赛程出炉!绿军未接近得NBA进入了休赛期,但是关于交易与签约的消息依旧层出不穷。包括湖人队、篮网队等豪门,仍然有不少新闻流出。笔者特将相关信息整理如下,烦请读者阅览。湖人队詹姆斯与篮网队杜兰特……荣耀平板8上新8GB128GB版本,售价仅1999元随着近些年平板市场的逐渐活跃,众多手机厂商都加大了在这一领域的投入。继荣耀方面此前发布了新款平板电脑产品荣耀平板8后,其也受到了不少消费者的青睐。近日关于该平板的曙光蓝配色8G……茅台五粮液背后的神秘男人,身家260亿,他做的广告一代人都看本文来源:时代周报作者:黄嘉祥白酒江湖潮起潮落,独领风骚者屈指可数,被誉为白酒教父的金东集团董事长吴向东便是其一。从靠五粮液贴牌创造金六福神话,到并购珍酒等10余家……
12种热藏于体内,反应的舌象症状各不相同,自查便知1、风热犯肺舌象舌质胖,舌尖红,舌中凹陷症状:口干、咽干、咳嗽、痰粘稠、喉燥咽痛、胃胀、腰膝酸软,下肢冷治宜疏风清热,宣肺止咳2、痰热郁肺舌象舌尖……喜忧参半!颜丙涛66霍金斯出局北京时间2022年2月9日凌晨,2022卡祖斯诺克球员锦标赛在伍尔弗汉普顿的奥尔德斯利休闲村刚刚结束了两场备受广大中国球迷关注的比赛。我国的后起之秀颜丙涛表现出色,继续火热手感……K50发布会还有一款千元机?来聊聊这款千元机的参数及价格预计今年二月份K50将要发布,这次发布K50系列宇宙时可能还会有一款新千元机。这是一款红米最近新入网的千元手机,让我们来看一下他的参数。从图中可以看到这是一款搭载6。67……拒逆转!哈登26910,恩比德大两双,马克西尴尬,重回首发难北京时间2023年2月2日,今日NBA比赛,32胜17负的76人在主场迎战20胜31负的魔术,76人首发:哈登梅尔顿托哈塔克恩比德,魔术首发:弗里茨加里哈里斯弗朗茨瓦格纳班凯罗……骁龙8Gen2新机哪款值得入手?选小米13还是一加11?2023年元旦一过就有新机推出,它就是一加11,这款手机预热期间就已经是得到了很多网友的关注了,发布之后网上关于这款手机也都有着比较正向的评价,那这款骁龙8Gen2新机对比其他……抢先局开门红河南日报客户端记者卢松大河财立方记者徐兵吴海舒郝楠楠朱哲2月1日至2日,为期两天的中原食品实验室科学家大会暨漯河市创新发展大会举行。会议现场,中原食品实验室科研团队与双汇……山西不知名的代县,让我惊艳了正月初八老公倒休,我们一家三口来到了山西代县。代县面积不大,人口也就二十来万,位于山西的东北部。不知名的代县,却藏着许多惊艳让人惊艳的文庙。我们开车下午到的代县。天空很蓝……幼儿园放学场面引发热议,男女比例明显失衡,替男生的未来担忧生育率下降已经是一种必然的趋势,这跟经济环境、教育成本等多方面因素相关。但是,需要引起关注的不仅仅是出生人数的问题。重男轻女的思维在以往的时代可能比较明显。虽然现在经过了……微信小号正式上线!教你快速开通内测一年多的微信小号功能,终于在最近正式上线了。这个新功能可以让你在没有新手机号的情况下注册一个新微信号。但注册小号有个前提条件:你的微信在最近一年内没有过封号记录……如何利用代币和NFT运营Web3社区撰文:DocTom编译:尘埃科技Web3社区的核心理念和承诺是创造一个自我维持和自我加强的飞轮,成员通过参与来获得社会地位、访问效用和或股份,这反过来为成员创造了激……9天87。5万辆车次!张家界高速喜迎2023旅游之春红网时刻张家界1月30日讯(通讯员刘芸杰)天门山上的景色真是太好看了!1月26日,游客董先生与朋友驾车从张家界收费站驶上高速,心满意足的结束了这次筹备已久的张家界之旅。作……科洛图雷时间是成功的重中之重,但对于教练而言就像奢侈品直播吧2月3日讯北京时间1月27日,仅执教英冠维冈竞技59天的科洛图雷因球队战绩不佳下课。今日,科洛图雷发文对这段经历进行回忆并对球队送上祝福。科洛图雷表示:我很失……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网