幼儿饰品瑜伽美体用品微软
投稿投诉
微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

原来AI也需要有人哄,一句话让GPT3准确率暴涨61

  一觉醒来,机器学习社区炸了锅。因为最新研究发现,只要对GPT3说一句让我们一步一步地思考,就能让它正确回答出以前不会的问题。
  比如下面这个例子:
  16个球中有一半是高尔夫球,这些高尔夫球中有一半是蓝色的,一共有几个蓝色的高尔夫球?(问题不难,但要注意这是零样本学习,也就是说AI训练阶段从没见过同类问题。)
  如果要求GPT3直接写出答案是几,它会给出错误答案:8。
  但加上让我们一步一步地思考这句咒语后,GPT3就会先输出思考的步骤,最后给出正确答案:4!
  而且这并不是巧合,研究团队在论文中做了充分的验证。上面的问题出自经典的MutiArith数据集,专门考验语言模型做数学题的能力,GPT3本来在零样本场景下准确率仅有17。
  这篇论文中总结了9个最有效的提示词,其中换着花样让GPT3逐步思考的前6个都让准确率暴涨到70以上。
  甚至一句最简单的Let’sthink(让我们想一想)都能涨到57。5。这感觉,就像是幼儿园阿姨在哄小朋友
  这个技巧似乎也不需要对GPT3做魔改,已经有人在OpenAI官方Demo上成功复现,甚至换成中文也行。英文题干中文提示,GPT3给出正确中文答案。
  最早把这篇论文转发到社交网络的谷歌研究员表示,新的allyouneed增加了。
  看到这里,各路大佬纷纷脑洞大开,玩起了梗。如果鼓励AI你能行的,我相信你会怎样?
  威胁AI一下说时间不多了或者你头上有把枪又会如何?
  对AI说开车稳一点会成为自动驾驶解决方案吗?
  还有人提出,这简直和科幻故事《银河系漫游指南》的剧情一样,实现通用人工智能的关键是知道如何正确地向AI提问。
  那么,这种神奇现象究竟怎么回事?语言大模型是零样本推理者
  发现这个现象的是谷歌大脑与东京大学的合作研究,探索了语言大模型在零样本场景下的表现。
  论文标题《语言大模型是零样本推理者》还致敬了GPT3的《语言模型是少样本学习者》。
  所用方法属于ChainofThoughtPrompting(思维链路提示,以下简称CoT),今年一月刚由谷歌大脑团队提出。
  最早的CoT应用于少样本学习,在提问的同时给一个分步骤回答的示例来引导AI。
  这次的最新研究提出零样本CoT,主要改动是简化了示例的部分。
  第一步,把题干改写成Q:xxx,A:xxx的形式,其中触发句A可以提取出语言模型的思考过程。
  第二步属于额外实验,增加了答案是的提示促使语言模型给出最终答案。
  这样做最大的好处是通用,不再需要对不同问题类型提供专用的示例。
  论文中对各类问题做了充分实验,包括12项测试:
  6个数学问题测试集,SingleEq、AddSub、SVAMP和更有挑战的MultiArith,AQUARAT,GSM8K。
  2个常识推理测试集,CommonsenseQA和StrategyQA。
  2个符号推理测试集,LastLetterConcatenation和CoinFlip。
  以及BIGbench中的日期理解问题、跟踪乱序物体任务。
  与普通的零样本学习相比,零样本CoT在其中10项中取得更好效果。
  右侧值为额外实验结果
  在比较有难度的MultiArith和GSM8K数学测试中,用GPT3最新版本Textdavinci002(175B)做了更深入实验。
  如果给8次尝试机会取最好结果,还能进一步提升准确率至93。
  在错误结果分析中研究人员还发现,很多问题中其实AI的推理过程是正确的,只是答案无法收敛至唯一确定时会给出多个备选。
  论文的最后,研究团队提出这项研究不仅可以作为零样本CoT的基线,更希望让学界认识到在构建微调数据集和少样本提示模版之前,充分发掘语言大模型零样本能力的重要性。
  研究团队来自东京大学松尾研究室。
  负责人松尾丰教授,同时是软银董事会中的第一位人工智能专家。
  团队成员中的客座教授顾世翔来自谷歌大脑团队,顾世翔本科师从三巨头之一Hinton,博士毕业于剑桥大学。
  加点魔法已经成为AI圈新潮了
  零样本CoT究竟为何起作用还有待探索。
  不过有人实验得出,这种办法似乎只对GPT3(textdavinci002)比较有效,他尝试了001版本,发现收效甚微。
  他列出了一个自己做的例子。提问:请将machine,learning中每个单词的最后一个字母连起来。
  GPT3在提示下给出的答案是连起来了两个单词中的所有字母。
  对此,作者之一顾世翔回复表示,其实咒语对初始版、改良版的GPT3都有效果,这些结果在论文中也有体现。
  也有人发出质疑,表示难道深度学习变成了一场找神奇咒语的游戏?
  同时,我们在吐槽队伍里又看到了马库斯的身影。
  他也列出了一个失败的例子,GPT3在咒语加持下也没弄明白,莎莉的牛到底会不会起死回生
  不过值得注意的是,类似这种稍微给AI加点小魔法,提升效果立竿见影的例子已经不稀奇了。
  有网友分享,自己用GPT3时加几个中间命令,确实能得到更满意的结果。
  此前谷歌和MIT的研究人员发现,无需更改底层架构,只要训练语言模型会像程序员debug时那样打断点,模型读代码、做算术的能力唰唰唰地就上去了。
  原理也非常简单,就是在计算步骤较多的程序里,让模型把每一步都编码成文本,并将它们记录到一个称为便签的暂存器中。由此一来,模型的计算过程变得更加清晰有序,性能自然大幅提升。
  还有本项实验中用来测试的InstructGPT3,也是一个典型的例子。只需让GPT3从人类反馈中强化学习,它就能明显改善答非所问的情况。
  具体来看就是先用一些人类的示范回答微调模型,然后收集某个问题的几组不同输出数据,人工对几组答案进行排序,并在此数据集上训练奖励模型。
  最后,使用RM作为奖励函数,近端策略优化(PPO)算法微调GPT3策略,以强化学习方法最大化奖励。
  包括引爆这次话题的推特博主Aran,正是当初发现加一句虚幻引擎就能让AI生成图像画质飞升的那位。
  前谷歌机器人大佬EricJang此前也发现,强化学习也能运用类似的思维来提升计算效率。
  也有人表示,这种用在AI上的技巧,不正是自己平常动脑时会用的吗?
  实际上,此前Bengio就从脑科学入手,提出AI的运转模式应该像人类动脑模式一样。
  人类的认知任务可以分为系统1认知和系统2认知。
  系统1认知任务,是指那些无意识完成的任务。比如你可以马上辨别出手里拿的是什么东西,但是却无法和别人解释,自己是怎么完成这个过程的。
  系统2认知任务,是指人类大脑需要按照一定步骤完成的认知。比如做一道加减法运算,你可以很清楚地解释最终答案是如何得出的。
  而这次加的咒语,正是让AI更进一步,学会按步骤来思考。
  面对这样的趋势,有学者认为提示工程正在取代特征工程。
  那么提示词猎人会成为下一代NLP研究者的外号么?
  论文地址:
  https:arxiv。orgabs2205。11916

他不配做人她,到了婚嫁的年龄,于是就有很多人给她介绍对象。见了很多,也相处了几个,但都没结果。在这些中有好的也有差的,也许是命运如此吧,她没选择人人都说很好的他,而是选择了人品、相貌都不……一夜之隔还有很多值得我重视的人朋友,家人,以前不懂事,现在不能任性了,大四了,该好好的替别人想了尊重我想尊重的人,鄙视我讨厌的人,其实是不成熟的表现,我要长大我是个坚强的G……超郁闷不知道是哪个要事体的人想出来,从今年开始托班不能直升幼儿园,弄得我们又要重新报名。记得去年给囡林幼儿园报名的时候,真的是全家总动员,大家轮流上阵通宵排队报名,跟单位的同事说说,……要作好顽强奋战哒准备了先来说说礼拜五下午哒事去了总队哒所谓培训实际上也就算是个动员会而已让我更加清醒哒意识到从20号开始到整个9月哒这段时间我一定一定又会无数次陷入大大大暴走……心痛心好痛,已经好久好久没有这样伤心过了。今天无意之间看到了他的照片,他有女朋友了。看到照片,想到曾经他也是这样抱着我,替我拿包的,很心痛,真的很心痛。好熟悉的场景,只……今天是我24岁生日,想家了今天是我24岁的生日,也长大了一岁,想法也多了,一个人离家在外过生日,心里总有些不塌实,想家的念头时时在我脑海里徘徊,有的时候一个人睡在床上想,在外奔波了这么几年,什么时候才是……女人到了中年,唯有自渡点击上方蓝字关注,晴风每天和你一起剖析情感知识。文:晴风图:网络(若有侵权,请联系删除)对于女人来说,很多人觉得丈夫是自己的依靠,孩子会是自己未来的依靠,但其……四月红艳怒放的碧桃花,娇媚的花卉艳丽多姿,花开烂漫的风景旅行途中用相机刻录时光、行摄乡土、看古村镇,平凡的生活风景无需华丽只需熟悉。黄杨军与你共享生活中平凡又熟悉的景色。碧桃花,是非常美丽的一种桃花。有重瓣花、单瓣花之分,是一……多年后,才懂人情世故,知冷暖挨过打挨过骂,才懂善恶,知好歹那些年穷,那天和父亲去找三姨借钱,三姨脸色阴沉,炖了牛肉不端上来,却在临走时拿出一串腊老鼠肉给父亲:这东西我们吃不惯,你们拿回去吃,人穷就别装大尾巴鹰。父亲接过腊老鼠肉,弯着腰……孩子的悲剧源自父母的粗心做父母的如果粗心大意会有什么严重的后果?来看看一月份发生在美国的两则新闻。在明尼苏达州曼凯多市(Mankato)发生离奇交通意外,一天,一位名叫莫克的居民正在路上开车,突……让读书照亮我们的前行之路腹有诗书气自华,我们应该多读书、读好书、好读书,因为读书是自我提升的最佳的方式。书中有很多值得我们学习的地方,书籍如同一位智者,它会传递出很多人生哲理,体味人生的真谛,从而使我……为了水果自由,古代吃货们也是拼了烈日炎炎,自然少不了各种水果来消夏,冰镇、凉拌、榨汁,各种花式吃法可以让心情美上一天。近日,不少网友被两百多一串的日本葡萄震惊了,纷纷哭诉没有水果自由。不过,你有没有想过……
美酒虽好,但是也需要酒杯的陪衬美酒虽好,但是也需要一种陪衬,葡萄酒好比我们人类一样,不仅有容颜的美,同时还有衣服的陪衬,才能展现出我们的美丽与高贵。葡萄酒也一样,葡萄酒不仅有鲜艳亮丽的色彩,他更加需要一款与……蜗居在秋的恬静里,听生命悲歌怀着凉爽的心情,我们走进秋的世界,没有花市盛开,没有翠绿等待,有的只是黄叶飘飞,有的只是露水草尖。在四季里,秋虽不是最后的季节,但在人们心目中却是生命的尾声,说到秋,便浮……申报海南重庆建筑资质一站式服务(详询)那天的风景挺美(办理资质沿途的风景)重庆申报重庆建筑、市政施工总承包资质申报重庆电力、机电施工总承包资质申报重庆地基、电子智能化专包资质申报重庆钢结构、……浴火重生被社交恐惧症强迫症纠缠近十年,感恩遇见这个方法注:本文为心理咨询案例患者自述:您好老师,我是一位三岁孩子的妈妈,非常苦恼自己的症状,已经有近十年了。尤其最近的明显症状是不能集中注意力,老想发呆,和儿子相处就犯困,总是……散文,煮一壶山楂糖水,是酸甜人生的滋味深秋,正是山楂上市的季节,红彤彤圆滚滚的堆叠在一起,似火,滚烫着这个秋季。一兜山楂,一兜冰糖,买回家去,用它们煮一壶水,酸甜着自己的味蕾,思着,想着,人生的滋味。将……厚积薄发,砥砺前行2021年3月29日,心和塾在广州总部召开第一季度总结暨第二季度启动大会,全体同事正装出席。昆明论坛刚刚圆满落幕。带着内心的欣喜与激动、责任与使命,全体心和人不忘初……女人的浪漫是一首抒情诗,是一首浪漫的歌,是一首婉约的词都说女人是风景,无论哪个年龄段都是风情万种的风姿绰约,女人是家庭的主角,上得厅堂下得厨房,柴米油盐的总管,女人是单位不可缺的主题,没有女人的地方是单调没有色彩的,女人的心是暖色……做人,谁也不要笑话谁世上没有十全十美的人,也没有十全十美的生活,满招损,谦受益,所以古代有求缺阁,知足者常乐,别闲着,多吃苦,父母老有所依,培养好孩子,吃饱穿暖,兄弟姐妹和睦相处,就是神仙过的日子……一句佛号的替代,才会走得更远静下心来,品读人生究竟有何妙趣在里面,或许你会说,生不逢时,人生之所以是这个样子的造化全部都应该是自己的心念使然,为何越宽大的胸襟越是能够改变一个人的一生,就是因为……偶尔也想替风喝醉,自由无畏其实,人都是很贱的,爱你宠你的人你不稀罕,对你冷若冰霜的却是穷追不舍。最后搞的遍体鳞伤的还是自己。我过得还可以,不好不坏,不惊不喜,一切只是还可以。这样的生活我觉得也挺好……从梁实秋的喝茶里谈谈建瓯的茶文化读读书,看看梁实秋的散文喝茶闲闲絮叨叨20201012福建人民喝茶是骨子里的事情,记忆里除了生病吃药的时候,怕茶会散掉药性,必须喝白开水之外。其他只要在福建,见任何……社交禁语不该说的话,决不能说社交禁语:不该说的话,决不能说人们在生活中经常会不自觉地犯一些错误,有些错误没关系,那是你自己的事;有些错误却会对别人造成影响甚至是伤害,这就是禁忌。既然是禁忌,当……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网