幼儿饰品瑜伽美体用品微软
投稿投诉
微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

为何最近突然火了?没有颠覆性创新?关于ChatGPTAIGC

  近期,ChatGPT火爆全球,仅用了两个月就达到1亿活跃用户,成为史上用户增长最快的消费应用。
  不仅如此,ChatGPT在资本市场掀投资狂潮,多只概念股持续走高,还吸引众多科技巨头争相入局。
  同时,也有不少有关ChatGPT的问题,如为何最近突然火了?到底没有颠覆性创新?申万宏源证券洪依真团队在最新的报告中对这些关键问题一一作出解答。
  Q1:为何GPT3在2020年就推出了,而资本市场近期才开始对大模型高关注?
  申万宏源指出,2020年的GPT3仍有较多缺陷,其中无法商用的最大问题是输出结果有毒或不真实,OpenAI2022年1月正式公开了改良版InstructGPT。比GPT3小了100多倍,仅有13亿个参数。
  OpenAI使用了一种通过人类反馈来强化学习(RLHF)的现有技术,根据用户和API的交互结果,对模型的多个输出进行了排名,然后再利用这些数据微调GPT3,大幅减少了有毒结果的输出。因此,我们现在看到的ChatGPT可以优化负面结果,同时连贯对话也更加流畅,达到了可以商用的效果。
  Q2:为何也有人认为GPT等大模型并未对NLP做出颠覆式创新?
  传统NLP最大缺陷,即自然语言理解、缺乏逻辑等问题,在GPT中仍未被解决。
  GPT等模型依赖于大规模离线收集的语料进行训练,但是对于在线提供的即时信息,往往并不能进行充分理解并且纳入自己的回复中。更进一步的,对于对话中提供的因果关系,ChatGPT也往往缺乏很好的理解能力。
  此外,GPT会给出部分问题貌似合理但不正确或荒谬的答案,或者过度使用一些词句和特定表达,同时缺乏类似人类的举一反三的能力等。
  Q3:国内transformer大模型做的怎样?
  申万宏源指出,首先需要承认这一类大模型底层创新在美国开始,2017年Google《AttentionIsAllYouNeed》首次提出了NLP模型Transformer,OpenAI的GPT3等。中国在2021年后加速追赶,尤其是在CV大模型和多模态融合。
  据国内OpenBMB开源社区统计,目前,在全球超千亿参数的大模型中,中国企业或机构贡献了13,美国贡献了12,世界其他国家或组织贡献了剩下的16。
  其次,国内大部分视觉类AI公司都以小模型路线为主,投入大模型研发较多的包括百度、华为等,优势可能会在多模态融合。
  申万宏源在这里列剧了百度文心和华为盘古大模型:百度文心大模型:NLPCV,基本实现跨模态和多下游应用。应用场景涵盖:NLP大模型、CV大模型、跨模态大模型、生物计算大模型、行业大模型。API包括了:1)ERNIE3。0文本理解与创作:预置作文生成、文案创作、情感分析等任务提示,2)ERNIEViLGAI作画大模型,3)PLATO大模型开放域对话服务。
  华为盘古大模型:最大中文语言预训练模型。2021年4月华为发布千亿参数40TB训练数据的全球最大中文语言(NLP)预训练模型,30亿参数的全球最大视觉(CV)预训练模型。将Ptuning、priming等最新技术融入到盘古的微调框架中,提升微调效果;在样本极少的情况下,盘古的少样本学习能力远超GPT系列和BERT系列;要得到相同的F1结果,盘古所需的数据量仅为中文GPT3的19,实现了近10倍的生产效率提升。
  Q4:大规模预训练模型(大模型)与小模型的核心区别?大模型有什么优势?
  最核心区别在于参数量,例如GPT3参数量达到了1,750亿个,是传统深度学习小模型参数量的至少一万倍以上。申万宏源表示,通过模型的扩大,可以带来提升包括:1)GPT2等大模型舍弃了小模型中常见的调参FineTuning过程,转向容量更大、无监督训练。
  2)在自然语言理解NLP中,常见任务包括翻译、问答、文本填空等,常见小模型需要对不同的任务使用不同模型分别训练解决,而GPT3等大规模预训练模型不再规定任务,而是对以上不同任务都有较好效果。
  3)传统的模型训练方式是反向传播算法,先对网络中的参数进行随机初始化,再利用随机梯度下降等优化算法不断优化模型参数,这种方式下对数据需求量较大。GPT3先使用海量数据预训练大模型,得到一套模型参数,然后用这套参数对模型进行初始化,再进行训练。大幅降低后续对数据量的需求。
  Q5:GPT3等大模型和Transformer的关联?
  Transformer是目前NLP领域效果较好的深度学习模型,因此GPTBert等都使用了Transformer。
  Transformer引入了SelfAttention自注意力机制:让机器注意到整个输入中不同部分之间的相关性。Transformer最大的特点是,可以让每个单元都可以捕捉到整句的信息,这也是RNNLSTM等更早期NLP模型无法做到的一点。
  Q6:大规模预训练思路对AI应用落地有什么帮助?
  小模型时代,商用模型开发会综合考虑调参等研发投入量和带来的商业价值,模型开发出来后能否复用以摊薄研发成本,同时对于部分训练样本量较少的场景,没有很好解决方法。
  大模型可以在长尾场景应用落地,降低训练成本、减少数据要求。基于大规模预训练思路,一方面大模型可以应对多个泛化任务,大模型细分场景微调,更适合长尾落地;另一方面,对于小样本训练,大模型也有较好提升。
  Q7:那Transformer对于CV机器视觉可以有类似NLP的提升吗?
  Transformers用在CV上的难点,Transformers自注意力操作中,每个元素需要和每个元素互相进行两两互动,最后算得一个Attention自注意力图,通过加权平均,最后得到输出。由于单元间两两互动,因此复杂度是序列长度的平方,也就是n2,在自然语言处理中,一个句子的长度一般就是几百或上千,例如BERT为512序列长度。
  而对于一个比较常见的224x224大小的图片,如果直接以每一个像素点为单位进行两两互动的话,那序列长度为50176,大概为BERT序列长度的100倍,因此复杂度极高。
  但在2021年后,随着swintransformer、mae等论文推出,transformer在CV和跨模态等应用增加。因此,国内擅长CV的AI公司,在2022年前对于基于transformer的大模型关注投入较少,但是申万宏源认为随着VIT等效果提升,应用类的CV公司也会开始关注并投入大模型。
  Q8:怎样的公司有机会参与大模型底层技术研发?
  申万宏源认为大模型对存储、算力要求极高,普通机构或难以复现。GPT3发布一年后,只有NVIDIA、微软等大企业可以复现。
  据NVIDIA估算,如果要训练GPT3,即使单个机器的显存内存能装得下,用8张V100的显卡,训练时长预计要36年;如果拥有1024张80GBA100,那么完整训练GPT3的时长可以缩减到1个月。
  以微软与OpenAI合作建造的AzureA工智能算力平台为例,该算力平台投资约10亿美元,使用该超算中心训练一次超大模型GPT3大约花费1200万美元。同时需要解决分布式训练问题:上百台服务器之间的通信、拓扑、模型并行、流水并行等问题,模型训练是显存峰值问题。
  本文主要摘取自申万宏源报告《ChatGPTAIGC九问九答》
  本文来自华尔街见闻,欢迎下载APP查看更多

大美新疆,每一眼都是人间仙境如果你没有来过新疆必须提上日程了因为。。。。。。如果没去过新疆你不会知道什么是刚中带柔如果没去过新疆你更不会相信世间所有奇景都汇集于此……一颗恒星直奔太阳系而来,时速51万公里,还带了一颗超级地球南门二和比邻星这颗明亮的恒星叫做南门二。相传郑和下西洋时,曾经用它在茫茫大海上辨别方向。南门二距离地球大约4。37光年,是距离太阳第二近的恒星。看到它右下方的这个小点了吗……大幂幂10个靓丽穿搭欣赏,简单回顾一下杨幂的总裁进化之路这几天杨幂的消息是真多,一会是生日、一会是出道20周年、之前还传可能离开嘉行传媒,不愧是红人呀!20年前也就是2002年,那时候她才16岁吧?早期的图片不好找,基本……防水坚守不做非标产品的行业底线只是一句空话最近,刷爆微信朋友圈的除了铁链女、俄乌战争就是大协会针对近期原材料不断涨价业主和总包却不断压价的现象而发出的《关于工程防水材料质量风险提示函》,该函中有一句话巩固防水材料质量提……2022款宋ProDMi香在哪?今年相当火爆的汽车行业细分市场,那一定是新能源汽车了;如果说今年风光无限的汽车企业,那比亚迪一定会是其中之一;说到今年对车市影响较好的汽车技术之一,那一定是比亚迪DMi超级混动……他,中国地产界最清醒的人不要太聪明。文华商韬略毕亚军如果要问李嘉诚这一代谢幕之后,谁是香港商界的新门面?陈启宗一定是个必须的答案,甚至没有之一。他操持着全球生意,活跃在全球舞台。更特……嗓子就像吞刀片,缓解咽喉不适的五种方法,亲测有效!现在周边没有阳的是寥寥无几,通过大家的小阳心得,阳了发烧不是最可怕的,退烧之后的吞刀片才是酷刑的开始。图片来源网络分享几个简单实用的家用食疗方,润喉化痰,做起来还方……达成限价后,美财长称中国购俄油完全符合西方计划,有一重要原因日前,在俄石油设置价格上限一事曾多次鼓动中印两国加入这一限价联盟无果后,美国财政部长耶伦近日又一改此前的指责态度,声称中国和印度等购买俄罗斯石油的国家能够从限价中获得更多的好处……量化自我是焦虑放大器吗?前言之前读虹线的《互联网与中国后现代性呓语》时,我看到了一种对我们生活中愈发常见现象的解释,非常感兴趣,因此当时说找时间聊聊自己的想法,今天就来填个坑,聊聊对量化自我的一……西安亚一2期全面启用!陕西省内95的京东自营订单都可实现当日今年双11前,京东亚洲一号西安智能产业园(以下简称西安亚一)2期正式启动运营,建成西北地区首个全流程智能柔性生产物流园区。西安亚一2期启用后,陕西省内95的京东自营订单都可实现……史蒂夫纳什7秒跑轰征服全联盟,他的无冠遗憾被写进风中!他是跑轰型控位的鼻祖,他是飘逸的凤凰城之子。他荣誉无数,两届MVP,5次助攻王,7次最佳阵容,8次全明星以及入选名人堂。但这对于他而言都不是最重要的。在太阳队史上曾……每日互动携手费列罗打造数字营销解决方案入选中国数据智能最佳实近日,2022爱分析中国数据智能最佳实践案例评选征集活动落下帷幕。该评选活动由中国领先的数字化市场研究与咨询机构爱分析举办,面向金融、消费品与零售、工业与能源等行业的企业及机构……
奥地利2014年旅行见闻奥地利风景世界著名,有很多小镇值得去探访!哈尔施塔特哈尔施塔特一个号称世界上最美的小镇哈尔施塔特镇(Hallstatt)。它是奥地利上奥地利州萨尔茨卡默古特地……华为Mate50最新渲染图曝光,或于7月发布近日,华为举行了2022华为全屋智能及全场景新品春季发布会,虽然发布了多款手机新品,但都是基于已有机型的小改款版本,而华为年度旗舰Mate50系列新机尚未在此次发布会上现身。不……NASA朱诺号探测器捕捉到木卫三的惊人景象美国宇航局的朱诺任务在2022年1月12日航天器对木星进行第39次近距离飞越时拍摄到了木星南半球的这一景象。可以看到同一画面中还有两个世界,木星引人入胜的卫星木卫一和木卫二。……晒被子后有太阳味,是因为螨虫被烤焦了?科学家太阳的功劳北方人可以在大雪纷飞的寒冬里穿上短袖,南方人却只能够在艳阳高照下的室内室外尽量保证同样的抖动幅度。这个现象在几年以前就开始被大众调侃,并且每到冬天必被拎出来点评一次,由于暖气的……传承经典,兵圣重生,重返帝国新玩法太劲爆最近《重返帝国》这款游戏,在发布会上,爆出了新的消息游戏即将推出新的博物馆玩法。同时,游戏策划也表示,最先和玩家见面的,将是兵家圣典《孙子兵法》。作为中华传统文化的精华,……手机用久了空间不足还卡顿,教你删除这5个文件夹,瞬间清理几个手机使用时间久了,都会出现用卡顿又慢,手机空间不足的情况,尤其是安卓系统的手机,这是什么原因?其实我们每天都在用手机的各种APP浏览着各种网页,每一次浏览的过程都会产生大量的垃……心疼,一男孩因思念母亲,在母亲坟上睡着了头条创作挑战赛12月9日,云南一小男孩因太过思念母亲,躺在妈妈的坟上睡着了。这一幕,让人看的心疼、心酸。让人眼泪直打转。纵使障碍千百般,复始母亲露笑颜。母亲如火放温……高血压居高不下,一个案例告诉你,高血压是可以平稳下降的阴虚阳亢,下虚上实,是高血压病的基本病理变化。摄阴阳方,对头晕目眩,口干思饮,心烦不寐诸症取效较捷。对高血压患者,血压渐趋稳定,而其症未平或时有反复者,依体质而异,选用不同丸剂……传输信息的速度能否超过光速?光速是否是物理学的极限速度?注:来自加拿大皇家军事学院的天文学家提问:我是加州大学伯克利分校的一名大学毕业生,主修数学和经济学。然而我很喜欢在课外的时间阅读许多与科学有关的文章,所以我来到了这……至今未婚的10位大龄女港星,各有各的苦衷,最大者88岁,最小演艺圈的婚恋故事,向来是人们吃瓜的焦点。每次娱乐圈有恋爱,分手,结婚,离婚的消息传出往往都会引起人们的极大关注流量顺势涌来其实男大当婚,女大当嫁,不管普……林海雪原里的小白鸽,晚年经历两次丧子,今年已经93岁了1960年《林海雪原》这部电影上演,得到了观众们的一致好评。其中,师伟扮演的小白鸽白茹这个角色,虽然出场率不高,但是那个完美的脸庞和那双像会说话的眼睛让他出场的时候就能抓住观众……为何有人说扎克伯格是机器人?网友分析2018听证会,发现了什扎克伯格是Facebook的创始人,因为Facebook在全球当中都有着广泛的业务,再加上其影响力也是非常大的,当扎克伯格带领着Facebook向前发展的时候,Facebook……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网