幼儿饰品瑜伽美体用品微软
投稿投诉
微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

GPT大力出奇迹的LLM模型

  周末一大早,睡眼惺忪的时候,就被学妹拉到了她的中科院校友会兴趣群里。博士、科学家们创建了个GPT兴趣群,学妹知道我现在正在夜以继日的试图跟上AI的进化,顺手拉了我一把。
  短短几分钟之内,这个群就满员了。
  学妹说,这个群的建立速度,充分反映了人类的好奇心和恐惧。
  我说我感兴趣的的是这个群很可能会孵化出很多项目甚至初创公司。
  要知道,GPT4之父OpenAI公司,恰好也是一家科学家组成的公司。
  1、OpenAI的前生今世
  很长一段时间,AI技术牢牢把持在谷歌、DeepMind(被谷歌收购)等巨头手里,尤其是DeepMind的阿尔法狗家喻户晓。
  2015年12月,特斯拉汽车创始人埃隆马斯克,格雷格布罗克曼(OpenAI联合创始人兼总裁)、山姆阿尔特曼(OpenAI首席执行官)、彼得泰尔(Paypal创始人)以及伊利亚苏特斯科夫(师从神经网络之父杰弗里辛顿,OpenAI首席科学家)等数位硅谷大佬拿出了10亿美元,在旧金山创立了OpenAI。
  不久前,马斯克发推抱怨:我仍然很困惑,为什么一个我捐赠了1亿美元的非营利性机构,竟然变成了一个市值300亿美元的营利性机构?
  我们先不谈OpenAI的变质,如果不是微软不计成本的给它输血(资金、Azure云资源),我们恐怕看不到AI快速发展的今天。
  2、什么是GPT
  2017年,Google团队首次提出基于自注意力机制的Transformer模型,并将其应用于自然语言处理。
  OpenAI应用了这项技术,2018年发布了最早的一代大型模型GPT1(GPT是GenerativePretrainedTransformer的简称,中文翻译为生成型预训练变换模型)。
  该模型用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。
  GPT1诞生于2018年,主要实现功能包括:自然语言推理,判断两个句子的关系(包含、矛盾、中立);问答与常识推理,输入文章及若干答案,输出答案的准确率;语义相似度识别,判断两个句子语义是否相关;分类,判断输入文本是指定的哪个类别。
  GPT1使用了几十亿文本档案的语言资料库进行训练,模型的参数量为1。17亿个。
  2019年,GPT2发布,模型参数量提高到15亿个。GPT2和GPT1在技术路线上没有本质的不同,只是增加了数据量。
  2020年,GPT3发布,参数量达到了创纪录的1750亿个,其训练参数是GPT2的10倍以上,技术路线上则去掉了初代GPT的微调步骤,直接输入自然语言当作指示,给GPT训练读过文字和句子后可接续问题的能力,同时包含了更为广泛的主题。
  OpenAI在GPT3的预训练过程中喂入了超过570GB的文本资料。当GPT3获得足够丰富的知识库时,其生成的结果也变得越来越精确。
  2022年发布的ChatGPT,是在GPT3基础上的GPT3。5版本。
  如果说ChatGPT带来一抹惊艳的话,GPT4就是对传统AI摧枯拉朽的打击。
  从参数量来说,GPT4高达100万亿个(据报道未证实,也有人推算没有那么大)。
  GPT4的一个关键升级就是多模态,也就是支持图像和文本输入,拥有强大的识图能力。甚至能看懂梗图,并能找到梗所在的点。
  GPT的发展过程中,1、2都没有带来太多的影响力,被认为是各种AI路线中的一支。但随着GPT3尤其是GPT4的出现,人们惊讶的发现,原来这就是AI的未来。
  即便是大量资源押注AI的谷歌,也没有料到GPT的成功。中国的AI企业也在相关领域进行研发。
  乐观估计,中国相关企业在技术上落后的时间大概是23年,并没有非常大的代差。
  3、关于LLM模型
  人类和机器的交互,是从汇编语言开始的。这是经过训练的人类和机器都能读懂的语言,但由于门槛过高,开始衍生出各种编程语言。
  从上古的C语言到现在流行的Python,编程语言越来越简单,但距离机器直接理解人类的语言,依然有一定的距离。
  我们必须需要工程师来做这个翻译。
  NLP(NaturalLanguageProcessing自然语言处理)研究的目标,就是让机器能够直接理解并能输出人类语言。
  其中,GPT依赖的LLM(LargeLanguageModel,大型语言模型)成为目前最佳的选择方案。
  PS,我不认为LLM是唯一的最终路线,只是现阶段最合适的路线。
  OpenAI的成功有一定的偶然性,如果不是微软在搜索领域本来就比较落后,所以敢于搏命,ChatGPT这种模式,对搜自身的索引擎业务是致命打击(谁还去付广告费?)。
  从GPT1到GPT4的迭代,并非是由于关键技术革命性的突破(也不是认为这个过程中技术的发展不重要),而是数据量的增加。
  4、瓶颈
  对于中国企业来说,方向既定的情况下,并不缺人才(全球顶级AI科学家30以上是中国人或华裔),缺的是资金和算力。
  资金并不是一件太难的事,有了OpenAI金玉在前,国内资本大佬也会舍得投入,但算力是个大问题。
  美国限制了A100等高端显卡对中国的出口,虽然黄皮衣第一时间推出了阉割版给中国特供,但性能差异非常明显。
  国产显卡还刚刚起步,景嘉微还没有向算力卡方向大规模发展,摩尔进程大概能接近英伟达5、6年前的水准,壁仞科技也拿出了不错的产品,但大概率在代工方面受制于人。
  考虑到OpenAI几乎喂进去全人类的知识量,也不过烧掉十几万张显卡,算力的问题,其实同样可以大力出奇迹,用相对低端的产品堆起来,这可能需要各大AI企业携手了。
  有人认为中国的语境对AI的发展有严重束缚,殊不知在吃西瓜摘棉花都是敏感词的美国,语境限制并不差到哪儿去,从技术上来讲,这都是小事。
  还有人认为显卡的缺失和中国长期禁游戏有关,虽然我个人也反对无差别的禁游戏,但问题是也没人用10万块(黑市20万)的A100来打游戏啊!
  5、应用
  现在的GPT4已经开放了文字输入输出功能,展示(暂未开放)了图像的识别和输出功能,可以想象的未来,语音、视频等真正多模态的输入输出,将成为各大AI企业创新研发的重点。
  比如有人认为中文在互联网上占比太低,导致GPT4里的中文内容缺乏。这个问题其实很好解决(事实上GPT4也是这么办的),把中文翻译成英文后再输入LLM,输出再翻译回来。
  那么在语音结合方面,科大讯飞就比较有优势,可以把语音转化成文字最终翻译成英文喂给AI;类似的,在视频结合方面,海康、商汤、旷视等企业就有很大的优势,把视频信息解读为文本信息再喂给AI。
  回过头来再看当初的制裁,是不是豁然开朗了?

苏炳添或赴欧洲踢馆雅各布斯亚洲飞人训练上极限大量有新战略随着夏季的到来,田径室外赛季即将于5月初正式拉开帷幕。去年夏天在东京跑出9秒83的苏炳添,也正在深圳接受极限大运动量的训练,从有点苦、有点烦,到后来的有点那个意思了,苏炳添应该……图简笔画动物创意制作花样多开发大脑提高智力简笔画是一种基础类型的绘画,这种基础型的简笔画在小朋友上幼儿园的时期适合学习。简笔画的学习过程中可以使小朋友变得动手能力更强,学会对生活中的事物进行观察。简笔画的学习逐渐……图王小波情书选摘爱一个人如爱生命一般在王小波的很多书籍中,我们看到的都是一个睿智多思又痞坏的文人形象。而在他为妻子写的情诗里面,我们却看到了他浪漫多情的一面。这样的王小波令人动容。对于王小波的印象,很多读者……图零基础新手不要慌木吉他指弹教程自学简单歌曲人们总会要有一两个才艺技能才傍身,不会在朋友见面时尴尬,在喜欢的人面前无聊。如果你喜欢吉他,却没有时间学习,快来看一下指弹的教程,自学也可以简单高效。不需要太过在意明星们……让人看不透的星座女了解她需要很长时间女生的心理活动总是随时都很丰富多彩。男生想要彻底看透一个人,一个女生,需要很长时间的磨练。为了让每个男人都容易明白女朋友整天在想什么,接下来就把这三个星座女人的内心想法透露给大……恭喜!这对金童玉女要结婚了体坛上金童玉女的组合不少,但你知道女排冠军张常宁和篮球健将吴冠希的爱情故事吗?本周六晚10点,由湖南卫视王恬工作室倾力打造的《中国婚礼我的女儿出嫁了》即将温暖上新。节目中……辣目洋子为什么取了个日本名字,她是日本人吗?你喜欢她吗?说到辣目洋子,相信很多人都认识她,凭借自己的演技,在娱乐圈当中也占有一席的地位。她凭借着自己的特点,在娱乐圈当中创下了属于自己的一片天地,辣目身材虽然是微微的发胖,却走着时尚的……图清明节古诗原句及赏析暮春时节难以忘却的忧愁清明节是我国的传统节日,一般在暮春时节。这时候,春天即将过去,小雨纷纷,而节日的气氛也让人忧愁不已,因此在诗人们的笔下总是充满了这样的情绪。每年到了清冷的四月,清明节都是……全球都在猜美国何时衰退,木头姐衰退已至,标普500重回熊市看热闹不嫌事大,现在全球投资者都在猜测美国经济何时正式步入衰退,其中美国著名投资者木头姐CathieWood认为,美国已经彻底步入衰退,承认之前自己严重低估了美国通胀的严重性和……巨蟹座的特点巨蟹座的人是什么样的?一般不了解巨蟹的人都会对他们有很多误解,不少人都会觉得巨蟹的性格太矫情了。巨蟹表面上看起来很随和,但其实非常需要时间去和他们相处才会有更深的情谊。巨蟹是那种心思非常细腻的……1201亿交易黄了,李嘉诚出逃英国失败?他根本不会放弃英国李嘉诚旗下在英国的UKPowerNetworks公司出售失败了,之前几个外国财团以150亿英镑的价格联手收购,可是如今他们已经宣布收购失败。150亿英镑折合人民币1201亿。如……又一部辣眼国产剧,豆瓣清一色差评,就算肖战力推也不管用又有一部实力派演员参演的犯罪悬疑剧开播了,那就是由孙逊、孟丽、张丹峰共同主演的《暗刃觉醒》。虽然这部剧在开播之前并没有进行大规模的宣传,但是依旧吸引了很高的关注度,不但有……
有生之年,愿温暖常在,温情不带着忧伤岁月无声,温暖人心。当一束光洒向大地,一朵花向阳而生,一片云追逐而来,一群人拥抱阳光。一个角落里的繁华,是有人用心的装扮,一个世界里的温暖,是世间万物慷慨的赠予。世间温暖……毛主席不登黄山之谜?张治中追悔莫及我不该说不坐滑竿不行黄山太偏僻了,我可不去。1954年,毛主席与张治中一起到安徽地区进行考察,在考察过程中,张治中屡次想把黄山推荐给毛主席,希望毛主席能登上黄山一览风采。可任由张治中说……秋冬养生喝什么老中医推荐《本草纲目》把药材分为上、中、下三品,位居上品的往往就是既能作药,又是食品的药材。大家都知道,药补不如食补。食补是指利用食物营养功效结合自己身体情况,通过进补膳食来达到增……一图尽览萌虎迎春!北京市属公园45项主题活动邀您打卡2022年壬寅虎年即将到来,颐和园、天坛公园、北海公园等北京11家市属公园将举办福满京城春贺神州春节游园会,为市民游客提供欢度春节、感受冰雪、新年祈福的线下线上游园文化活动。值……最新版微信重大变更支付消失!已改为服务,什么情况?最近更新了微信版本的用户,有没有发现一些新变化。以笔者为例,意外发现我之中的支付没了,取而代之的是名为服务的入口。点开服务,除了有传统的收付款、查看钱包余额,还有金……中年小个子女人,这才是你该有的打扮毛衣高腰裙,优雅又显高身高、容貌这些都是天生的,我们无法改变。但是,却可以通过穿衣和化妆来进行修饰,从而改善外在形象。那么,对于身高不足160的中年女人而言,利用适当的穿搭来达到显腿长的效果,是刻不……C罗拼了!整场压迫95分钟仍在回追朗尼克脱帽致敬12月5日晚间,英超第15轮的一场焦点战中,曼联主场迎战水晶宫,这是新帅朗尼克在红魔的执教首秀。最终,曼联10小胜对手。此役,C罗首发出场,他虽未进球,但全场一直在拼,并积极压……三款适合自驾游的车型推荐全家出游不用愁五一三天小长假已经过完,对于一个老司机来说,五一自驾游不是什么新鲜事,长假高速免费不是新鲜事,但是五一小长假对于自驾游来说,路上的堵车确是一项挑战!所以,当大家在家中已经憋了太……辅导孩子各种狠招一键get!宝妈们快来读这本熵增定律最近刚读完这本《熵增定律》,让我颇有认同感。想必每个人都遇到这些麻烦事房子越住越乱,身材越来越胖这就是熵物理学家用事物总是从有序走向无序对熵做出解释。我们要想……不惧两万亿资金到期央妈多工具对冲11月不存在流动性问题21世纪经济报道记者叶麦穗广州报道11月流动性开局就遇挑战。11月第一周,央行逆回购到期量将达到1万亿元,这让市场流动性出现一定的压力。11月1日,央行公开市场操作转向100亿……卫衣下面尽量少穿裙子,多穿这4种裤子,洋气显瘦,照样很时髦在不知不觉中,冬天已经过去一大半了,已经穿了好几个月厚实的毛衣和羽绒服,早该退场了,现在是到了卫衣隆重登场的时刻啦!新的一年就是要穿新衣服,走新的搭配路线,2022的第一……WTT新加坡大满贯2023东道主外卡名单公布2月16日,据WTT世界乒联报道,WTT新加坡大满贯2023将于3月7日至19日,在新加坡体育城的华侨银行室内体育馆举行。新加坡时间2月16日,赛事组委会发布了东道主外卡……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网