中英文最大AI模型世界纪录先后产生，大模型竞赛新阶段来了

微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

中英文最大AI模型世界纪录先后产生，大模型竞赛新阶段来了

　　10月15日消息，超大AI模型训练成本太高hold不住？连市值万亿的公司都开始寻求合作了。
　　本周，英伟达与微软联合发布了5300亿参数的威震天图灵（MegatronTuring），成为迄今为止全球最大AI单体模型。
　　仅仅在半个月前，国内的浪潮发布了2500亿参数的中文AI巨量模型源1。0。
　　不到一个月的时间里，最大英文和中文AI单体模型的纪录分别被刷新。
　　而值得注意的是：
　　技术发展如此之快，威震天图灵和源1。0还是没有达到指数规律的预期。
　　要知道，从2018年开始，NLP模型参数近乎以每年一个数量级的速度在增长。
　　近年来NLP模型参数呈指数级上涨（图片来自微软）
　　而GPT3出现后，虽然有SwitchTransformer等万亿参数混合模型出现，但单体模型增长速度已经明显放缓。
　　无论是国外的威震天图灵，还是国内的源1。0，其规模和GPT3没有数量级上的差异。即便威震天图灵和源1。0都用上了各自最强大的硬件集群。
　　单体模型是发展遇到瓶颈了么？超大模型的三个模式
　　回答这个疑问，首先得梳理一下近年来出现的超大规模NLP模型。
　　如果从模型的开发者来看，超大规模NLP模型的研发随时间发展逐渐形成了三种模式。
　　一、以研究机构为主导
　　无论是开发ELMo的Allen研究所、还是开发GPT2的OpenAI（当时还未引入微软投资）都不是以盈利为目标。
　　且这一阶段的超大NLP模型都是开源的，得到了开源社区的各种复现与改进。
　　ELMo有超过40个非官方实现，GPT2也被国内开发者引入，用于中文处理。
　　二、科技企业巨头主导
　　由于模型越来越大，训练过程中硬件的优化变得尤为重要。
　　从2019年下半年开始，各家分别开发出大规模并行训练、模型扩展技术，以期开发出更大的NLP模型。英伟达MegatronLM、谷歌T5、微软TuringNLG相继出现。
　　今年国内科技公司也开始了类似研究，中文AI模型源1。0便是国内硬件公司的一次突破
　　成就中文领域最大NLP模型，更一度刷新参数最多的大模型纪录。
　　源1。0不仅有高达5TB的全球最大中文高质量数据集，在总计算量和训练效率优化上都是空前的。
　　三、巨头与研究机构或巨头之间相互合作
　　拥有技术的OpenAI由于难以承受高昂成本，引入了微软10亿美元投资。依靠海量的硬件与数据集资源，1750亿参数的GPT3于去年问世。
　　但是，今年万亿参数模型的GPT4并没有如期出现，反而是微软与英伟达联手，推出了威震天图灵。
　　我们再把目光放回到国内。
　　威震天图灵发布之前，国内外涌现了了不少超大AI单体模型，国内就有阿里达摩院PLUG、源1。0等。
　　像英伟达、微软、谷歌、华为、浪潮等公司加入，一方面是为AI研究提供大量的算力支持，另一方面是因为他们在大规模并行计算上具有丰富的经验。
　　当AI模型参数与日俱增，达到千亿量级，训练模型的可行性面临两大挑战：
　　1、即使是最强大的GPU，也不再可能将模型参数拟合到单卡的显存中；
　　2、如果不特别注意优化算法、软件和硬件堆栈，那么超大计算会让训练时长变得不切实际。
　　而现有的三大并行策略在计算效率方面存在妥协，难以做到鱼与熊掌兼得。
　　英伟达与微软合体正是为此，同样面对该问题，浪潮在源1。0中也用了前沿的技术路径解决训练效率问题。
　　从源1。0的arXiv论文中，我们可以窥见这种提高计算效率的方法。
　　在对源的大规模分布式训练中，浪潮采用了张量并行、流水线并行和数据并行的三维并行策略。
　　威震天图灵和源1。0一样，在张量并行策略中，模型的层在节点内的设备之间进行划分。
　　流水线并行将模型的层序列在多个节点之间进行分割，以解决存储空间不足的问题。
　　另外还有数据并行策略，将全局批次规模按照流水线分组进行分割。
　　三家公司运用各自的技术，将最先进的GPU与尖端的分布式学习软件堆栈进行融合，实现了前所未有的训练效率，最终分别打造出英文领域和中文领域的最大AI单体模型。
　　训练超大规模自然语言模型成本升高，技术上殊途同归，形成研究机构与科技巨头协同发展，三种探索模式并驾齐驱的局面。中英AI模型互有胜负
　　训练成本趋高，技术趋同，为何各家公司还是选择独自研究，不寻求合作？
　　我们从GPT3身上或许可见一斑。
　　去年发布的GPT3不仅未开源，甚至连API都是限量提供，由于获得微软的投资，今后GPT3将由微软独享知识产权，其他企业或个人想使用完整功能只能望洋兴叹。
　　训练成本奇高、道德伦理问题以及为了保证行业领先地位，让微软不敢下放技术。其他科技公司也不可能将自己的命运交给微软，只能选择独自开发。
　　尤其对于中国用户来说，以上一批超大模型都不是用中文数据集训练，无法使用在中文语境中。
　　中文语言的训练也比英文更难。英文由单词组成，具有天然的分词属性。
　　而中文需要对句子首先进行分词处理，如南京市长江大桥，南京市长江大桥、南京市长江大桥，错误的分词会让AI产生歧义。
　　相比于英文有空格作为分隔符，中文分词缺乏统一标准，同样一个词汇在不同语境、不同句子中的含义可能会相差甚远，加上各种网络新词汇参差不齐、中英文混合词汇等情况，要打造出一款出色的中文语言模型需要付出更多努力。
　　所以国内公司更积极研究中文模型也就不难理解了。
　　即便难度更高，国内公司还一度处于全球领先，比如数据集和训练效率方面。
　　据浪潮论文透露，源1。0硬件上使用了2128块GPU，浪潮共搜集了850TB数据，最终清洗得到5TB高质量中文数据集。
　　其文字数据体积多于威震天图灵（835GB），而且中文信息熵大大高于英文，信息量其实更大。
　　在训练效率方面，源1。0训练用了16天，图灵威震天用了一个多月，前者数据量是后者3倍有余，耗时却只有后者一半
　　其专注中文，关注效率努力也可见一斑。
　　大模型你来我往间能看出，发展已走入百花齐放互不相让的阶段，这给我们带来新的思考：AI巨量模型既然不闭门造车，那如何走向合作？多方合作可能才是未来
　　表面上威震天图灵（MegatronTuringNLG）是第一次由两家科技巨头合作推出超大AI模型。
　　其背后，双方不仅组成了超豪华硬件阵容，在算法上也有融合。强强联合成为超大AI模型落地的一种新方式，
　　国外巨头开启先例，那么国内公司的现状又是如何呢？其实有机构已经迈出合作的第一步。
　　诸如浪潮的源1。0，和当初的威震天一样，也是由硬件厂商主导开发的超大规模自然语言模型。
　　浪潮透露，实际上9月28日的发布会上，他们邀请了国内的学者和数家科技公司共同探讨未来源1。0合作的可能性。
　　在产业界，浪潮早就提出了元脑计划的生态联盟，源1。0未来将向元脑生态社区内所有开发者开放API，所有加入生态的AI技术公司都可以利用源1。0进行二次开发，从而制造出更强大的功能。
　　国内超大规模自然语言模型合作的时代正在开启。
　　合作开发巨量模型能带来什么？李飞飞等知名学者已经给出答案：当数据规模和参数规模大到一定程度时，量变最终能产生质变，GPT3就是先例。
　　如今大模型越来越多，但未来关键还在于如何纵横捭阖，打造属于一套开放合作体系，让所有技术公司群策群力。
　　而AI巨量模型在这样的生态体系下会带来怎样的变化，在源1。0等一大批模型开放后，应该很快就能看见。

拾起一片雪花祭奠落叶的最后吟唱想挽留住一池秋水的平静却被冰雪夺去了一池的清明想拉住秋的手，留住五彩斑斓却只剩下苍翠的松，独迎霜锋雪剑秋去冬来，轮换的本是自然但总有那么一丝黯然留……老年人养心贵在静心（一）养生之道重在养心，养心之道贵在静心。静心，简单的说就是把心静下来。其实，人的本源状态就是平静、安宁、祥和。只是因为外界的各种干扰和心中的无数烦恼导致内心的躁动，由此引发各种各样……轻便灵活的小键盘新买的小键盘，准备用来写作码字用的。上个星期，用水龙头app在淘宝上购买了一个bow航世三折叠键盘，现在已经使用了三天，感觉手感还是不错，打字很方便；而且这个键盘可以折叠……年华苍翠，时光如许，在红尘最深处，写一个关于风花雪月的故事沈从文说：我行过许多地方的桥，看过许多次数的云，喝过许多种类的酒，却只爱过一个正当最好年龄的人。一首纸短情长的诗，几许情深意浅的文字，醉过多少流年，解过多少愁肠，又喂养过……人应该诗意地栖居，应该有自己的爱好，应该有自己的乐趣寻找头条生活家人应该诗意地栖居，应该有自己的爱好，应该有自己的乐趣。这是完美主义者的追求，也是我的追求，也是我的希冀。不想去打扰，也不想被打扰，安安静静一个人，刚刚好。这……欢迎加入内卷集团，具备8个条件之一，你就可以入职内卷这个课题并不是一个新鲜课题，但小编确实是第一次深度思考。源于昨天看到一个新闻《48岁失落大龄职场男致信上海市长求工作被推荐入职一个月后又离职》：虽然我是硕士本科都是重点大学……珍惜那个需要你的人作者：万红云原创作品，抄袭必究人性往往更看重那个自己需要的人，因为对方有能力帮助自己解决问题。却很少注意需要自己的人，因为觉得对方很麻烦，牵扯到了自己的精力。……天价彩礼买得了幸福吗？近几天，网络传出一个深得民心的好消息：河南一地所有行政村约定彩礼不超过3万元。于是，大家议论开来，纷纷表示，早就该定个标准了，结个婚不能漫天要价，仿佛卖闺女似的；也有人说，这年……用一个最佳的状态，来笑看云卷云舒他人心中有我们的时候，是我们最开心的时候，要知道，人与人之间各有各的因缘，你对他好不见的就是好，很大程度上面，其实是就是他人之前对我们很好从佛法的……读了十六年的书，感觉依旧没有用从何时起，父母过多的关心了学习，认为成绩好才是个好孩子，我也听话，努力的成为了父母，老师眼中的好学生，同学眼中的榜样，就这样，直到中考模拟，发现自己的成绩处于一般水平了，好多学……送给教师们的一份新年礼物在农历2021年新春佳节到来之际，教育局给全县教育系统送上了一份新年礼物免费接种新冠肺炎疫苗。教育系统的老师们，接到通知后，有的积极上报接种名单，有的在观望，因为这是一个新事物……酒知道（七）（连载）渡口奇缘我也该走了！刘一柱放下碗，从水缸里舀了一瓢水将就漱了口水，从屋子里走出，见陈香站在门口的河岸上，在朝阳的光辉映衬下，更显得美丽动人，长飞在微风中飘逸。小妹，我走了！刘一柱……

<<<<<<－>>>>>>

因为我爱你因为我爱你，才盼望着夜晚的到来，莽撞、悄悄地来找你，像贼一样。为了不让你忘记我，于是，我使出了全部力量，带走了你的心。现在，你那一整颗心都在我这里，……有哪些微甜的情话？（二）41、不管以后别人追你，还是你追别人，我不会阻拦，我只会伸脚把你绊倒，让你栽进我怀里。42、这世间最烈的酒，是你低头噙笑的温柔。43、你是我所有自卑胆怯的原因，也是……能让男人上瘾的女人，身上有三种味道，很准摘一朵鲜花，生活可添一份色彩；得一份真爱，余生便会充满温馨。爱情，是每个人在前行与奋斗中最大的慰藉。有的人无心寻爱，可总是受人追捧；有的人主动追寻，可始终爱而不得。其实，……能在短时间内，让男人念念不忘的女人，身上必然有这3种特征汉代文人司马相如的《凤求凰》写道：有美人兮，见之不忘。一日不见兮，思之如狂。凤飞翱翔兮，四海求凰。无奈佳人兮，不在东墙。古人司马相如写出了男人喜欢一个女人的心理状态，那在……想要看透婚姻，就要适当的保持距离，别不信婚姻在我们很多人眼里就像是原本两个家庭的个人，一起努力组成的一个新家庭，没有好感时期的大胆和浪漫，也没有谈恋爱的甜蜜和任性，有的多数是责任和义务。之前抖音刷到涂磊老师这么……那些岁月静好的文案向往蓝天白云，不惹尘埃世俗。hi，这里是微醺文案馆1。天气晴朗，微风不噪，一切尽可期待。2。世间的温柔皆如干净的云朵和你。3。今天天气很好，你要记得开心。1。天气清新的就像一场大病……构成宇宙万物的最小基础粒子一一单奇子人类对于宏观宇宙的研究必须和对于微观粒子的研究结合在一起，才能从本源上得以辨清物理，即所谓以天之语，解物之道，才能对世理的研究达至大无其外，小无其内。从分子、原子到质子、……人还是要乐观，心碎了就对自己说碎碎平安每个人真正强大起来都要度过一段没人帮忙，没人支持的日子。但只要咬牙撑过去，一切都不一样了。真正想要的，没有一样是可以轻易得到的。这就是努力的理由！坚持下去，活着不是靠泪水博得同……李大春月满书屋作者：李大春今年国庆中秋同一天，真可谓过年娶媳妇双喜临门。我这文坛新秀又文坛老将（作协蓝主席电话邀请时的戏言），受邀第一次参加作协举办的相约冠豸书屋共品书香连城雅集联谊活……杨绛能做大事的人，需要经历两个阶段文夏莫01hr人生就像是攀登高峰，在这个过程中，不见得都是风和日丽。也许，我们会遇到很多风险，感受到饥寒交加的苦楚。生活中，总有人觉得，我已经付出这么多了，为什么没……41岁柳岩因婚姻焦虑而相亲不结婚的人生，真得不完美吗？李宗盛在《晚婚》里唱道：我从来不想独身，却又预感晚婚，我在等，世上唯一契合灵魂。晚婚，不是不婚，而是做好了孤独终老的准备，却依然相信爱情。婚姻是人生大事，也是……难以磨灭的记忆腊月27这天，弟弟降生了，家里的第一个男丁啊，爷爷奶奶高兴坏了，爹娘如释重负，我和姐姐也暗自开心着，我们终于有弟弟啦！瘦瘦长长的体型，大大的眼睛带着天生的忧郁，左侧耳朵旁……

友情链接：易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网