AI学高数达到MIT本科水平,学了微积分线性代数概率论等6门
让语言模型做数学题,有多难?强如GPT3,在912岁的小学数学上,第一次才考20多分。去年底GPT3用上新方法努力了很久终于拿到55分,可惜还是没及格。
万万想不到啊,2022年才刚开始,突然有人宣布他们的模型掌握了高数,达到MIT本科水平。AI学了6门MIT本科基础数学课里随机抽取的例题,都是网上就有的公开课,包括:
单变量微积分(课程编号18。01)
多变量微积分(18。02)
微分方程(18。03)
概率与统计入门(18。05)
线性代数(18。06)
计算机科学中的数学(6。042)
那么AI最后学到什么水平呢?6门课程每门随机出25道题,再加上一个ACT水平(美国高考)的数据集里的60道题。总计210道题,AI全部答对。题目包括需要求出具体数值的,比如菌落繁殖的经典问题。
也有要求给出方程式的。
要求画出函数图像的也没问题。
最后为了证明训练出来的AI没有过拟合,还额外加试了一场应用线性代数(COMS3251)。这门课不是公开课,网络上根本没有,也就是说AI在预训练阶段不可能接触到,结果AI也掌握了。
要知道在短短几个月前,AI还在挣扎于小明种了5颗柠檬树,每年从每棵树上得到6个柠檬,10年间他总共得到多少柠檬这样的问题。
短短几个月,从小学数学跨越到了高等数学。这项来自MIT哈佛哥伦比亚大学滑铁卢大学的联合研究开了什么挂?
对于AI也是审题最重要
研究团队发现以前用AI做数学题的尝试有一个共同点:训练数据里只有文本。这简直是AI中的文科生,学不好数学也算正常。
那么AI中的理科生要怎么培养?研究团队的解决思路是先在文本上做预训练,再用代码进行微调。核心思想是把数学问题转换成等价的编程问题。
他们找来的这位AI理科生与GPT3师出同门OpenAI的Codex,也是GitHub代码生成工具Copilot背后的技术基础。
Codex解题的过程分两步:先审题,再作答。第一步,自动生成需要的上下文,把题干扩充、缩减或改写成适合编程解决的样子。第二步,生成对应的代码,运行后给出答案。比如补充自然语言题干中隐藏着的问题语境在微分方程中。
列好解题需要用到的Python库。
把问题扩充成更精确的数学语言。原问题:
计算扑克牌中一副手牌中有两对的概率。
改写问题:一副手牌有5张牌,从13组每组4张一共52张牌中随机抽取。
两对牌型要求手牌中共有3种牌,每种数量不能多于两张,也就是说相同的牌不能超过三张。
请编写一个模拟程序求出抽到两对牌型的概率。
(这也太严谨了)
对于一个复杂问题,先自动生成中间步骤的提示,再写代码。
如果题目中有与数学无关的多余信息,也需要去掉。
就这样,AI靠先审题再写代码的方式做出全部正确答案。除了做题,学会高数的AI还能反过来给人类出题。不到一秒钟就能出一道题,试验中总共出了120道题。
把人类出的题和AI出的题混在一起,找学生来做问卷调查,学生也很难分清一道题是不是AI出的。
他们觉得AI出的题要稍微难一些,但大多数题目放在课程里也算合适。
AI出的题你会做吗?
论文中列出了这项研究还存在几个局限性。首先是做不了题干带配图的题,这次试验中也没有需要大量证明的题。
另外最终答案是实际运行代码得出的,但最近有研究表明神经网络也可以直接预测出部分代码的执行结果。以及还是有一些开放性高的题目AI做不出来。
比如一个向量v能否表示为一个集合S中的向量之和?或者以下方程的整数值解是什么?最后还有一个彩蛋,论文作者中出现了GilbertStrang。他编写的《线性代数导论》被誉为最好的线性代数教科书之一。
他在这篇论文中的贡献是提供了研究思路。研究团队下一步打算把这项技术扩展到更多课程,并考虑实际应用到教学中。也许以后MIT的同学期末考试里会有AI出的题了。要不先来试一试,AI出的题你能做出来吗?
论文地址:
https:arxiv。orgabs2112。15594
参考链接:
〔1〕https:www。reddit。comrMachineLearningcommentsrutbpvraneuralnetworksolvesandgenerates
什么是武术?中国武术比较厉害的人有哪些?一些武术大师可信吗?在当今世界上,一说到武术,人们总会想到中国,中国功夫,这可能是得益于李小龙先生还有李连杰先生和成龙先生在国际上的武功展示!让世界了解了中国有一门很厉害的武术!什么是武术?……
武大美女老师火了,网友喊话考武大,本人亲自回应,纯属乌龙今年的高考已经结束,很多考生已经开始放松自己,调适心情,准备和报考有关的事情啦。很多同学都有名校梦,希望自己可以考上心中的理想大学,在我国的重点高校中,武汉大学在985工……
珍惜生命远离雷票!分享我靠蒙的防雷秘诀说实话在这样消息不对称的市场,我的防雷秘诀都是从各大小票的公开信息中分析其是否会成雷票,所以说是蒙也一点都不错,因为我也没办法确定它的公开信息有多少分真实,但这并不妨碍我分析其……
我明知计划确却毫无动力,觉得自己是个空壳,讨厌自己,怎么办?野火烧不尽,春风吹又生。这是野草不灭的自然生命力的写照。而我们的心理心灵世界,有没有这样的不灭生机呢?案例故事:老师好。最近,我很讨厌自己。明明知道每天……
中国工艺美术大师作品联展十一亮相郑州园博园为庆祝祖国华诞,以精美的工艺美术作品向祖国母亲献礼,由郑州园博园主办的中国工艺美术大师作品联展将在十一假期亮相郑州园博园生活体验馆。本次联展将展出工艺美术大师许道先、赵霞、李玉……
说话的十二种枝巧,值得学习说话的十二种技巧,值得学习来源:网络结交一个需要好几年,但得罪一个人却只需要一句话。如若你再想修复这一段关系,又需要一定的付出,远远超过这句话的力气。所以,说话还是需要一……
只有理清楚结果,才能坚持长期主义人啊,不要活了一辈子,还是稀里糊涂。辛辛苦苦的,生活越过越揪心。根本问题就在于,没有想明白活着的意义,忙忙碌碌地活在形式上。算账做好任何一件事,算账都是……
沉默才是一个女人无法掩饰的失落和委屈当一个女人心死了,她开始变得沉默寡言,不再和你倾诉委屈,袒露心声。她看清了身边男人虚情假意,敷衍了事的真面目,开始逼着自己放下。不再会主动和你聊起她的生活工作,孩子……
这些年回首的往事02年的时候,我和所有的人一样,对解放军,有一种崇拜,参加了中国人民解放军,光荣的成为了中国人民解放军一员,当我踏上火车,想部队干出一番事业的梦想,离开了家乡去,河南,信阳,当……
MBA思考职场中真正拉开差距的三个原因在步入职场几年之后,有人一路平步青云成为行业精英、有人却在中年的漩涡中迷茫挣扎着、有人爱情事业双丰收、有人却灰头土脸感叹命运的不公。明明当初大家都是同一起跑线,同样是在社会上打……
存在感,决定赚钱的成败存在感,决定赚钱的成败。赚钱,彰显价值,价值是自我感知的体现,存在感是价值的自我感动,赚钱的成功取决于自我价值的充分感知。赚钱是自我的再认识,熟知自己存在的价值,感知自我……
了解了日本的遭遇,就明白了为啥我国要搞共同富裕想必大家最近听得最多的词就是:共同富裕最近认真研究了下日本二战后的历史,有些心得分享给大家。二战后的日本经济快速崛起,然后经历一轮经济增长的夭折及股市房价的泡沫,就……
拍婚纱照连载去照海景1今天去照婚纱照的海景了,一个字累!又晒又累又热,肩膀被晒红红的,回来热热的,估计要脱皮了,难受不过挺有意思的,我穿着白纱站在海里,一个又一个浪冲过来,没膝盖的深度,看着远……
我在这!在这冷冷的冬天,听着点点伤伤的歌,内心总会有点点的寒冷。并不是因为不开心,也不是因为无事可做,有时候事情来的太快,懒散的生活已经习惯,所以却已无心去做了。上次一朋友跟我说他已经……
做人别太大建了!160;大建。。熟知大建的现在应该都怕他。160;他太恐怖了。160;口袋揣着100元。居然输了100万。。实在是牛B!160;如今他那60多岁的老妈妈成天找……
我依然爱你!再一次发出王力宏的《依然爱你》也许我们每个人的心目中都存在那么一个人,会记住那些时时刻刻的幸福,记住那些美好的时光,就如MV里面那样,最终分开,多年之后……
昨日歌昨日复昨日,昨日何其有?昨日之功绩,今日何不为?今日空想昨日事,今日之空变昨日。若知今日空欢喜,昨日何不平常事?多做一些平常事,胜过成功只一日。莫……
失眠的夜有点儿小累啊在其位,谋其政。真的站在这个岗位了才知道,原来曾经的都不叫压力。现在要想的事情要做的事情太多太多了。工作态度调整,位置的摆放,兄弟间的沟通。原来,我真的没有时……
下雨下雨的窗外,一片澄明,然而,我的眼光却是一片混浊。不知道该喜还是悲。早上早早来到办公室,下雨的天,没事可做,只有发呆的份。望着窗外,思绪混乱,脑袋里都是点点滴滴。是懒惰了还是没……
迷上一场虚幻菩提本无数,明镜亦非台,本来空无物,何处惹尘埃!本文题或许,因为长时间在网络这个虚无缥缈,与世无争的世外桃源里生活的原因吧,突然发觉自己并不快乐!……
无名无名一个歌手总有属于自己的那一首歌;一个情圣总有属于自己的那一段故事;一个作家也总有属于自己的那一本书。无名的我什么是属于我的?当我追忆着曾经的奋斗,属于我的思想家终变成……
眼晴的远离shy;你说你要离开,我却无能为力,原来多年的相处却不及一段短暂的风景。原本眼前的绚丽多彩刹那间变为灰白。你带走了我的所有,记忆从此停留,停留在有你的地方。……
伶人歌(原创作品,请勿转载!)芳雪落天际,伶人歌楚凄。自古红颜多薄命,泪落洗菩提这是一个人的舞台,即便有再多的繁花似锦、车水马龙,终究只是一个人的舞台。当我脱去戏袍……
四年祭从高一到现在有整整四年哒。。高一的相识因为我们都爱恰肉,喜欢鬼搞子搞还有点牵强的相似吧我们开始一起玩每天一起中午回家吃饭一起在马路上唱歌……