幼儿饰品瑜伽美体用品微软
投稿投诉
微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

LeCun转赞苹果M1M2芯片上跑LLaMA!130亿参数模

  科技之巅
  编辑:好困
  【新智元导读】现在,Meta最新的大语言模型LLaMA,可以在搭载苹果芯片的Mac上跑了!
  前不久,Meta前脚发布完开源大语言模型LLaMA,后脚就被网友放出了无门槛下载链接,惨遭开放。
  消息一出,圈内瞬间就热闹了起来,大家纷纷开始下载测试。
  但那些手头没有顶级显卡的朋友们,就只能望模型兴叹了。
  不过,问题不大。GeorgiGerganov在最近做了一个名为llama。cpp的项目没有GPU也能跑LLaMA。
  项目地址:https:github。comggerganovllama。cpp
  是的,这也包括搭载了苹果芯片的Mac。并且还获得了LeCun的转发支持。
  在M1M2的Mac上跑LLaMA
  目前来说,比较全面的教程有两个,分别基于苹果的M1和M2处理器。
  第一篇:https:dev。l1x。beposts20230312usingllamawithm1mac
  第二篇:https:til。simonwillison。netllmsllama7bm2
  话不多说,先看效果。
  比如在最小的7B模型上提问:第一个登上月球的人是。
  很快,几秒之后,结果就出来了。
  p第一个登上月球的人是
  第一个登上月球的人是38岁的宇航员NeilA。Armstrong。
  1969年7月20日,阿波罗11号在月球上着陆。
  阿波罗11号是第一个登陆月球的载人任务,也是太空竞赛的高潮。1969年7月,NeilArmstrong和EdwinBuzzAldrin成为第一批在月球上登陆的人类。
  阿波罗11号于7月16日从肯尼迪航天中心发射。
  从阿姆斯特朗登月的年龄、中间名和日期来看,并没有出现明显的事实性错误。这对于如此体量的小模型来说,实属不易。
  如果用下面这个提示,则可以生成了一些实用的Python代码。pdefopenandreturncontent(filename):defopenandreturncontent(filename):Opensfile(returningthecontent)andperformsbasicsanitychecksifos。path。isfile(filename):withopen(filename)asf:contentf。read()returncontentelse:print(WARNING:file{}doesnotexist。format(filename),filesys。stderr)returndefgetfileinfo(filename,fullpath):Getfileinformation(i。e。,permission,owner,group,size)接下来,我们就来看看具体是如何实现的。
  第一步:下载模型
  首先要做的就是下载LLaMA模型。
  你可以通过官方的表格向Meta提交申请,或者从网友分享的链接里直接获取。
  总之,完成后你会看到下面这堆东西:
  正如你所看到的,不同的模型都在不同的文件夹里。每个模型都有一个params。json,包含关于该模型的细节。比如:
  第二步:安装依赖项
  首先,你需要安装Xcode来编译C项目。xcodeselectinstall
  接下来,是构建C项目的依赖项(pkgconfig和cmake)。brewinstallpkgconfigcmake
  在环境的配置上,假如你用的是Python3。11,则可以创建一个虚拟环境:opthomebrewbinpython3。11mvenvvenv
  然后激活venv。(如果是fish以外的shell,只要去掉。fish后缀即可)。venvbinactivate。fish
  最后,安装Torch。pip3installpretorchtorchvisionextraindexurlhttps:download。pytorch。orgwhlnightlycpu
  如果你对利用新的Metal性能着色器(MPS)后端进行GPU训练加速感兴趣,可以通过运行以下程序来进行验证。但这不是在M1上运行LLaMA的必要条件。pythonPython3。11。2(main,Feb162023,02:55:59)〔Clang14。0。0(clang1400。0。29。202)〕ondarwinTypehelp,copyright,creditsorlicenseformoreinformation。torch。backends。mps。isavailable()True
  第三步:编译LLaMACPP
  gitclonegitgithub。com:ggerganovllama。cpp。git
  在安装完所有的依赖项后,你可以运行make:makeIllama。cppbuildinfo:IUNAMES:DarwinIUNAMEP:armIUNAMEM:arm64ICFLAGS:I。O3DNDEBUGstdc11fPICpthreadDGGMLUSEACCELERATEICXXFLAGS:I。I。examplesO3DNDEBUGstdc11fPICpthreadILDFLAGS:frameworkAccelerateICC:Appleclangversion14。0。0(clang1400。0。29。202)ICXX:Appleclangversion14。0。0(clang1400。0。29。202)ccI。O3DNDEBUGstdc11fPICpthreadDGGMLUSEACCELERATEcggml。coggml。ocI。I。examplesO3DNDEBUGstdc11fPICpthreadcutils。cppoutils。ocI。I。examplesO3DNDEBUGstdc11fPICpthreadmain。cppggml。outils。oomainframeworkAccelerate。mainhusage:。main〔options〕options:h,helpshowthishelpmessageandexitsSEED,seedSEEDRNGseed(default:1)tN,threadsNnumberofthreadstouseduringcomputation(default:4)pPROMPT,promptPROMPTprompttostartgenerationwith(default:random)nN,npredictNnumberoftokenstopredict(default:128)topkNtopksampling(default:40)toppNtoppsampling(default:0。9)tempNtemperature(default:0。8)bN,batchsizeNbatchsizeforpromptprocessing(default:8)mFNAME,modelFNAMEmodelpath(default:modelsllama7Bggmlmodel。bin)cI。I。examplesO3DNDEBUGstdc11fPICpthreadquantize。cppggml。outils。ooquantizeframeworkAccelerate
  第四步:转换模型
  假设你已经把模型放在llama。cpprepo中的models下。pythonconvertpthtoggml。pymodels7B1
  那么,应该会看到像这样的输出:{dim:4096,multipleof:256,nheads:32,nlayers:32,normeps:1e06,vocabsize:32000}nparts1Processingpart0Processingvariable:tokembeddings。weightwithshape:torch。Size(〔32000,4096〕)andtype:torch。float16Processingvariable:norm。weightwithshape:torch。Size(〔4096〕)andtype:torch。float16Convertingtofloat32Processingvariable:output。weightwithshape:torch。Size(〔32000,4096〕)andtype:torch。float16Processingvariable:layers。0。attention。wq。weightwithshape:torch。Size(〔4096,4096〕)andtype:torch。float16Processingvariable:layers。0。attention。wk。weightwithshape:torch。Size(〔4096,4096〕)andtype:torch。float16Processingvariable:layers。0。attention。wv。weightwithshape:torch。Size(〔4096,4096〕)andtype:torch。float16Processingvariable:layers。0。attention。wo。weightwithshape:torch。Size(〔4096,4096〕)andtype:torch。float16Processingvariable:layers。0。feedforward。w1。weightwithshape:torch。Size(〔11008,4096〕)andtype:torch。float16Processingvariable:layers。0。feedforward。w2。weightwithshape:torch。Size(〔4096,11008〕)andtype:torch。float16Processingvariable:layers。0。feedforward。w3。weightwithshape:torch。Size(〔11008,4096〕)andtype:torch。float16Processingvariable:layers。0。attentionnorm。weightwithshape:torch。Size(〔4096〕)andtype:torch。float16。。。Done。Outputfile:models7Bggmlmodelf16。bin,(part0)
  下一步将是进行量化处理:。quantize。models7Bggmlmodelf16。bin。models7Bggmlmodelq40。bin2
  输出如下:llamamodelquantize:loadingmodelfrom。models7Bggmlmodelf16。binllamamodelquantize:nvocab32000llamamodelquantize:nctx512llamamodelquantize:nembd4096llamamodelquantize:nmult256llamamodelquantize:nhead32llamamodelquantize:nlayer32llamamodelquantize:f161。。。layers。31。attentionnorm。weight〔4096,1〕,typef32size0。016MBlayers。31。ffnnorm。weight〔4096,1〕,typef32size0。016MBllamamodelquantize:modelsize25705。02MBllamamodelquantize:quantsize4017。27MBllamamodelquantize:hist:0。0000。0220。0190。0330。0530。0780。1040。1250。1340。1250。1040。0780。0530。0330。0190。022main:quantizetime29389。45msmain:totaltime29389。45ms
  第五步:运行模型
  。mainm。models7Bggmlmodelq40。bint8n128pThefirstpresidentoftheUSAwasmain:seed1678615879llamamodelload:loadingmodelfrom。models7Bggmlmodelq40。binpleasewait。。。llamamodelload:nvocab32000llamamodelload:nctx512llamamodelload:nembd4096llamamodelload:nmult256llamamodelload:nhead32llamamodelload:nlayer32llamamodelload:nrot128llamamodelload:f162llamamodelload:nff11008llamamodelload:nparts1llamamodelload:ggmlctxsize4529。34MBllamamodelload:memorysize512。00MB,nmem16384llamamodelload:loadingmodelpart11from。models7Bggmlmodelq40。binllamamodelload:。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。donellamamodelload:modelsize4017。27MBnumtensors291main:prompt:ThefirstpresidentoftheUSAwasmain:numberoftokensinprompt911576The937first6673president310of278the8278USA471was29871samplingparameters:temp0。800000,topk40,topp0。950000ThefirstpresidentoftheUSAwas57yearsoldwhenheassumedoffice(GeorgeWashington)。Nowadays,theUSelectorateexpectsthenewpresidenttobemoreyoungatheart。PresidentDonaldTrumpwas70yearsoldwhenhewasinaugurated。Incontrasttohispredecessors,heisphysicallyfit,healthyandactive。Andhisfitnesshasbeenaprominentthemeofhispresidency。Duringthepresidentialcampaign,hefamouslysaidhewouldbethemostactivepresidenteverastatementTrumphasnotyetachieved,butonethatfitshisapproachtotheoffice。Histweetsdemonstratehisphysicalactivity。main:mempertoken14434244bytesmain:loadtime1311。74msmain:sampletime278。96msmain:predicttime7375。89ms54。23mspertokenmain:totaltime9216。61ms
  资源使用情况
  第二位博主表示,在运行时,13B模型使用了大约4GB的内存,以及748的CPU。(设定的就是让模型使用8个CPU核心)
  没有指令微调
  GPT3和ChatGPT效果如此之好的关键原因之一是,它们都经过了指令微调,
  这种额外的训练使它们有能力对人类的指令做出有效的反应。比如总结一下这个或写一首关于水獭的诗或从这篇文章中提取要点。
  撰写教程的博主表示,据他观察,LLaMA并没有这样的能力。
  也就是说,给LLaMA的提示需要采用经典的形式:一些将由。。。。。。完成的文本。这也让提示工程变得更加困难。
  举个例子,博主至今都还没有想出一个正确的提示,从而让LLaMA实现文本的总结。
  参考资料:
  https:github。comggerganovllama。cpp
  https:dev。l1x。beposts20230312usingllamawithm1mac
  https:til。simonwillison。netllmsllama7bm2

中国电竞二十年从混沌到规范从地下到台前提起电竞,或许大家都会对2021年的那个晚上记忆犹新:宿舍楼的欢呼、朋友圈的刷屏,以及微博上一个接一个的热搜,EDG夺冠啦!2021年11月7日凌晨,2021英雄联盟全球……S71500之间S7双边通信(同一项目中)S71500之间通过BSENDBRCV方式进行双边通信的组态编程步骤,用于实现两台S71500都在同一项目中组态的场景。1。组态1。1使用TIAPortal创建项目使用T……怀孕女教师因坐着上课,被校长点名批评,家长上演实力护师文初语在很多外人眼里教师是一个非常体面的职业,不仅岗位很让人尊重,而且福利待遇也很不错,最主要的是每年都能享受到其他行业享受不到的带薪寒暑假,但实际上,教师看似光鲜亮丽的……三款代步神器,省钱省油保值都是通勤小能手,6万起选哪款随着新能源车逐步普及,尤其是10万元以内的新能源车型逐步多了起来,以比亚迪海豚为主的一系列国产车型正在改变10万以内汽车市场的格局,要不了多久新能源车型凭借动力优势以及驾驶舒适……女足夺冠冬奥首金,看哪家车企能玩转热点营销2月5日21时37分,首都体育馆内爆发出震耳欲聋的欢呼声,中国队夺得短道速滑混合团体接力金牌,收获本届冬奥会中国代表团首金。2月6日晚,中国女足3比2战胜韩国队,第9次捧……怪不得都不穿小黑裤了,现流行穿这条裤子,复古文艺又高级冬天可以说是裤子的专场,而其中最为常见的应该就是小黑裤了,小黑裤带有视觉收缩的效果,既能显瘦显腿细又十分百搭。但若是你今年还在入手小黑裤的话,那你就out了。小黑裤太过于……越穷越愚昧,越愚昧越贱,这就是人性在头条看见彼此越穷的人越愚蠢,越卑鄙。这是人之常情!永恒的真理!贫穷会带来无知。越穷,眼界越窄,越难看到长远的未来,越容易把目光放在眼前的蝇头小利上,越是愚蠢。贫穷……陈小鲁见过父亲陈毅临终时的痛苦,他交代子女我要有尊严的死也许不少人都对陈小鲁此人陌生,因为他非常低调,但他的父亲陈毅元帅,几乎是人尽皆知的。陈小鲁和其他元帅子弟相比,也是相对出众的,在父亲的教导下他也曾加入部队,也正是因为此,在父亲……冰上舞蹈雪滑梯这个冬天,海淀美爆了冰上舞蹈、雪中驰骋雪圈、雪滑梯、雪上坦克。。。。。。2022年海淀的冬天美爆了无论是三五好友聚会打卡还是周末难能可贵的亲子时光穿好装备……克莱汤普森想成为历史三分榜上仅次于库里的第二人斯蒂芬库里是NBA历史上最伟大的射手,本赛季他有望打破雷阿伦职业生涯2973个三分球的历史三分球纪录。目前库里三分命中数是2832个,他距离突破雷阿伦还有142个。如果健康的话……睡觉时胎动更频繁,是否压到宝宝?出生后是否会睡颠倒觉?胎动对于每位孕妈妈来说都是一种非常神奇的体验,也是因为胎动,让每个孕妇都想起了自己的责任,同时也激发了母爱,给辛苦了孕期带来了快乐。但是胎动同时也提示着胎儿的健康,尤其是……修复眼镜划痕的4种方法对于一个常戴眼镜的人来说,最痛苦的莫过于冬天擦不完的水雾和擦不掉的划痕。视力受影响不说,换镜片还非常伤钱包。对于镜片划痕,我整理了4种修复方法。其实,大部分的刮痕修复起来……
选冰箱应选大牌质量好的TCL冰箱就是我的不二之选对于一般家庭而言,不会经常更新大件家电,如果不是坏到没法用了,很少人会选择买新的。我家的那台旧冰箱,已经用了好几年,有好多毛病了。它的制冷能力严重不行,水果蔬菜放在里面没两天就……陶虹有多虐?薄薄一层蛋液裙裹在身上超级美,嫉妒死徐峥了不晓得朋友们还记得《春色光耀猪八戒》这部电视剧吗?让你影响非常深的是哪个演员呢?信赖记得的都邑说小龙女,真相在当时候以为她的俏丽是无人能及的。陶虹扮演的小龙女连续伴随在猪八戒的……CBA三消息首钢小外援到北京,辽宁双雄很忠心,周琦暗示众队友爱国篮,爱CBA,我是洛姐,小伙伴们看完记得点赞!北京首钢队下个赛季直接更换了四名外援,这是球迷们没有想到的事情,现在前北京首钢队小外援林书豪已经加盟了CBA广州队,球队……谁该为司马南中伤的企业正名?堂弟是某地高中教师,前天见面时他说,他们已组织开会,准备开学了。今年,他们学校按市里要求,高一年级全面开展智慧教育,就是上课不再用黑板,用大屏,备课通过智慧教育系统同年级同科集……44!曼市包围积分榜滕哈赫遭两连暴击,6800万欧打水漂202223赛季英超展开了第2轮的争夺,主场作战的曼城40大胜到访的升班马伯恩茅斯,拿下两连胜的同时1球不失,登上了积分榜首。此役哈兰德没有进球,但收获1次助攻,他展示了自己强……便宜智能锁和高价智能锁有什么区别?智能锁需要买几千块的吗?稍微了解过智能锁的朋友应该清楚,智能锁的价格差距真的很大,从几百到几千,那么到底为什么差距那么多,我们该买什么价位的?今天就带你来了解这些问题。首先先说,不同价格的……董明珠接班人孟羽童为何消失了董敏珠接班人孟羽童为何突然淡出直播间,粉丝数增至234万。孟羽童在当时一档真人秀节目中得到董明珠青睐,后加入格力担任董事长秘书。很快孟羽童成了格力家的带货主播,半年时间积累了2……生命构成构造的科学思考生命构成构造的科学思考很多生物,比如昆虫的许多构造很奇妙,有观点就说是因为有神才能创造出来。这是完全无知荒谬的。恰恰是,生命体是群体的,可复制的,并且是可演化的,特……这些绝美出片景点你一定不能错过暑期进入倒计时,阳朔漓江景区朝板山码头旅拍仍火热朝天。当前国风、动漫盛行,汉服、cosplay服装成为了时代主流。傍晚时分,夕阳散落漓江,景与人相互衬托,风情万种,各有千秋。还……等我老了才不要穿奶奶装,学75岁法国老太太这样穿,优雅老去文:Nicolehi,我是Nicole,准备好一起变美了吗?在你印象中,75岁的老太太应该是什么状态?这位75岁生活在巴黎的美国奶奶老太太Linda。V。Wr……折叠屏的最后一公里被打破了,小米MIXFold2轻薄上阵从2019年三星开创折叠屏以来,折叠屏就作为一个特别的角色活跃在手机市场。但是,它的发展并没有呈现出风生水起的状态。这跟它的比例不协调、软件适配性差等问题有密切关系。当然,这跟……8万人见证!巴萨5000万巨星狂飙15分钟造3球,本泽马迎劲甘伯杯决赛,巴萨在诺坎普大开杀戒,60大胜墨西哥劲旅美洲狮,展现了强悍的进攻火力。莱万多夫斯基的表现更是出色,他在短短15分钟内就完成1球2助攻,直接参与了3个进球。论射术和组……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网