一张照片就能生成3D模型,GAN和自动编码器碰撞出奇迹
2D图片脑补3D模型,这次真的只用一张图就行了只需要给AI随便喂一张照片,它就能从不一样的角度给你生成新视图:
不仅能搞定360的椅子和汽车,连人脸也玩出了新花样,从死亡自拍角度到仰视图都能生成:
更有意思的是,这只名叫Pix2NeRF的AI,连训练用的数据集都有点与众不同,可以在没有3D数据、多视角或相机参数的情况下学会生成新视角。可以说是又把NeRF系列的AI们卷上了一个新高度。用GAN自动编码器学会脑补
在此之前,NeRF能通过多视图训练AI模型,来让它学会生成新视角下的3D物体照片。然而,这也导致一系列采用NeRF方法的模型,包括PixelNeRF和GRF,都需要利用多视图数据集才能训练出比较好的2D生成3D模型效果。
而多视图数据集往往有限,训练时间也比较长。因此,作者们想出了一个新方法,也就是用自动编码器来提取物体姿态和形状特征,再用GAN直接生成全新的视角图片。
Pix2NeRF包含三种类型的网络架构,即生成网络G,判别网络D和编码器E。其中,生成网络G和判别网络D组成生成对抗网络GAN,而编码器E和生成网络G用于构成自动编码器:
首先,自动编码器可以通过无监督学习,来获取输入图像的隐藏特征,包括物体姿态和物体形状,并利用学习到的特征重建出原始的数据;然后,再利用GAN来通过姿态和形状数据,重构出与原来的物体形状不同的新视图。
这里研究人员采用了一种叫做GAN的结构,生成3D视角照片的效果相比其他类型的GAN更好(作者们还对比了采用HoloGAN的一篇论文):
那么,这样混搭出来的AI模型,效果究竟如何?用糊图也能生成新视角
作者们先是进行了一系列的消融实验,以验证不同的训练方法和模型架构,是否真能提升Pix2NeRF的效果。例如,针对模型去掉GAN逆映射、自动编码器,或不采用warmup针对学习率进行预热等,再尝试生成新视角的人脸:
其中,GAN逆映射(inversion)的目的是将给定的图像反转回预先训练的GAN模型的潜在空间中,以便生成器从反转代码中重建图像。
实验显示,除了完整模型(fullmodel)以外,去掉各种方法的模型,生成人脸的效果都不够好。随后,作者们又将生成照片的效果与其他生成新视图的AI模型进行了对比。
结果表明,虽然Pix2NeRF在ShapeNetSRN的生成效果上没有PixelNeRF好,但效果也比较接近:
而在CelebA和CARLA数据集上,Pix2NeRF基本都取得了最好的效果。
而且模型还自带一些美颜功能,即使是糊图送进去,也能给GAN出更丝滑的轮廓:
整体而言,除了人脸能生成不同角度的新视图以外,物体还能脑补出360下不同姿态的效果:
看来,AI也和人类一样,学会脑补没见过的物体形状了。作者介绍
这次论文的作者均来自苏黎世联邦理工学院(ETH)。
论文一作ShengquCai,ETH硕士研究生,本科毕业于伦敦国王学院,研究方向是神经渲染、生成模型和无监督学习等,高中毕业于辽宁省实验中学。
AntonObukhov,ETH博士生,此前曾在英伟达等公司工作,研究方向是计算机视觉和机器学习。
DengxinDai,马普所高级研究员和ETH(外部)讲师,研究方向是自动驾驶、传感器融合和有限监督下的目标检测。
LucVanGool,ETH计算机视觉教授,谷歌学术上的引用量达到15w,研究方向主要是2D和3D物体识别、机器人视觉和光流等。
目前这项研究的代码还在准备中。
感兴趣的小伙伴可以蹲一波了
论文地址:
https:arxiv。orgabs2202。13162
项目地址:
https:github。comsxyupixelnerf
参考链接:
〔1〕https:arxiv。orgpdf2102。03285。pdf
〔2〕https:arxiv。orgpdf2012。02190。pdf
〔3〕https:www。mpiinf。mpg。dedepartmentscomputervisionandmachinelearning
〔4〕https:www。linkedin。cominshengqucai818230185
狗喂不饱,人讨不好!(太现实)狗喂不饱,是因为狗生来就是直肠子。人讨不好,是因为缘此生早已注定好。有些人,无论你对他多么好,他都觉得不够;有些情,无论你吃多少苦,都得不到在乎。人生来高贵,……
文摘语言的力量源自哪里1。如果你渴望成为一个善于交谈的人,首先必须乐于善于阅读。2。语言的提升是一个不断训练的过程,而这个过程需要毅力,更需要勇气。3。要成为一个演说家或一个健谈者,只能……
团场捡棉花的难忘经历上世纪80年代的时候,我的学生时代是在新疆最西边的农五师83团渡过的,现在稍稍改了下名,全称是新疆生产建设兵团第五师八十三团,位于博州境内,也就是鸡尾巴那儿。我上中学时学……
学着做一个安静的看客随风潜入夜,润物细无声,慢慢喜欢上了这般的春雨,安静,无一丝喧嚣,却轻轻地润泽了天地万物,成就了一片一片姹紫嫣红。绯红的桃花浓烈,纯白的梨花清浅,杏花疏影里,宜吹笛,慢慢……
野人152坎离山寻亲途中,齐莽寻亲小分队遭遇危险的堰塞湖齐莽、爷孩、赫力和哈丽四人坎离山寻亲小分队,在乾坤山送行宴后就踏上了去坎离山的征程。第二天,齐莽一行四人被一道浩浩大水阻挡住了去路。天然堰塞湖挡住了去路齐莽站在岸边……
现在的年轻人,好无奈好心酸大家好,在这个世上生活了二十六载,上学上了二十多年,工作了四年,到现在仍然是一无所有,穷困潦倒。相信很多年轻人都会有这种感受,要面对很多问题,非常有压力,就拿现在结婚三件……
在孤独中,成为更好的自己在孤独中,成为更好的自己每个人都会有孤独的时候,那些无人问津的时光,那些触手可及的孤单,都是在磨练你,某一刻,当你静下来聆听心中的声音时,你会发现,世界远远比你想象的辽阔……
十幅画,藏着10首诗词,你能猜出几首?提到诗词,最不能分开的就是画了。诗情画意,大抵如此。1。hr停车坐爱枫林晚,霜叶红于二月花。杜牧《山行》2。hr春潮带雨晚来急,野渡无人舟自横。韦应物《……
今日重阳愿我爱的人,被时光温柔以待重阳节今天是10月25日,农历庚子年九月初九,重阳节。独在异乡为异客,每逢佳节倍思亲。遥知兄弟登高处,遍插茱萸少一人。这是王维的《九月九日忆山东兄弟》……
孙键老师致阳明先生,中华大地后继有人心和青少年商学院国内研学问道王阳明贵州站。此行来到修文县,踏入贵州龙场,拉近与圣人的距离,除了感受多彩贵州的魅力外,王阳明先生更是同学们问道研学的重要对象。十年小米……
今天,你周围的客观环境有没有奴役了你的主观抉择?让我们超越边界吧。为了人们能做自己,为了社会能更自由。用大胆的创意、精准的核算、深入的考究去超越壁垒,去发现远方的景色吧!天网查是国内规模最大、覆盖面最广的数……
王琳的爱情保卫战,她给方磊留有一线生机,爱情从戏里发展到戏外人生的路,有时需要一段一段地走,看似完了,却在另一段开了头,仍可继续走下去,正所谓柳暗花明又村,便是如此。一段爱情也如此,看似结束了,也许才刚刚开始。人生如棋,步步皆招,每一个……
理发记一直想给小刘同志剪个很潮的发型,但每次去理发店剪得都不尽我意。我决定给小刘同志换个造型。在做出这个决定之前,我做出了个更大的决定,那就是这个造型得由我亲自抄刀。跟同事取经后,我……
拥有你们,我很幸福今年的冬天真冷,哪里也不想去,只想傻呆呆的窝在被窝里,我发现人只要一闲下来,脑袋就会胡思乱想,但是想的更多的还是回忆吧!这么多年,我一直想追寻一份属于我的幸福……
教師節。今日係教師節。不過我哋琴日都已經番咗學校探老師啦。好多人啊。大概1點左右。成間小學都霸滿曬人。有育材嘅。東環。21。16。7中。培正。沙東。廣附之類嘅。好鬼多……
傲慢与偏见刚刚看完了简。奥斯汀的《傲慢与偏见》小说初中的时候就看过两遍了电影也很不错没有让我失望我觉得很美好很美好伊丽莎白和mr。达西特别的美好即使是……
媳妇我很爱你媳妇别总是以为一个人也可以很快乐,只不过是在心里安慰自己罢了。终究还是需要一个伴,无论朋友还是爱人。媳妇我以为现在可以什么都不用想的去和你在一起,什么都不做就可以一直陪伴……
一起走过的日子(十三)张天师同桌每当听到《我是一只小小鸟》。那个消瘦,穿着已经褪色发白的牛仔裤,一副流浪者的形象的他总浮现眼前。去年赛事很多,那首歌播放很泛滥,我的思念也更沉。我是在高中……
姐姐昨晚(12年1月9日晚7点半过后)我女儿到我房间里来玩,我和儿子倒在床头看电视,儿子一见自己的姐姐,就呜啦呜啦说着鸟语,还咯咯的笑,我就对他说,喊一下姐姐,不过我也没指望从这小……
感恩20年写在前面本来是打算送别人东西的结果发现超出了10元于是自作聪明以为开一个月的黄钻可以省不少顺便可以把自己的也布置一下不过腾讯的便宜似乎没这么……
浪迹天涯这一趟的海南之旅对我来说,实在是一次最为悲惨的旅行。由于过度疲累,我在返湛途中,就喉咙疼痛,全身冒冷汗,一回到湛江,立即转为感冒,紧接着发烧,外面那么高的温度,那么大的太阳,我……
我不曾离开我在我的世界里徘徊把对你的心深深掩埋想再次牵起你的手你却已远走感觉不到手心里你残留的温柔天仍旧在哭雨依然在下你不需要再彷徨害怕……
散文父母在不失联余平我在一家金融公司工作,这段日子公司业务很多,我也异常忙碌,有时候连工作餐都顾不得吃了。辛辛苦苦上了五天班,只有双休日可以好好地休息一下。可我的交际非常广泛,微信朋友圈……
不想干什么,就不干什么今天的心情跌宕起伏。你有试过当一堆的事情忙不过来,感觉委屈,忍不住流泪,但处于公共场合,羞愧不敢落泪,任流泪在流泪在眼眶打转的时候吗?这时候,你会怎么做?我假装若无其事,……