笔趣阁

手机浏览器扫描二维码访问

338 无标签图像时代 合(第2页)

“你们先别急着惊讶,我们理性一点思考这个问题。”孟繁岐知道现在的视觉领域还没有什么特别成功的案例可以直接利用不加标注的图像。但在自然语言领域,是已经有了类似成果的,c1oseaI自己就做了很多研究:“你们想一下,gpT系列的时候,我们那么多无标签的文本是怎么利用的。”

“那就是重构任务呗,在数据上挖洞让模型尝试复原。但你自己也说了,文本的信息密度大,就算挖洞模型的噪声也很小。这一点图像方面肯定很不一样的。”c1oseaI在做gpT系列的时候经常给句子挖洞,通常是2o个词挖掉1到2个,让模型根据上下文去猜测缺失的词汇是什么。

通过这种方式提升模型的语言能力,不需要给文本本身进行任何的标注,是一种非常低成本的数据利用方式。

毕竟这个世界上没有标签的数据占了绝大多数。

而现在,孟繁岐的意思很明确了,那就是图像上同样可以做类似的事情。

在任意图片上进行类似的挖孔遮挡操作,然后将重构出原本的图片作为模型的训练目标。

这么做的话,利用这些图片也就不需要进行任何操作了,不需要标签即可利用数据。

又或者说,这些图片本身就是它们的标签。

“我觉得这个思路不大对,图片相比文本本身信息密度就低很多了。如果模型要完全预测对原本的图像的话。。。那肯定就要浪费大量容量去模拟那些根本不重要的区域。这个学习的目标显然是有问题的。”c1oseaI内部的讨论风气还是非常优异的。

大家并没有因为孟繁岐老板加领域领军人物的身份就盲目地相信他。

即便孟繁岐已经多次证明了自己的预判总是那么准确,但面对反直觉的思路,大家基本上都会据理力争。

“你的说法有一定道理,如果我只遮挡非常少部分的图像,比如1成左右,那这个重构图像的过程就很容易陷入完美模拟原图的陷阱当中。实际上我们根本不需要模型有这么强大的能力,既然如此,为什么不干脆选择一个模型没法重构出原图的情景去训练呢?”

孟繁岐这里说的东西就涉及到制图aI的本质了。

假设现在有一张图片,它的内容是一瓶可乐。

人们需要的制图aI,是能够画出基本相似内容的,而非是要百分百复刻原图。

如果这个aI把可乐瓶身上,编号、生产日期等乱七八糟的东西全复原了,其实它就已经落入了孟繁岐所说的【完美模拟原图的陷阱】当中。

对于制图aI来说,有些东西是要学的,而有些东西是没用的。

这两者怎么区分,其实人类自己也很难说出个所以然出来。

孟繁岐给出的办法是:“给定一个模型一定没法重构出原图的场景去训练。”

说白了就是压根就没想让模型完全恢复原图。

还是那瓶可乐的例子,如果遮住了瓶盖,这个场景aI能够重构出原图。

举个极端的例子,若是桌上整个可乐都被遮掉了,aI又如何能从余下的像素当中,非要判断这里应该有一瓶可乐呢?

那就没道理了。

孟繁岐认为,在这样高难度的情况下,aI模型能学到的东西是比较重要的,学不到的东西不去勉强。

“这个思路。。。稍微有些东西。我们都知道,相比高频信号而言,神经网络更擅长抓住低频的信号。而高频的内容基本是局部细节,低频更多的是全局的轮廓等内容。”有人觉得虽然现在文本生成图像的效果不佳,但主要是细节上太异常了,让人看了觉得很离谱。

大致轮廓上还是比较合理的,或许按照孟繁岐的方式能够淡化这方面的问题。

“你们仔细想想,和T方法其实是一个道理。凭什么T方法在语言领域一统江湖了,视觉领域却还是大家自己玩自己的?一套视觉T方法不是照样能够统一视觉任务吗?”

“同理,为什么语言领域的无标签预训练已经可以使用相同的模型了,视觉领域却不能使用相同的方法来利用这些没有标注的图像呢?”

“我觉得无非是两个原因,一是以前各种网络结构不统一,传统的卷积神经网络太不灵活。这个问题已经被我们用视觉T方法解决了。”

“二,图像信息密度太低,挖孔少了模型就偷懒,很容易过分地拟合一些不必要的细节。这点我们刚刚讨论了,加大这个比例可以更好地学到高层级的抽象特征。”

孟繁岐侃侃而谈,这一套操作与残差思想相同,都是前世kaiming主导的研究。

kaiming出品,突出的就是一个大道至简,简介简单却又扎实好用。

“你们猜猜重构出一张照片需要原本百分之多少的像素?”孟繁岐提出了这样一个疑问。

在自然语言领域,这个比例大概是百分之9o左右。

必须要9成左右的文字,才能够比较合理地补全余下的部分。

“七成?”

“五成吧?”

大家都清楚图像的语义更加稀疏,因而大幅度地减少了这个比例。

“我的看法是,一成足够重建,三成可以重建得非常接近。”孟繁岐的这个说法是当时maskedautoencoders(mae)这篇论文的实验结果。

在图片被遮挡百分之七十五左右的情况下,经过重构训练的模型几乎能够完全复原原本的图片内容。

当然了,这里是指基本的图像内容和含义。

在具体的细节纹理上面,肯定还是有一些差异的。

而在图片被遮挡了百分之九十五的情况下,重构模型仍旧能够复原出含义基本相同,内容有一定相关性的内容。

这在当时给了孟繁岐非常大的震撼。

如此夸张的数字,几乎是违背所有领域内研究人员直觉的。

而违背直觉的结论,往往是领域重大进步的开始。

“你们先别急着惊讶,我们理性一点思考这个问题。”孟繁岐知道现在的视觉领域还没有什么特别成功的案例可以直接利用不加标注的图像。但在自然语言领域,是已经有了类似成果的,c1oseaI自己就做了很多研究:“你们想一下,gpT系列的时候,我们那么多无标签的文本是怎么利用的。”

热门小说推荐
全员读心:豪门后妈娃综摆烂爆火

全员读心:豪门后妈娃综摆烂爆火

简介关于全员读心豪门后妈娃综摆烂爆火豪门后妈全员读心真香现场火葬场娃综+真假千金双胞胎宝宝不是亲生的!!!叶疏穿成了豪门双胞胎的后妈,一醒来就被婆婆找茬,被双胞胎嫌弃。她是书中的恶毒后妈,最后惨死,这不是倒霉蛋吗?更离谱的是,曾经厌弃她的五个哥哥和便宜老公好像都能听到她的心声叶疏带宝宝们上娃综,全网黑。别人带娃努力营业,露营做得井井有条,全网都在夸叶疏带着宝宝躺在小竹椅上看云卷云舒,告诉宝宝人生得意须尽欢,及时享乐及时活。宝宝们却听见她心声邀请亲人做飞行嘉宾参加综艺时别家和和美美,老公宠爱,婆婆疼惜,全网都在夸叶疏带着宝宝们和她的影帝大哥却对峙叶影帝,我家宝宝怕生,麻烦你们今天当厅长。影帝大哥气恼地想带着他宠爱多年的假千金炮轰,却听见叶疏的心声。和便宜老公的婚姻协议眼看到期了,叶疏欢天喜地找他离婚。俊美如神的老公眼微眯,撕碎离婚协议,将她亲吻低哄。...

如意风华

如意风华

简介关于如意风华前世,赵如意母死父残被亲奶奶卖到了锦城的藏春阁,及笄后成了花魁。几年后自赎自身跑到彭城做生意又遇到了渣男,最后被下毒致死。重生后的赵如意先就是要救下阿娘,不让阿爹致残,然后鼓动爹娘和阿奶分家析产,哪怕生活再辛苦,也要一家人在一起幸福的生活。裴孤城是炎国的武威侯世子,是宫中贤妃娘娘最欣赏的亲侄儿,也是锦城最受欢迎的好男儿。十七岁的时候裴孤城被人算计下药后,扔在了藏春阁最低贱且身体有疾的女子房中,他拼着最后一点意识打晕了那女子,跌跌撞撞地闯进了当年才十四岁的赵如意(也即花名叫问春)的房里。赵如意把他藏起来后,到老鸨房里偷了解药,并帮他联系了属下。裴孤城脱身之时给赵如意许诺,会在她及笄前赎她出去,可后来他因为家庭变故失信于人,再回到锦城时已是人事皆非。他帮赵如意脱身藏春阁后,为了躲避权力争斗又放下兵权到赵如意所在的彭城为官,渐渐的他喜欢上了赵如意,他甚至愿意就这样默默地守护着她在彭城过一辈子,可这个卑微的愿望随着赵如意的死亡终结了,那时他才知道自己的隐忍有多么可笑。当人生可以重来时,裴孤城的第一件事就是救赵如意出来,可藏春阁的老鸨居然说,她这里没这个人...

快穿之炮灰也有春天

快穿之炮灰也有春天

简介关于快穿之炮灰也有春天快穿之炮灰也有春天在某些小世界里面,总有一些炮灰不满意现在自己的人生,所以就在这个时候他们快穿炮灰组就出现了,他们要做的就是帮助炮灰实现他们的愿望,帮他们达成更好的人生完成他们的执念,好让这个小世界可以继续运行下去。想要报恩的儿子x想要维护家族荣耀的老太太儿子报恩,想要拿孙子和孙女当踏板石头,老太太直接把儿子过继出去,让他自己去报恩被哄骗的王妃x当王妃哪里有当皇太后好世界级明星被骗嫁到偏远小国,帮助国家打开知名度之后,老公翻脸不认人,我一朝让你直接失去皇位。被抱错的孩子x真千金的母亲上辈子认人不清,并没有及时认回自己的孩子,等到孩子去世之后,她才现里面的隐情,只希望这辈子有仇报仇,有冤报冤。...

剑如夕

剑如夕

简介关于剑如夕清朝末年,顾旸武功小成,为报十年前的家仇,阴差阳错卷入了义和团运动,并结识了侠女苏见黎。苏见黎是维新派官员的女儿,与顾旸是对手,更是战友。两年间,他们携手看遍了世道的狼藉,同时,顾旸还肩负着先师重振传统武学的嘱托。但面对凶猛的洋枪炮及大变革的全新时代,顾旸深感与现代文明碰撞的无力...

诸天:从四合院开始黑化

诸天:从四合院开始黑化

简介关于诸天从四合院开始黑化一个番茄扑街写手,意外得到高维生物明的系统,以四合院综合世界为主世界,成为行走诸天的雇佣兵,为达目的,无所不用其极,顶着各种马甲,在诸天留下自己的的传说!...

旅行青蛙:在漫威世界混日子

旅行青蛙:在漫威世界混日子

作品简介梅,如果我死了,请把我的骨灰洒在大海里里。为什么?因为我就算是死了,也要接着浪。这是一个注入了正能量的故事。...