16. 新建文件夹:扩散模型(3/3)
抛开到底谁更强这件说不清的事不谈,单从大家争论的这些内容就能看出,ai绘画的能力确实进步得非常之快。
“平心而论,在ai生成这件事情上,gan生成式方法是让大家走了弯路的。”
虽然孟繁岐的gan生成式办法在学界广受好评,建立起了很高的学术声誉和知名度,faegan的假脸生成效果也颇为惊艳,但最终真正让ai制图火起来的还是扩散模型。
“gan办法生成对抗的模式固然让人感到惊为天人,但两个网络彼此对抗学习,毕竟还是非常麻烦的事情。”孟繁岐思忖了一下,现在的大难题,数据是一方面,计算设备则是另一方面。
本来自己提前发布技术,显卡就已经很不够用了。目前用gan去针对某一个特定的事物,比如faegan只做人脸还是比较可以的,但想要从文本直接生成,那难度可就大了。
扩散模型的原理其实并不难,主要是通过对照片添加噪声,然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片,然后一步一步的减少噪声直到生成预期图片。
代码写起来不是那么困难,不过若是写成论文,琢磨其中的原理,那里面的数理逻辑和推导,够孟繁岐喝一壶的。
“数学这方面这两天找韩辞和付院长他们帮帮忙吧,好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下,这两位都算是我的导师。”涉及数学问题,找数学专业人才自然放心。
李飞飞和辛顿虽然不是数学出身,但李飞飞有物理背景,辛顿更是领域内教父,两者在这方面实力想必也很强。
新建了文件夹,孟繁岐刚准备开始工作,却隐约感觉哪里不对,自己好像遗忘了什么事情。
半晌才想起来,自己的倒霉室友唐璜今天要到斯坦福附近来。
“这大半年过的,差点忘记我自己还是个学生了。”
高强度研发了三四个月的孟繁岐,感觉时间好像已经过去了一年多。
正好唐璜来了,就给自己放几天假吧,来了也有几周了,却一直没有好好逛过斯坦福的校园。
inf。inf