162. 网络的重参数化(2/3)
片去判断其中距离的远近,实在太过容易,可这对人工智能视觉算法来说,不是一件容易的事情。
以现在的技术条件,需要进行非常复杂的标注,去分析样例图片中各个部位和像素的距离远近。
因为图片毕竟是2d平面的,而自动驾驶是一个需要掌握好空间距离的任务。
通过大量不同角度的平面图片,来重构一个三维的空间,甚至鸟瞰视角的三维空间是必要的。
不过现在这还只是空中楼阁,马斯克再次联系孟繁岐的来意非常简单,就是希望这个作为骨干的神经网络可以再快一点,或者计算量再小一点。
否则以目前的情况看,特斯拉很难负担得起这个运算量。
实际上,马斯克没有对这件事情抱有特别大的希望。在他看来,孟繁岐上次给出的方案已经好到非常离谱了。
在这个大家才刚开始复现dre,还没把残差的原理和一些变种搞明白的时间点,孟繁岐已经针对各种不同平台的其他运算设备,做了相当多的实验。
从而通过优化算子结构,调整特定计算过程的方式,将这个核心的骨干网络参数量减少了接近十倍。
运算快了这么多,性能却没什么变化,这已经非常不得了了。
马斯克有这一问,也是私下里的随口一提。
但他名头太大,以往自己做的事情又太疯狂,导致孟繁岐听着他那颇为低沉,有磁性的声音之时,当了真。
还真以为这是个非常严肃认真的需求。
“自动驾驶的热度确实也快起来了,我专门针对这方面做点优化工作,也不算亏。”
孟繁岐一边利用着重生优势开始抄底一些车企的股票,一边开始着手实现一个巧妙的加速并且节省内存的方式。
这个新的优化办法叫做网络结构的重参数化。
这半年来,视觉方法性能的突飞猛进来自于孟繁岐提出的残差方法,也就是将y&nbp;=&nbp;f(x)变为&nbp;y&nbp;=&nbp;f(x)+&nbp;x。
这里的写法比较简便,将一系列复杂的操作,抽象归纳为f(),在实际运算过程中,这个f()还是比较复杂的,往往需要算上好一会。
但在计算的时候,就有一个问题了,原本y&nbp;=&nbp;f(x)运算开始的时候,就不再需要继续存储x这个变量了,因为它已经在参与f(x)的运算。
在运算过程当中,它会变成其他的中间变量,然后最终变为我们所
本章未完,点击下一页继续阅读。