比如,在我们的计算架构上面,现在还是需要时间去做算法的改进提升,需要去研究如何部署云端架构,另外深度学习用时仍太长,这些还都是需要探索的内容,而且并没有一个标准化的答案。
另外,算法框架也非常重要。我们可以看到有一些重要技术的推进,实际上是因为有了开源或者API或者标准的出现,但现在仍有很多方面还没有出现相关标准。当然我们知道Google的TensorFlow等提供了一些开源的方法,但是其实他们还没有真正的平台化,比如你把TensorFlow丢给一个没学过机器学习的人,哪怕是清华大学顶尖的计算机系学生,他也很难用其创造价值。如果清华的学生都不能,那它的普及性就有问题了。
为什么iOS、安卓能够做的很好,就是因为它产生了平台化效应,使得很多人能够比较容易的介入。然后我们可以看到像Hadoop这样七八年前很多人觉得很高深的东西现在也慢慢变得平台化了。今天,如何使得整个机器学习的体系平台化,以便于让更多的非专业人士能够使用,这个是目前面临的一个很大的瓶颈,需要一定的发展时间才能得以突破。
在一些领域中,很多技术性问题可以在两三年内得到解决,但是还有很多问题并非如此简单,比如说语义。我们说语音识别是相对简单的:音进来,字出去,这个非常明确,一个API就可以调动。但是音进来,确定是何种情境的语义出去就很难。这些我觉得两三年远远还不够,还需要更多的时间去理解。
传感器一定程度来说是价格的问题、如何普及的问题。现在我们看到Google Car虽然做的很牛,但是正如驭势科技的吴甘沙说的,Google Car实际商业化的一个巨大瓶颈就是价位的问题:传感器实在太贵了。因此要把这件事做下来就是一个鸡和蛋的问题——降低价格就需要量,但量怎么起来?价格不下去量也起不来。要解决这个问题也需要一定的时间。
最后还有很多机械方面的问题。控制机械运动的算法,硬件运动后给出的回馈等等在机械部门也还需要一些开发。
整体来说,虽然我认为机器学习、深度学习在突破人类的精确度方面已经做的非常好,但是以上几个领域还是需要一些时间才能取得突破。但是这一天肯定是会来临的,我们怎么知道会来临呢?
Google的野心
我们知道,不久前Google重新组织了公司架构,将搜索业务和其他前沿项目子公司都放进了控股公司Alphabet公司。很多分析师说,Google把搜索和其他的业务分开来做Alphabet,是为了优化它的股价,其实这种说法太表面了,他们没有了解一个真正有野心的公司在做什么。
一定程度上,Google之所以成立了Alphabet,是因为Google经过搜索和广告业务的积累,逐步发展了一套我们可以简称为GoogleBrain的模式。Google Brain其实就是机器学习的大脑,这个机器包括了平台也包括了专家,如果它用在搜索领域就是一个搜索引擎,如果它能够用在医学领域,那它可能就是一个癌症诊断系统,它也可以用于人类寿命的延续以及智能家电等各种不同领域。所以Google的野心就是把机器学习作为一个核心,然后用它去解决非计算机非互联网领域的各种问题。
当然它现在还不是一个整体平台,但Google 就会找一些极聪明的人来进军这些领域,有平台的用平台,平台未成形的就用聪明才智来想办法。现在看来,Google这种模式也做成了很多有意义的事情。所以,对于Google,我们千万不要低估了它的能力,因为这家公司可能是未来推动人工智能平台化的最大力量。
怎么证明这是真的呢?从最近Jeff Dean演讲的一张图我们就可以看到Google内部有多少项目在用深度学习。
Google内部对深度学习的大量应用