人工智能和深度学习带来的变革
近日百度首席科学家吴恩达发表题为《深度学习与人工智能》的主题演讲,在演讲中,他表示,在深度学习发展的过程中,图像、语音、行为三个领域正在发生重大的创新。
其中,在图像识别和语音识别方面,教育领域已经有了广泛的应用,从层出不穷的搜题软件,到语音评测以及识别在考试等评测场景下的使用。现在,也有公司在探索人的行为,期望从学生的行为中,总结出某些共性的东西加以利用。
以下为吴恩达演讲摘要:
图像识别将开启无限可能
人脸识别:百度才在人脸识 别领域和其他领域比其他国际上领先的大公司要做得好。我们在人脸识别只有0.3几的错误率。
计算机系统对人脸的识别,比如针对安全的目的,还有保安的目的,这些在未来会越来越多的应用。
现在的图片识别技术已经可以很好的实现让计算机对一幅图片进行文字场景描述了。现在很多计算机的读图能力已经超过了人眼所见的信息,这些技术给我们开启了无限的可能。比如对服饰的识别和搜索、对老年人的看护等等,可能都是未来的空间。
在过去几年,具体来说大概三年的时间内,计算机图像的技术发展非常迅速,现在计算机在图像识别上,比更多年以前要做得好得多。现在很多计算机公司甚至比很多人脑眼睛一眼看上去了解的信息还多。
我们有一些想法、有一些产品,也有一些技术,我想说的是这些技术给我们开启了无限的可能,可以使我们来了解一下哪些产品领域是大有可为的。我们可以在图上了解一些相关的领域,比如百度还有其他的搜索引擎正在做的事情。我不知道一个非常清晰的路线图是怎样的,或者哪个领域会发展得更加迅速。
语音识别技术将更多地运用在人机交互中
在移动互联网方面,大家对互联网和手机的使用越来越多的结合起来。我们过去是用手机键盘来敲字,比较浪费时间,大家现在用话音来进行沟通,所以语音识别是一个非常重要的发展方向。
而大家现在普遍反应在手机上进行语音通信的时候,如果手机离得比较远的话效果不是很好,要比较近的时候语音识别才做得比较好。
我们在相关的IT技术方面也做一些探索,从传统领域来看,这是语音识别所做的事情,基本上所有做语音识别的公司都是使用非常复杂的管道。我们来改善它的话音系统,突出声音特征,有一些不同的模块,不的的模块组合起来识别这个人到底讲了什么。
在手机之外,我觉得我们的话音识别还会推动物联网的革命,从汽车界面到家用设备到可穿戴设备将会发生很多的改变。我在家里有5个遥控可以控制的东西,我想再过几年再回过头来看,我们会觉得这5个遥控太少了,比如你只是遥控电视,只是遥控空调,简直不够了,看来都是小儿科的东西。在几年的时间内,或者在未来几年,我们将能够和电视通话,和更多的家电通话,这将是未来面临的发展,我们将有很多的路由器内置到这些机器当中。
行为+大数据更好地促使机器运作
很多技术公司现在都能够获取到一些大数据来了解人们在互联网的环境当中究竟是什么样的行为,这是技术的发展。我们可以从这些数据当中挖掘更多的价值。正如很多人都知道的,我们百度的广告也是在人工智能方面下了很大的工夫,我们有很多数据搜集过来是关于人的行为的,而这些深度学习可以使我们了解人们的行为是什么样的,他们倾向于做什么事情,他们喜欢做什么事情。
因为我们的数据中心还有很多数据搜集起来,使我们了解不仅仅是人的行为,还有机器人行为。今天的深度学习确实是一个非常强大的工具,使我们可以了解机器在做什么,来更好地管理数据中心。比如我们可以使用这方面我们了解的信息来更好地使机器运作。我们也可以更好地了解计算机是如何工作的,我们还可以使用深度学习来提高计算机的安全性。
这是我们百度正在做的事情,我们觉得很多行为数据给我们带来的机会,包括人的行为,包括机器的行为。
在15年前,我们有这张图,我们有这个想法,这就是AI人工智能的良性循环。那时候我们如果 能够构造优秀的产品可以吸引更多的用户,有了更多的用户就可以获得更加大量的数据。