55fs2.chuandong.com/upload/files/20180709/ed2ec60aaf8a973d.pdf55 电 近两年来,ai...

3

Upload: others

Post on 29-Dec-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

55机器人与应用技术

近两年来,AI 的发展火爆,从技术上来看,自 1956 年

就有了神经网络,中间经过两次波峰、波谷。上世纪 90 年代,

基于AI的机器学习快速发展,目前整个产业有将近3亿的规模。

整个 AI 规模发展上有三个重要的点,第一是算力突破。前两

次机器学习因为算力不足,有两次大的波峰、波谷。大的神经

网络有 100 多层,GPU 跑要一周,CPU 跑要十几年;在二十

年前这样模型系统的算力是支撑不了的。这几年 , 算力的发展

为整个智能领域的发展奠定了非常好的基础。第二是算法理论

的突破,第三是数据突破。移动和互联网的发展使得数据规模

指数呈倍数增长,而不只是翻倍。现在我们有上亿用户,每天

有几百万、上千万的交互数据,这样一个数据规模使得我们的

神经网络模型训练和未来的技术突破有了非常好的基础。

AI 在整个行业有非常大的发展机会,对于手机而言到底

意味着什么?手机从功能机到智能机,对我们生活产生非常大

的影响。这些影响体现在几个方面。以前的功能机是用手机打

电话、发短信。而智能机,可以用来上网、社交、听音乐、拍

照片、拍视频、分享,重新定义了手机面向用户的交互体验。

从原来被动地接受用户打电话,变成更主动的服务,更自然地

跟用户交互和基于用户个性化体验的交互。

现在苹果语音助手 Siri 已经非常普及,华为的语音助手小

易,也实现了基于 AI 的自然交互。在这样的技术背景下,整

个手机定位发生非常大的变化。手机主动与物理世界发生交换

和互动,手机与人的关系从被动响应到双向交互。手机从原来

华为终端手机智慧业务和技术开发

华为手机主打 Mobiel AI 战略,在 2017 年发布业界第一个带神经网络手机,整个手机 AI 的策略和协同都是由

整套体系架构来保证的。HiAI 是面向移动终端的 AI 开放平台 , 构建三层 AI 开放生态:服务能力开放、应用能力开放

和芯片能力开放。端、芯、云结合的三层开放平台为用户和开发者带来更多的非凡体验。本文整理自华为终端 BG 智

慧工程系统部部长卢惠莉的演讲稿。

的工具变成人的助手,这个助手从原来被动的响应和接受人的

交互,变成了它知道很多你所不知道的,因为它背后有强大的

互联网。它也可以记录很多你曾经经历但不曾记得的,比如十

年前的照片等,它都可以帮你记录下来。在这样的前提下,手

机的功能会发生越来越大的转变,手机的角色也会发生越来越

大的转变,大家的很多信息,比如照片、语音、短信都在手机

里面,有一天它可能成为你的一部分。我们追求的是整个 AI

成为个人的生活助手,现在有人脸识别,情绪识别,未来对朋

友关系的识别, 心情 / 感情的识别,这些在未来都能够逐步实

现。

端侧的 AI 带来更好的服务,比如服务更贴心、体验更个性、

交互更自然。它也面临着实质性的问题,还有大量挑战,因为

当前大量模型都是在云端训练和在云端做推理,在手机上去跑

一个模型,手机上的容量和 Power 都非常有限,我们可以在

云上跑一个 1G 的模型,其实现在很多图像模型至少在百兆以

上,但在手机上,是无法跑一个超大的模型的;另一个是功耗

Power 有限,比如摄像头打开有很大的功耗,如果跑的时间过

长会导致手机过热、电源消耗快。大家不要小看人脸识别的模

型,因为安全性和性能的要求,人像识别类的模型大多是在端

侧的,这对端侧 AI 提出很大的要求和挑战;很多时候我们把

做好的模型通过压缩把它压到很小,让它的运行时间更短、功

耗更小。当然未来我们还有更多的交互模型会放在手机里。我

们大概有二三十个特性,有将近六七十个模型,设想将来有成

5756机器人与应用技术 机器人与应用技术

百上千个算法,模型手机就撑爆了。现在调一个模型还是有难

度的,大量的工作使得这个领域的门槛还是蛮高的,对能力的

要求就不用说了,但是我觉得现在的博士还是很强的,基本上

一个人能独当一面,所以现在这个时代还是很不错的,给我们

创造了非常好的人才供给,所以这两年 AI 的技术发展是非常

快的。

华为 HiAI 携手伙伴加速人工智能产业成熟熟 悉 华 为 在 端 侧 的 战 略 领 域 的 人 都 知 道, 去 年 华 为

Mate10 发布的时候,发布了麒麟 970 处理器的套片,也是业

界第一个发布带神经网络芯片的手机。华为终端智能(Mobile

AI)从芯到端到云是完整的一套体系架构。我们的模型有些在

端侧运行,有些在云端运行,整个的策略和协同都是由整套体

系架构来保证的。

这套体系架构整体分为三层。在最下面的芯片这层,开放

了 DDK 的接口,让合作伙伴可以用华为麒麟 970 的神经网络

芯片能力进行端侧模型的加速,这个模型在性能加速方面,单

模型可以做到 10-25 倍的加速,能耗比可以做到 25-50 倍的

能耗提升。

往上封装了 HiAI Engine,这是华为终端自有特性的算法

模型封装,行业创新公司可以基于华为包装的这层能力,不用

自己去做模型,也避免模型的重叠。最上面一层是云,通过云

提供大量三方原子化服务接入的生态。

HiAI Engine 提供的 ASR、CV、NLU 的能力叫感知能力。

除了感知之外,还要知道和理解用户想要做什么,也就是决策

系统和认知推理。知道用户的意图和目的,才能推荐更精准的

服务。比如说华为手机上收到一条快递的短信,在客户允许的

情况下,它能自动把这条短信识别出来,提醒用户有一个快递

到了,这就属于认知领域的范畴。

华为跟欧洲的一家公司合作,将他们的图像风格转换应用

在神经网络芯片上加速,整个处理性能大概提高了 300%,也

就是 3 倍以上,但是它在整个风格变换渲染过程中有很多传统

图像处理的阶段,所以真正算法的提升要比 3 倍还高。

在 HiAI Engine 开放方面,已经举办了八次公开课,这是

从合作伙伴那边收集来的需求,大家希望能够在 CV、ASR、

NLU 方面跟华为合作一些业务,包括直播和社交等等。

已经开放出来的将近 30 多个 AI 应用接口,包括人脸识

别、手势、人像分割,大家在华为接口都可以做二次分发。

跟随着这些接口,还发布一套 IDE,这套 IDE 可以直接集成

到 Android Studio。 开 放 的 API 接 口, 是 简 单 的 JSON 和

JAVA,两三行代码就可以实现,而且可以远程连接到华为手

机上模拟调测,即使用户手里没有华为手机也可以进行功能的

模拟和调测。

每一个功能都有示例代码,从代码里面可以形成自己的核

心代码,这是非常方便的,只要稍作修改,加上业务逻辑,就

可以快速地开发编译成一个 APP。

面向未来,手机跟大家的生活和工作越来越贴近,我们希

望在手机侧提供更多更好的 AI 的交互和服务,能够更快、更

简单地实现多赢,所以提供了一个开发者的平台。