EMBA课程动向

杨强:人工智能的技术风口与商业风口
  • 日期 28.02.2017
  • 地点

资本积累时代结束,技术创新时代到来,香港科大EMBA课程为学生们准备了由港科大教授带来的系列科技讲座,包括新材料、人工智能、生命科学等等主题,帮助学员掌握最新科研发展趋势。


/files/yangqiang1.jpg

部分内容转载自第四范式

人工智能在今年火起来之后,不管是科技巨头还是创业公司,都希望在红利期抓住机会。

产业链最上游是计算处理及信息储存的芯片巨头,像英特尔、NVIDIA等公司,提供计算处理能力及相关解决方案,他们决定了人工智能发展的深度。大数据产业链中的原始数据获取方,包括运营商、BAT、微软、谷歌等把持互联网入口的公司,它们掌握着机器学习必须的数据资源,决定了人工智能发展的广度。

面对科技公司们对于人工智能市场的迅速布局,杨强教授与我们分享了自己在人工智能产业推广上的经验,并预判了人工智能即将爆发的技术风口与商业风口。

人工智能为我们带来了什么?

在AlphaGo的搜索中,Deepmind团队引入了一个新概念——即用深度学习和强化学习的结合来做两种任务的判别,即来判别现在所在的棋盘是好是坏,同时来预测未来有利的走向。讲到这里大家应该能看出AlphaGo的算法和未来商业模式的关联,即:通过对大数据的分析,让我们对“现在状态”有了一个靠谱的理解;同时,下围棋中的一步,可以理解成对未来走向的预判,在商业活动中,这可以是营销活动中的下一步。这里很重要的一点,是区分我们商业行为中的两个任务,即对现实的判断和对商业未来走向的预估

杨强教授认为,人工智能要取得成功应当具备五个必要条件,即高质量的大数据、清晰的边界条件、积极的外部反馈机制、计算资源以及跨界数据科学家,这五个条件将成为推进人工智能长足发展的动力源泉。 

/files/yangqiang_jpg1.jpg

这样的一个流程是AlphaGo设计团队所走过的路。不妨把这些步骤记下来,变成一个workflow,看看其他领域是不是可以重复AlphaGo的成功。

人工智能的技术风口

我们大家会关心的一个问题, 是人工智能的技术在哪些方向可能会有大的突破。

深度学习

/files/yangqiang_jpg2.jpg

首先,是深度学习会继续发展。这里的发展不仅是在层次的增加,还包括深度学习的可解释性、以及对深度学习所获的的结论的自我因果表达。例如,如何把非结构化的数据作为原始数据,训练出一个统计模型,再把这个模型变成某种知识的表达——这是一种表示学习。这种技术对于非结构化数据,尤其对于自然语言里面的知识学习,是很有帮助的。另外,深度学习模型的结构设计是深度学习的一个难点。这些结构在今天都是非常需要由人来设计的。

迁移学习

给定一个深度学习的网络,比如一个encoder网络和一个decoder网络,我们可以看它学习和迁移的过程,作为新的数据来训练另外一个可解释的模型,也可以作为一个新的迁移学习算法的输出。即一个学生A在观察另外一个学生B学习,A的目的是学习B的学习方法,B就不断地在学新的领域,每换一个领域就为A提供一个新的数据样本,A利用这些新的样本就能学会在领域之间做迁移。所以这种过程叫做观察网络。有了这种一边学习、一边学习学习方法的算法,就可以在机器学习的过程中,学会迁移的方法。

自然语言的表示学习与机器阅读

表示学习是当数据和任务没有直接相关时也可以学,一个重要的例子叫做self-taught learning,即我们通过很多supervise的数据、图像,可以学出一种最好的表达。用这个表达加上任务,就可以很快地学会这种知识表示。这时非结构化的数据就相当有用了。比如,给出一段话让机器去阅读,机器学习可以自动地发现一些值得关注的点。比如,给定一个文章中的实体和一个未知变量有这样的关系,然后用户可以问你这个未知变量是什么。能够达到这样的效果是因为深度模型已经具有了一种关注,这种关注是可以通过观众的学习(Attention)来表达。其结果就好像我们一目了然地看了一本书,我们会把关键词和它们的关系抓取出来。这实际上是利用类似人的一种直觉来进行学习。

人机对话系统

应该说有一个领域已经发展到了临界点,就是人机对话系统领域。现在在这个领域,某些相对垂直的方面已经收取了足够多的数据,一个是客服,一个是汽车(车内的人车对话);还有一种是特定场景的特定任务,像Amazon Echo,你可以跟它讲话,可以说“你给我放个歌吧”或者“你播一下新闻”,Amazon Echo里面是围了一圈的8个麦克风,这个阵列可以探测到人是否在和它说话,比如我和别人说话的时候,脸转过去,它就不会有反应。这种唤醒功能是非常准确的。它的另外一个功能是当你的双手没办法去控制手机的时候,可以用语音来控制,案例场景是客厅和厨房,在美国Amazon Echo特别受家庭主妇的欢迎,所以像这种特定的场景,如果收集了足够的数据,是可以训练出这样强大的对话系统来的。

强化迁移学习

我们可以想象,未来深度学习、强化学习和迁移学习的结合,可以实现以下几个突破——反馈可以延迟、可以个性化,把一个通用模型施加到任何个体上面,这样一个复合模型可以叫做强化迁移学习模型

人工智能的可靠性模型

AI as Reliable Services是AAAI 前主席Thomas Dietterich在AAAI 2016上给出的一个主题,人工智能只能作为一些例证证明能够做哪些事情,比如下棋,无人驾驶,但很多时候它还是不可靠的。它不像现在的一个商用软件一样,能让你放心地去使用,以保证它的错误率肯定不会超过很小的比例。相反,AI 在犯错的时候可能错得非常厉害,所以用平均值来代表一个准确率是不恰当的,相反,应该更多地要考虑它的置信区间。换言之,小白用户拿一些人工智能的模块来搭一个系统,这个系统就应该能被搭出来,而且它的效果应该是在一个固定的范围以内的,所以人工智能应该像软件工程一样做出来。

/files/yangqiang_jpg3.jpg

人工智能的商业应用

 

我们刚才列举了AI 成功的5大必要条件,满足这五个条件的领域,才有可能在未来出现人工智能的爆发。

智能客服

人机交互的智能客服,产生了很多外界公开的数据以及内部的数据、知识库等,都可以用来制造机器人。尤其是可以用客服过去的数据来做训练,这个数据量现在在垂直领域是逐渐在增加的。现在的对话系统也已经逐渐成为深度学习和强化学习的焦点。

新闻领域

另外一个比较看好的领域是新闻领域,新闻的分发和自动写作。有很多编辑、解说、自动校对、作家等,其实是数据量足够多的,有这么多的文本,而且外界反馈也越来越多了。给一篇文章,可以用机器学习来做自动摘要。 这样一个工作的外部反馈来自哪里呢?实际上我们写的那些paper就是一个外部反馈,因为每篇paper都有摘要,如果一篇paper被收了,就说明摘要写的还不错,所以外部反馈还是可以实现的。

这里分享一个有趣的实验,是香港科大同学做的“自动写小说”项目。主要有两个步骤,一步是让它读很多书,一步是这样训练出一个模型,这个模型再让它变成一个生成式的模型,这样就能用来写小说了。举个例子,我们提供《射雕英雄传》和《笑傲江湖》,把这两个结合起来,就可以写一部新的小说了。

特定任务的智能机器人

例如Amazon 的KIVA机器人,大家可能知道Amazon一个很大的优势就是所有的仓储都是由机器人来完成的,但是它也有工人,被雇来用手做抓取,因为现在机器人的抓取是非常难的,那么人和机器的优点就结合起来了。此外,医疗机器人也是非常专业的一个领域,它可以给人开刀缝线,但它不是自动的,而是通过远程控制的,但控制的精密度非常高,如果它收集到足够量的数据,是可以达到自动的效果的,以后我们可能开刀就由机器人来代劳了。

医护领域

无障碍辅助的应用领域痛点特别强烈,现在数据量可能还不是特别多,因为毕竟这一群体还是少数人,但是痛点很强,所以未来也许会有数据。

AI+有机食品

我们在香港曾去访问过一个有机食品工厂,这个实验室里的每一株菜,周边的所有环境全都记录起来,比如湿度、温度、光照,然后就可以收集这样的数据训练一个机器学习的模型,最后用这个模型来做蔬菜。所以得来的蔬菜滋味可以控制,要脆感还是要甜的,都可以通过模型学习出来。

FINTECH智能投顾

最后来说一说金融,其实金融是一个非常好的领域,第四范式在金融领域也积累了很多成功案例。金融领域里的任务都是非常清楚的,而且每个任务的数据都有痕迹、有数据足迹,数据的维度也是多维度的数据,有外界的、也有内界的,非结构数据比较多,例如文本和报告。数据也是形成了孤岛,链条也非常长,并且链条里面都有衔接。

在金融领域现在美国比较时髦的一个概念叫投研、投顾和投资。投研是说研究整个市场的基本面,就好像我们研究舆情分析一样,但舆情只是其中的一部分;投顾是说在美国的银行给很多客户做理财分析,然后做理财的配置,这些工作可以由机器人来做;投资是说机器人自己就是一个客户,它可以去投资。

人工智能必然将为人类带来全新智能革命,就像19世纪的工业革命。作为投资者或者企业家,都应该密切关注技术层的进展,以及应用层的爆发口

Back

课程內容

16个月的课程展现一张完整清晰的学习蓝图。

了解更多

课程师资

国际化的教授团队拥有丰富的教学及实践经验,他们与著名企业合作,掌握市场的最新发展,传授国际营商最前瞻的知识和经验。

了解更多

环球游学

3大洲环球游学模块,带领学员走访亚洲、美洲及欧洲。

了解更多