EMBA課程動向

楊强:人工智能的技術風口與商業風口
  • 日期 28.02.2017
  • 地點

資本積累時代結束,技術創新時代到來,香港科大EMBA課程爲學生們準備了由港科大教授帶來的系列科技講座,包括新材料、人工智能、生命科學等等主題,幫助學員掌握最新科研發展趨勢。


/files/yangqiang1.jpg

部分內容轉載自第四範式

人工智能在今年火起來之後,不管是科技巨頭還是創業公司,都希望在紅利期抓住機會。

産業鏈最上游是計算處理及信息儲存的芯片巨頭,像英特爾、NVIDIA等公司,提供計算處理能力及相關解决方案,他們决定了人工智能發展的深度。大數據産業鏈中的原始數據獲取方,包括運營商、BAT、微軟、穀歌等把持互聯網入口的公司,它們掌握著機器學習必須的數據資源,决定了人工智能發展的廣度。

面對科技公司們對于人工智能市場的迅速布局,楊强教授與我們分享了自己在人工智能産業推廣上的經驗,幷預判了人工智能即將爆發的技術風口與商業風口。

人工智能爲我們帶來了什麽?

在AlphaGo的搜索中,Deepmind團隊引入了一個新概念——即用深度學習和强化學習的結合來做兩種任務的判別,即來判別現在所在的棋盤是好是壞,同時來預測未來有利的走向。講到這裏大家應該能看出AlphaGo的算法和未來商業模式的關聯,即:通過對大數據的分析,讓我們對“現在狀態”有了一個靠譜的理解;同時,下圍棋中的一步,可以理解成對未來走向的預判,在商業活動中,這可以是營銷活動中的下一步。這裏很重要的一點,是區分我們商業行爲中的兩個任務,即對現實的判斷和對商業未來走向的預估

楊强教授認爲,人工智能要取得成功應當具備五個必要條件,即高質量的大數據、清晰的邊界條件、積極的外部反饋機制、計算資源以及跨界數據科學家,這五個條件將成爲推進人工智能長足發展的動力源泉。 

/files/yangqiang_jpg1.jpg

這樣的一個流程是AlphaGo設計團隊所走過的路。不妨把這些步驟記下來,變成一個workflow,看看其他領域是不是可以重複AlphaGo的成功。

人工智能的技術風口

我們大家會關心的一個問題, 是人工智能的技術在哪些方向可能會有大的突破。

深度學習

/files/yangqiang_jpg2.jpg

首先,是深度學習會繼續發展。這裏的發展不僅是在層次的增加,還包括深度學習的可解釋性、以及對深度學習所獲的的結論的自我因果表達。例如,如何把非結構化的數據作爲原始數據,訓練出一個統計模型,再把這個模型變成某種知識的表達——這是一種表示學習。這種技術對于非結構化數據,尤其對于自然語言裏面的知識學習,是很有幫助的。另外,深度學習模型的結構設計是深度學習的一個難點。這些結構在今天都是非常需要由人來設計的。

遷移學習

給定一個深度學習的網絡,比如一個encoder網絡和一個decoder網絡,我們可以看它學習和遷移的過程,作爲新的數據來訓練另外一個可解釋的模型,也可以作爲一個新的遷移學習算法的輸出。即一個學生A在觀察另外一個學生B學習,A的目的是學習B的學習方法,B就不斷地在學新的領域,每換一個領域就爲A提供一個新的數據樣本,A利用這些新的樣本就能學會在領域之間做遷移。所以這種過程叫做觀察網絡。有了這種一邊學習、一邊學習學習方法的算法,就可以在機器學習的過程中,學會遷移的方法。

自然語言的表示學習與機器閱讀

表示學習是當數據和任務沒有直接相關時也可以學,一個重要的例子叫做self-taught learning,即我們通過很多supervise的數據、圖像,可以學出一種最好的表達。用這個表達加上任務,就可以很快地學會這種知識表示。這時非結構化的數據就相當有用了。比如,給出一段話讓機器去閱讀,機器學習可以自動地發現一些值得關注的點。比如,給定一個文章中的實體和一個未知變量有這樣的關係,然後用戶可以問你這個未知變量是什麽。能够達到這樣的效果是因爲深度模型已經具有了一種關注,這種關注是可以通過觀衆的學習(Attention)來表達。其結果就好像我們一目了然地看了一本書,我們會把關鍵詞和它們的關係抓取出來。這實際上是利用類似人的一種直覺來進行學習。

人機對話系統

應該說有一個領域已經發展到了臨界點,就是人機對話系統領域。現在在這個領域,某些相對垂直的方面已經收取了足够多的數據,一個是客服,一個是汽車(車內的人車對話);還有一種是特定場景的特定任務,像Amazon Echo,你可以跟它講話,可以說“你給我放個歌吧”或者“你播一下新聞”,Amazon Echo裏面是圍了一圈的8個麥克風,這個陣列可以探測到人是否在和它說話,比如我和別人說話的時候,臉轉過去,它就不會有反應。這種喚醒功能是非常準確的。它的另外一個功能是當你的雙手沒辦法去控制手機的時候,可以用語音來控制,案例場景是客廳和厨房,在美國Amazon Echo特別受家庭主婦的歡迎,所以像這種特定的場景,如果收集了足够的數據,是可以訓練出這樣强大的對話系統來的。

强化遷移學習

我們可以想像,未來深度學習、强化學習和遷移學習的結合,可以實現以下幾個突破——反饋可以延遲、可以個性化,把一個通用模型施加到任何個體上面,這樣一個複合模型可以叫做强化遷移學習模型

人工智能的可靠性模型

AI as Reliable Services是AAAI 前主席Thomas Dietterich在AAAI 2016上給出的一個主題,人工智能只能作爲一些例證證明能够做哪些事情,比如下棋,無人駕駛,但很多時候它還是不可靠的。它不像現在的一個商用軟件一樣,能讓你放心地去使用,以保證它的錯誤率肯定不會超過很小的比例。相反,AI 在犯錯的時候可能錯得非常厲害,所以用平均值來代表一個準確率是不恰當的,相反,應該更多地要考慮它的置信區間。換言之,小白用戶拿一些人工智能的模塊來搭一個系統,這個系統就應該能被搭出來,而且它的效果應該是在一個固定的範圍以內的,所以人工智能應該像軟件工程一樣做出來。

/files/yangqiang_jpg3.jpg

人工智能的商業應用

 

我們剛才列舉了AI 成功的5大必要條件,滿足這五個條件的領域,才有可能在未來出現人工智能的爆發。

智能客服

人機交互的智能客服,産生了很多外界公開的數據以及內部的數據、知識庫等,都可以用來製造機器人。尤其是可以用客服過去的數據來做訓練,這個數據量現在在垂直領域是逐漸在增加的。現在的對話系統也已經逐漸成爲深度學習和强化學習的焦點。

新聞領域

另外一個比較看好的領域是新聞領域,新聞的分發和自動寫作。有很多編輯、解說、自動校對、作家等,其實是數據量足够多的,有這麽多的文本,而且外界反饋也越來越多了。給一篇文章,可以用機器學習來做自動摘要。 這樣一個工作的外部反饋來自哪裏呢?實際上我們寫的那些paper就是一個外部反饋,因爲每篇paper都有摘要,如果一篇paper被收了,就說明摘要寫的還不錯,所以外部反饋還是可以實現的。

這裏分享一個有趣的實驗,是香港科大同學做的“自動寫小說”項目。主要有兩個步驟,一步是讓它讀很多書,一步是這樣訓練出一個模型,這個模型再讓它變成一個生成式的模型,這樣就能用來寫小說了。舉個例子,我們提供《射雕英雄傳》和《笑傲江湖》,把這兩個結合起來,就可以寫一部新的小說了。

特定任務的智能機器人

例如Amazon 的KIVA機器人,大家可能知道Amazon一個很大的優勢就是所有的倉儲都是由機器人來完成的,但是它也有工人,被雇來用手做抓取,因爲現在機器人的抓取是非常難的,那麽人和機器的優點就結合起來了。此外,醫療機器人也是非常專業的一個領域,它可以給人開刀縫綫,但它不是自動的,而是通過遠程控制的,但控制的精密度非常高,如果它收集到足够量的數據,是可以達到自動的效果的,以後我們可能開刀就由機器人來代勞了。

醫護領域

無障礙輔助的應用領域痛點特別强烈,現在數據量可能還不是特別多,因爲畢竟這一群體還是少數人,但是痛點很强,所以未來也許會有數據。

AI+有機食品

我們在香港曾去訪問過一個有機食品工廠,這個實驗室裏的每一株菜,周邊的所有環境全都記錄起來,比如濕度、溫度、光照,然後就可以收集這樣的數據訓練一個機器學習的模型,最後用這個模型來做蔬菜。所以得來的蔬菜滋味可以控制,要脆感還是要甜的,都可以通過模型學習出來。

FINTECH智能投顧

最後來說一說金融,其實金融是一個非常好的領域,第四范式在金融領域也積累了很多成功案例。金融領域裏的任務都是非常清楚的,而且每個任務的數據都有痕迹、有數據足迹,數據的維度也是多維度的數據,有外界的、也有內界的,非結構數據比較多,例如文本和報告。數據也是形成了孤島,鏈條也非常長,幷且鏈條裏面都有銜接。

在金融領域現在美國比較時髦的一個概念叫投研、投顧和投資。投研是說研究整個市場的基本面,就好像我們研究輿情分析一樣,但輿情只是其中的一部分;投顧是說在美國的銀行給很多客戶做理財分析,然後做理財的配置,這些工作可以由機器人來做;投資是說機器人自己就是一個客戶,它可以去投資。

人工智能必然將爲人類帶來全新智能革命,就像19世紀的工業革命。作爲投資者或者企業家,都應該密切關注技術層的進展,以及應用層的爆發口

Back

課程內容

16個月的課程展現一張完整清晰的學習藍圖。

了解更多

課程師資

國際化的教授團隊擁有豐富的教學及實踐經驗,他們與著名企業合作,掌握市場的最新發展,傳授國際營商最前瞻的知識和經驗。

了解更多

環球遊學

3大洲環球遊學模塊,帶領學員走訪亞洲、美洲及歐洲。

了解更多