Get“模型設計”新技能:AI能操控自己的進化?

2017年11月20日08:19  來源:科技日報
 
原標題:AI自我進化了?

“僅需幾行代碼就能構建一個回歸模型。”程序員認可谷歌AutoML的工作表現,認為AutoML設計的模型和機器學習專家設計的不相上下。日前,谷歌工程師分別在中國和硅谷重點推介谷歌AutoML項目。

不明就裡的疑惑緊跟著紛至沓來——AI又進化了?!已經會自開發了?能操控自己的進化了?是要擺脫人類嗎?

進化分幾步

AI確實進化了,它能做的事情越來越多,成績斐然。它的背后是AI實現路徑的“三級跳”——

國家超級計算濟南中心大數據研發部研究員趙志剛說:“起初我們用數學公式和‘if……then’等語句告訴計算機第一步做什麼、第二步做什麼,手把手地教,后來給機器n組輸入和輸出,中間的規則或規律由它自己學會。”

“之前,很多聰明的頭腦花一輩子時間研究:如何抽取有效的特征。”專注於智能導購對話機器人的智能一點公司CTO莫瑜解釋道,“神經網絡算法的發明、深度學習技術的出現,使得AI進化到2.0,抽取特征的工作由AI自己進行,我們的工作也隨之發生了變化。”

用數學函數的模式很容易解釋“1.0”到“2.0”的轉變:如果把識別圖像、語義理解、下棋等任務的達成都看成是不同的Y=f(X),即輸入的“貓”的圖片、聲音或棋招是“X”,輸出的“貓”、回答、棋高一招是“Y”。深度學習之前,人通過自己的分析尋找函數f對應的公式,告訴給AI。而深度學習之后,人輸入大量的X與Y的對應,AI自己發現函數f對應的公式。

“AI找到的函數f的具體內容,可能比人找到的更好,但是人類並不知道,就像一個黑匣子。”莫瑜說,“但是f的形式是AI研究員通過研究設計出來的,如果使用深度神經網絡,網絡中的模塊以及模塊之間的組織方式也是提前設計的。”

隨著深度學習技術的成熟和普遍化,模型構建出現了特定可追尋的經驗。“各種共性神經網絡的發布,使得從業門檻越來越低。一些普通的模型構建與優化,剛畢業的學生在網上學學教程就能上手。”趙志剛說。

當構建模型成為可習得的技能,AutoML就出現了。它能做的正是AI研究員的模型設計工作。“將幫助不同公司建立人工智能系統,即使他們沒有廣泛的專業知識。”谷歌工程師這樣推介。AI成功進化到3.0。

事實上,AutoML替代的仍舊是人類能夠提煉出經驗的工作。“如果說之前人描繪一套尋找函數f的‘路網’,在深度學習的技術輔助下,機器能最快找到優化路徑﹔那麼AI現在可以自己設計路網了。”趙志剛言簡意賅。

可以看出,不論是深度學習、還是AutoML,都隻替代人類的一部分群體已經鑽研透了的工作。“機器能做的事情,盡量不要手工勞動”,這是很多程序員的人生信條,這個信條催生了AutoML。本著同樣的信條,微軟開發了DeepCoder。“它可以用來生成滿足給定輸入輸出的程序。”莫瑜說,但它的表現目前還不盡如人意,隻能編寫一些簡單的程序。

誰是“上帝”

答案毫無疑問,人類。

既然AI在進化中走向了更高一階的模型設計,那麼“上帝之手”又發生了哪些變化呢?

“煉丹”,莫瑜用兩個字形象地說起自己的工作,“智能一點是專業做智能客服的,研發人員的工作主要集中於問題建模(如何將實際問題轉化為人工智能技術解決的問題)和算法優化(如何提升人工智能算法的效果)。”

“煉”意味著不斷地調試和完善。“針對特定的人,越投脾氣越好,回答越精准越好。”莫瑜說,“我們的X是客戶的問話,Y是機器人客服的回復,中間的函數f需要訓練。”

這是個不容易的任務。如果把人類社會的經驗分為3類:有公式的確定規則、可言傳的知識、隻可意會不可言傳的感覺。最后一類最難琢磨。

“因此,我們想辦法構建完善的閉環反饋,了解特定用戶的喜好,通過情感、趣味的表達,最終做到投其所好。”莫瑜說,“目前處於人機協同的工作階段,但是越來越多樣本的獲取,將幫助我們的智能客服給出精准的、討喜的回答。”

可見,並不是所有領域都適合交給AI自開發去做,比如問題建模方面,如何將實際問題抽象轉換為機器學習問題, AI還無法自主完成。在AI2.0階段,研發人員還需要人工設計函數f的形式。

那麼,AutoML普及的未來會是什麼樣?

“人類被從低一級的工作中解放出來。”趙志剛說,“如果模型設計可以由AI來做,那麼AI研究員將更多地探尋構成模型的基礎模塊的設計。”

“用AutoML開發AI模型類似於孩子玩‘樂高’玩具。”趙志剛深入淺出,“樂高”設計者把完整的世界拆解成細致的模塊,萬物可用,進而組合成復雜的模型。而人類更高一級的工作就是針對不同領域為AI找到基礎單元,也就是模塊。如在圖像識別領域,人類已設計出卷積、池化等多種模塊。“AutoML才可以以此為依據進行模型構建,不停地調整模塊組合,獲得更符合常理的輸出。模塊越精細、越能解決通用性問題,自開發AI越能施展開拳腳。”趙志剛說。

延伸閱讀

產業需要的人才在哪兒

緩解人才短缺問題是AutoML的主力賣點。“AI系統正在遍地開花,AI人才卻遠遠跟不上。”谷歌方面這樣解釋AutoML為啥不可或缺。目前的AI人才現狀如何?

2017年,《全球AI領域人才報告》《BAT人工智能領域人才發展報告》等相繼發布。“AI人才短缺是真實存在的。”盛世投資集團副總裁徐文娟說,“初創期和發展期企業人才短缺的問題尤其嚴重。從目前世界范圍看,美國擁有數量最多的AI人才,我國AI人才無論從人數還是從業經驗上都無法與之比擬。”

趙志剛有相同的感觸:“我國AI領域現在缺老手、缺高手、缺多面手及頂級大師。”模型的優化調試需要經驗,模型的精巧設計需要高超技藝,把AI應用於各個行業需要復合型人才,此外,目前引領AI發展方向的頂級人才屈指可數,且多在國外。

徐文娟介紹,中國的AI人才在BAT(百度、阿裡、騰訊)中最多。一般這類人才的背景經歷有幾種,海歸、BAT工作經驗,或是來自高校或科研院所。

“AI自開發短期內應該無法替代人的工作,還有很長的路要走。”徐文娟說。趙志剛從學術角度分析道:“隻有當人類把不同應用領域的AI模型設計出來,並進一步分解出一系列通用模塊,如同化學中的元素周期表、生物中的DNA、RNA,這種自開發才能有更多的應用。”(記者 張佳星)

(責編:高黎明、張希)