Get“模型設計”新技能：AI能操控自己的進化？

2017年11月20日08:19 來源：科技日報

原標題：AI自我進化了？

“僅需幾行代碼就能構建一個回歸模型。”程序員認可谷歌AutoML的工作表現，認為AutoML設計的模型和機器學習專家設計的不相上下。日前，谷歌工程師分別在中國和硅谷重點推介谷歌AutoML項目。

不明就裡的疑惑緊跟著紛至沓來——AI又進化了？！已經會自開發了？能操控自己的進化了？是要擺脫人類嗎？

進化分幾步

AI確實進化了，它能做的事情越來越多，成績斐然。它的背后是AI實現路徑的“三級跳”——

國家超級計算濟南中心大數據研發部研究員趙志剛說：“起初我們用數學公式和‘if……then’等語句告訴計算機第一步做什麼、第二步做什麼，手把手地教，后來給機器n組輸入和輸出，中間的規則或規律由它自己學會。”

“之前，很多聰明的頭腦花一輩子時間研究：如何抽取有效的特征。”專注於智能導購對話機器人的智能一點公司CTO莫瑜解釋道，“神經網絡算法的發明、深度學習技術的出現，使得AI進化到2.0，抽取特征的工作由AI自己進行，我們的工作也隨之發生了變化。”

用數學函數的模式很容易解釋“1.0”到“2.0”的轉變：如果把識別圖像、語義理解、下棋等任務的達成都看成是不同的Y=f（X），即輸入的“貓”的圖片、聲音或棋招是“X”，輸出的“貓”、回答、棋高一招是“Y”。深度學習之前，人通過自己的分析尋找函數f對應的公式，告訴給AI。而深度學習之后，人輸入大量的X與Y的對應，AI自己發現函數f對應的公式。

“AI找到的函數f的具體內容，可能比人找到的更好，但是人類並不知道，就像一個黑匣子。”莫瑜說，“但是f的形式是AI研究員通過研究設計出來的，如果使用深度神經網絡，網絡中的模塊以及模塊之間的組織方式也是提前設計的。”

隨著深度學習技術的成熟和普遍化，模型構建出現了特定可追尋的經驗。“各種共性神經網絡的發布，使得從業門檻越來越低。一些普通的模型構建與優化，剛畢業的學生在網上學學教程就能上手。”趙志剛說。

當構建模型成為可習得的技能，AutoML就出現了。它能做的正是AI研究員的模型設計工作。“將幫助不同公司建立人工智能系統，即使他們沒有廣泛的專業知識。”谷歌工程師這樣推介。AI成功進化到3.0。

事實上，AutoML替代的仍舊是人類能夠提煉出經驗的工作。“如果說之前人描繪一套尋找函數f的‘路網’，在深度學習的技術輔助下，機器能最快找到優化路徑﹔那麼AI現在可以自己設計路網了。”趙志剛言簡意賅。

可以看出，不論是深度學習、還是AutoML，都隻替代人類的一部分群體已經鑽研透了的工作。“機器能做的事情，盡量不要手工勞動”，這是很多程序員的人生信條，這個信條催生了AutoML。本著同樣的信條，微軟開發了DeepCoder。“它可以用來生成滿足給定輸入輸出的程序。”莫瑜說，但它的表現目前還不盡如人意，隻能編寫一些簡單的程序。

誰是“上帝”

答案毫無疑問，人類。

既然AI在進化中走向了更高一階的模型設計，那麼“上帝之手”又發生了哪些變化呢？

“煉丹”，莫瑜用兩個字形象地說起自己的工作，“智能一點是專業做智能客服的，研發人員的工作主要集中於問題建模（如何將實際問題轉化為人工智能技術解決的問題）和算法優化（如何提升人工智能算法的效果）。”

“煉”意味著不斷地調試和完善。“針對特定的人，越投脾氣越好，回答越精准越好。”莫瑜說，“我們的X是客戶的問話，Y是機器人客服的回復，中間的函數f需要訓練。”

這是個不容易的任務。如果把人類社會的經驗分為3類：有公式的確定規則、可言傳的知識、隻可意會不可言傳的感覺。最后一類最難琢磨。

“因此，我們想辦法構建完善的閉環反饋，了解特定用戶的喜好，通過情感、趣味的表達，最終做到投其所好。”莫瑜說，“目前處於人機協同的工作階段，但是越來越多樣本的獲取，將幫助我們的智能客服給出精准的、討喜的回答。”

可見，並不是所有領域都適合交給AI自開發去做，比如問題建模方面，如何將實際問題抽象轉換為機器學習問題， AI還無法自主完成。在AI2.0階段，研發人員還需要人工設計函數f的形式。

那麼，AutoML普及的未來會是什麼樣？

“人類被從低一級的工作中解放出來。”趙志剛說，“如果模型設計可以由AI來做，那麼AI研究員將更多地探尋構成模型的基礎模塊的設計。”

“用AutoML開發AI模型類似於孩子玩‘樂高’玩具。”趙志剛深入淺出，“樂高”設計者把完整的世界拆解成細致的模塊，萬物可用，進而組合成復雜的模型。而人類更高一級的工作就是針對不同領域為AI找到基礎單元，也就是模塊。如在圖像識別領域，人類已設計出卷積、池化等多種模塊。“AutoML才可以以此為依據進行模型構建，不停地調整模塊組合，獲得更符合常理的輸出。模塊越精細、越能解決通用性問題，自開發AI越能施展開拳腳。”趙志剛說。

延伸閱讀

產業需要的人才在哪兒

緩解人才短缺問題是AutoML的主力賣點。“AI系統正在遍地開花，AI人才卻遠遠跟不上。”谷歌方面這樣解釋AutoML為啥不可或缺。目前的AI人才現狀如何？

2017年，《全球AI領域人才報告》《BAT人工智能領域人才發展報告》等相繼發布。“AI人才短缺是真實存在的。”盛世投資集團副總裁徐文娟說，“初創期和發展期企業人才短缺的問題尤其嚴重。從目前世界范圍看，美國擁有數量最多的AI人才，我國AI人才無論從人數還是從業經驗上都無法與之比擬。”

趙志剛有相同的感觸：“我國AI領域現在缺老手、缺高手、缺多面手及頂級大師。”模型的優化調試需要經驗，模型的精巧設計需要高超技藝，把AI應用於各個行業需要復合型人才，此外，目前引領AI發展方向的頂級人才屈指可數，且多在國外。

徐文娟介紹，中國的AI人才在BAT（百度、阿裡、騰訊）中最多。一般這類人才的背景經歷有幾種，海歸、BAT工作經驗，或是來自高校或科研院所。

“AI自開發短期內應該無法替代人的工作，還有很長的路要走。”徐文娟說。趙志剛從學術角度分析道：“隻有當人類把不同應用領域的AI模型設計出來，並進一步分解出一系列通用模塊，如同化學中的元素周期表、生物中的DNA、RNA，這種自開發才能有更多的應用。”（記者張佳星）