隨著人工智能、雲計算、深度學習的崛起,大數據成為行業繞不開的話題,更有“數據是不是越大越好”討論。面對爭論,中國工程院院士高文在“JDD-2017京東金融全球數據探索者大會”上對探索大數據,迎接人工智能時代演講中給出了否定的答案。
以AlphaGo(阿爾法狗)作為經典案例,高文做出有趣的分析,“AlphaGo(阿爾法狗)下圍棋,以前需要使用人類對弈的數據,同時嘗試可三千萬局的數據。和AlphaGo(阿爾法狗)用到的數據量相比,AlphaZero已經不需要人類對弈數據。其中的答案,就是AlphaZero自身會生產數據。”
那什麼樣的情況不需要外部數據,自身生產數據就足夠?高文表示,“我和有些專家討論,什麼樣的AI系統,它可以不需要外部數據就可以戰勝人。實際上就是需要滿足三個條件:集合是封閉的、規則是完備的、約束是有限的。
“首先,不管是狀態集還是各種集合,是封閉的。其次,規則是完備的,如圍棋,如何下子、如何判斷輸贏都是有規則的。再者,約束是有限的,在約束條件之下,不可以遞歸。因為如果遞歸之后,往下推延就停不下來,而約束是有限的時候就停下來。“高文解釋道。
高文判斷,隻要滿足上述三個條件,就不需要外部數據,系統本身產生的數據就足夠使用。可以想見,隻要滿足上述三個條件,機器一定會贏,不管德扑,還是圍棋等類似的情況。”
高文還重點介紹了中國新一代人工智能的五項關鍵技術。這五個關鍵技術,包括大數據智能,這和前面講的大數據關聯性非常強。第二個方面是群體智能,依靠群體的力量推進智能的研究。第三個是跨媒體智能,要把聲音、圖像、文字、自然語言所有這些東西聯結在一起來研究智能,這是跨媒體智能未來所希望達到的目標。第四個是人機混合增強智能,人和機器混合起來怎麼樣讓智能更高能力更強。第五個是自主智能系統,其實就是無人機。(記者 王楠)