走出科幻電影的黑科技 虛擬世界架設“天眼”系統

2017年08月01日08:36  來源:科技日報
 
原標題:在虛擬世界架設“天眼”系統

“《速度與激情7》中有一套酷炫的‘天眼系統,隨時隨地調用人或事的影像,辨查正邪。虛擬世界的‘天眼’更勝一籌,能自動從萬千數據中,抽取病毒共性特征,覺知惡意‘攻擊’。”

“他說‘機器學習’能解決垃圾郵件問題,我當時還不信。”7月17日,坐在瀚思的會議室裡,高瀚昭自嘲,“可是沒別的辦法,就死馬當活馬醫吧。”

高瀚昭口中的“他”是萬曉川,現擔任瀚思科技公司首席科學家。“他在美國擁有十幾項專利,是目前我見過的數據安全行業智商最高的。”提起搭檔,高瀚昭一改理工男的不善言辭,開始誠摯贊美。

2008年前后,垃圾郵件“排山倒海”,“人工分類不現實、規則過濾也很難判定。”高瀚昭說,傳統方法幾乎技窮。

萬曉川提出的應對新策略“醫”出個垃圾郵件識別率全球第一的系統。高瀚昭回憶,“用算法讓機器學習,然后應用在反垃圾郵件上。當時Hotmail、雅虎等垃圾郵件的過濾引擎是我們做的。”

之后,他們篤信機器能夠像孩子一樣學習,就看能不能教好。

抬頭就會嗅到風動

《動物世界》類的紀錄片裡經常出現這樣的場景:在非洲草原上,一群鹿低頭吃草,不時有幾隻鹿抬頭,一旦嗅到風中“信息”的變化,就瞄著一個方向急速奔跑,帶動剩下的鹿跟從。

高瀚昭和他的團隊就是行業內第一批嗅到風動的“鹿”。“2006年,病毒突然成百倍增長,之前是人工手寫病毒,一天就出一兩個。”高瀚昭說,“后來病毒開始了機器的批量生產,一天上千個,人工跟不上,我們就研究自動分析病毒。”

應對轉變,他帶領當時的團隊嘗試幾百台機器協同的分布式計算、嘗試讓病毒在“虛擬機”中運行,這些技術后來成為了業內通用的做法。

2013年權威咨詢公司Gartner在報告中表示,未來的數據安全將逐漸從防御向快速檢測響應轉變。在同年的美國信息安全大會上,高瀚昭也獲得了類似信息。

風向標給出了大信號,高瀚昭判斷,數據安全的實現方向就要發生改變。“之前也看過論文說,通過機器學習實現自動防御在學術上有解了。”

同時嗅到了理論和產業上的“風動”,高瀚昭決定“起跑”,“技術有辦法、用戶有需求、產業有預測,我的積累又正好在大數據和安全這兩個領域,還不彎道超車嗎?”

2014年10月,高瀚昭離開呆了12年的趨勢科技公司,開始找錢找人拉起大旗。

遇到董昕時,董昕正在智能硬件領域創業。高瀚昭開門見山問他,做智能硬件門檻太低沒前途,我做的事比較有意思還有意義,要不要來一起干?“他說想一想,沒幾天就答應了。”

把老同事萬曉川拉進來,則醞釀了很久。“我不好意思去老東家直接挖人,就一直等人爆料,終於等到他想離開,我立即去南京找他。”高瀚昭回憶,“開始他不答應,說不來北京,要回成都,我就說,公司在成都給你開個分中心。”這個決定請動了萬曉川。

瀚思“四英”的最后一名成員是董昕的老同事沈海輝,負責銷售,2015年8月到位,“他來后兩個月,我們就完成了第一單。”

順勢而為總能迎來順理成章

就像馬雲對撒貝寧說“我對錢沒有興趣”。在獲得B輪1億元融資后,高瀚昭說:“我一直覺得拿投資很簡單。”

高瀚昭談起第一次為公司找投資,2014年底,他一邊注冊公司一邊談投資,公司還沒注冊完,投資就談好了,“就談了兩次,第一次我自己去,第二次是和董昕去,之后沒多久就簽了協議。”

無公司、無產品、無隊伍,當年“三無”的高瀚昭和董昕,不到一個月就獲得了光速資本一千多萬元的投資。

為什麼能獲得投資人的信任?高瀚昭自己分析,“盡管我的產品還在概念階段,但需要它的市場大,採用的技術方向有前瞻性,他(投資人)也相信我們能組建好團隊。”高瀚昭跨國公司的工作經驗、從零組建合作公司的履歷起了作用,更重要的是“我根據經驗對產業發展的預判獲得了贊同”。

有了資金,隨后的發展順理成章。2015年6月一代產品有了雛形。“飢渴”的市場二話不說就為他們的第一款產品買了單。

“用戶很簡單,不圖產品有多完美,隻要能解決問題。”瀚思的第一款產品拿到某商業銀行,立刻解決了老系統無法處理每天1TB客戶網銀日志數據的問題。“我們不僅能夠快速處理大量數據,還用機器學習的方法從這些日志中分析出了安全隱患,招行就買了單。”

在安全問題突出的金融領域“開張”之后,燃氣、公安、通信等領域也陸續成為瀚思的客戶,選用主動防御的數據安全模式。

教機器“認毒”要睜大眼睛還要精明

6月27日,烏克蘭等多國遭受Petya勒索病毒襲擊,病毒侵入電腦后偷偷命令電腦一個小時后重啟,啟動中改寫磁盤,隨后顯示“電腦被鎖,想解鎖開機就交價值300美元的比特幣”。

“想想有點慚愧,我從事了20年的安全行業至今無法回答‘毒’從哪來、要做什麼的問題,除非病毒‘打上門來’。”高瀚昭說。之前的應對方法是,將可疑病毒在“虛擬機”上運行,如果發生了惡意篡改、木馬調用,就判為病毒,隨后發布“病毒特征碼”廣而周知。

“不能等‘打上門來’才抓,得在‘壞人’一露面就認出來。”高瀚昭說,“我們教會機器做這件事。”起初,高瀚昭團隊先告訴機器10000+次這樣的文件是病毒或惡意程序,當第10001+個文件出現時,機器就會判斷了。

“這個1.0版還不夠聰明,”高瀚昭說,真正的“數據安全警長”,“眼睛瞪得像銅鈴”還要“射出閃電般的精明”。

2015年,瀚思公司開始了核心產品企業安全智能平台3.0的研發工作,讓系統“精明”起來——為了對海量數據快速掃描,他們借用“一目十行”的理念,將代碼轉為“圖像”模式,百倍提高處理速度﹔分派四類角色充當機器“教導員”——分析人員,搞清楚病毒怎麼認出﹔寫代碼人員,把分析人員的思想寫成“機器語言”﹔現場人員,發現系統問題、反饋完善﹔規則人員,建立整個循環流程的規則。

高瀚昭的理念裡,企業的人才構架要形成滴水不漏的循環。“有了這樣的團隊配合、而且關鍵節點的人不掉鏈子,就能奏效。”

和病毒制造者賽跑,2016年9月,一個能夠分析環境、根據場景和數據源學習的安全平台誕生,“我們鬆了口氣,系統實現了通用。”

“它到一個新環境會先學習,根據自己的經驗找到新環境裡‘壞人’的特征,”高瀚昭解釋,“可以這樣比喻,它能適應環境,而且我們教它1+1=2之后,它自己能算出來2+3=5。”

正是這個通用系統,在今年3月就發現了此前提到的Petya勒索病毒的蛛絲馬跡,“5月初在用戶數據中發現,我們一下子重視起來,當即通知用戶防范。”

高瀚昭一度認為做安全沒了前途,“一個防毒軟件上市沒幾天就會被黑客破解”,如今他創造出精明的“天眼”,“街道攝像頭有沒有把圖像傳到不該傳的地方?汽車傳感器有沒有被攻擊?”高瀚昭說,“我們已經發現上萬台攝像頭被不法利用,要做的事太多了。”(記者 張佳星)

(責編:賈越喬(實習生)、張希)