據《自然》雜志官網日前報道,一篇發表在最新一期《進化生物學》雜志上的論文稱,用成千上萬份標本圖像“訓練”過的計算機算法,已經能自動識別被壓制的、干燥植物標本的物種。這是科學家首次嘗試通過深度學習,讓計算機使用大型復雜數據集的神經網絡,解決了識別自然物種分類的困難任務。
世界各地的自然歷史博物館正在加速藏品數字化進程,將標本圖像存儲在開放數據庫中。比如美國國家科學基金會的iDigBio項目的一個數據庫,就擁有來自全美各地收集的超過1.5億張植物和動物圖像。
目前,世界3.5億個物種中,隻有一小部分被數字化了。但是,隨著計算技術的進步,哥斯達黎加理工學院計算機科學家艾瑞克·蒙塔羅和法國蒙彼利埃國際發展農業研究中心植物學家皮埃爾·邦尼特認為,為標本做大數據集已經成為可能。他們的團隊已經實現了植物識別的自動化。
研究人員借助智能手機應用程序現場拍攝標本,積累了數以百萬計的新鮮植物圖像,然后對1000多個物種、超過26萬份植物標本進行了掃描識別,採用先進算法的識別准確率高達80%。
邦尼特說,這樣驚人的結果往往讓植物學家擔心其學術領域被輕視。“但人類的專長永遠不會被消除,識別結果仍需要植物學家來檢驗正確與否。”
人工智能識別標本的方法,極大地減少了植物學家收集和識別標本的時間,還能幫助改進標本數據貧乏地區的植物鑒定水平,對生物多樣性豐富但植物標本較少的地區特別有用。
此外,這種方法還能讓研究人員對大數據進行額外的分析。一般而言,植物標本樣本中含有豐富的數據信息,例如採集時間和地點,採集時在開花還是在結果,以及花群密集特征等。由於一些樣本是幾個世紀以前的數據,因此,可以幫助研究植物是如何適應氣候變化的。
美國賓夕法尼亞州立大學博士彼得·威爾夫說:“在自然歷史的進程中,這種方法預示著未來。”
總編輯圈點
植物學家似乎能從繁重的收集和識別標本的工作中解放出來了。如果研究結果穩定,他們至少能夠省下80%的時間啊!要知道,世界各地的自然歷史博物館中的數字化標本越來越多,單一個數據庫就有超過1.5億張圖像。人工智能可以自動識別標本,這對植物學家來說當然不是威脅。畢竟,大部分鑒定工作枯燥又無聊,但又至關重要,人工智能在這些地方幫忙,真是不能更貼心。開一個腦洞,如果科學家能把那些繁瑣又不得不做的都交給人工智能,科學產出會不會更加豐富?(記者 房琳琳)