熱搜新聞將我們“裹挾”?人工智能專家這樣說

2018年02月05日08:06  來源:科技日報
 
原標題:熱搜新聞將我們“裹挾”? 人工智能專家這樣說

  今年伊始,娛樂圈某明星出軌的消息席卷新聞熱搜,甚至從不關心娛樂新聞的讀者也被裹挾其中,聯想到日前微博熱搜榜、熱門話題榜等被下線,不禁讓人思考:我們為什麼會被卷入“熱點話題”的漩渦?這是我們主動的選擇、潛意識的興趣,還是被系統后台操控的“身不由己”?

  日前,電子科技大學成都研究院大數據室研究人員、成都鏈科雲科技技術合伙人熊文軒,為科技日報記者解答了這些問題。

  被算法“套路”的熱搜推送

  “這不是簡單的‘貼標簽’,而是組合‘套路’。”熊文軒說,新聞聚合平台、社交平台推送的新聞、信息使用的大數據算法大體分兩類:基於內容推薦規則和協同過濾推薦規則。

  前者是根據個人行為習慣將瀏覽的新聞、信息等對象進行特征提取、內容分類后,進行關聯內容推送,但其最大弊端是推薦內容單一。“舉個簡單例子,某天你的手機被女友拿去看了絲襪產品,那麼接下來幾天你都會被推薦絲襪。”

  於是協同過濾規則出現了,這是根據網絡用戶相互的交叉體驗,尋找相同愛好的群體,推薦相同瀏覽記錄或行為。“系統找了一群與你志同道合的‘小伙伴’在背后‘支招’。他們跟你同樣關注體育、旅游新聞,但他們同時也閱讀了氣象新聞,那麼算法會將你之前未關注的氣象新聞推送給你。”熊文軒說,這可以避免特征分類單一,實現動態推薦,即根據個人興趣愛好的變化作調整。

  “目前,多數聚合類新聞平台都會採取融合式算法,即將上述多種算法綜合運用或開發出一些更復雜的算法,但原理大致類似。”熊文軒說。

  沒有瀏覽記錄的“萌新”能否逃出“套路”?他說,注冊時平台會推薦標簽性分類,如電影、美食等引導用戶第一波使用,隨后用戶開始篩選、點擊、留存,這便實現了數據“冷啟動”。“冷啟動后數據產生,系統便按預設的算法進行推薦。”他說,一些基於新聞學、傳播學特點的“規則設定”也會推波助瀾,如內容置頂、套紅、延伸閱讀鏈接等。

  基於人工智能形成的內容“漩渦”

  “在趨於碎片化閱讀的當前,讀者自我訴求不明確、隨機性強,容易被后台系統引導。”熊文軒說,一些聚合類平台、社交媒體負責內容推薦的是基於算法的人工智能,而非編輯人員,這更容易形成內容“漩渦”:系統按規則推薦熱點話題,讀者點擊率、閱讀量不斷提升,系統再次循環推薦,越來越多的讀者卷入其中。“其實你仔細看會發現,某熱點話題的閱讀內容可能翻來覆去就是那麼幾十條。”

  這種基於算法的人工智能內容推薦可控嗎?熊文軒表示肯定。他說,用戶被海量重復信息“包圍”,源於內容把控沒有人為過濾。“算法邏輯不會產生特別精准的推薦,而是大體方向或嘗試性推薦,這就需要大量內容填充,而無法對內容進行強制管理。”他說,可以嘗試用“算法初選+人工引導”的方式,避免被同類內容、低俗內容不斷刷屏。

  從內容來源進行控制,也是熊文軒團隊正嘗試的工作之一。他所在的企業能夠實現讓科技政策、雙創信息通過“大數據+人工智能”的方式“主動”找到企業更有效地發揮作用。“在內容源頭,我們會選取政府網站、主流媒體等專業平台,這樣內容推送范圍是限定的,可以有准確性、真實性、客觀性。”他說。

  最后,通過算法自身規則設定也能夠實現內容管控。他說,最簡單的方式就是設定不同內容的權重值,如將娛樂新聞類權重設定為0.5、社會新聞類設為1.5,那麼同樣由人工智能從網絡中爬取的100條內容中,娛樂類就會僅推送50條,社會類就會推送150條,從側面引導讀者關注熱點。“內容推薦算法的根本是分類和篩選,最終目的是幫助讀者在海量的信息中,精准找到需要關注的內容,而不是被淹沒其中。”熊文軒說。(記者 盛利)

(責編:於露、張希)