2018年第一季度《中国网民科普需求搜索行为报告》

2018年07月05日14:36  来源:人民网-科普中国
 
 

一、中国网民科普需求搜索行为研究概述

(一)研究目的

当今世界,以数字化、网络化、智能化为标志的信息技术革命日新月异,互联网日益成为创新驱动发展的先导力量,深刻改变着人们的生产生活,有力推动着社会发展,对国际政治、经济、文化、社会等领域发展产生深刻影响。截至2017年12月,我国网民规模达7.53亿,互联网发展带来信息的爆炸式增长,以及传播表达方式的多样性,使科学传播变得无比高效、方便快捷和充满乐趣,云计算、数据挖掘等现代信息技术的应用,使泛在、精准、交互式的科普服务成为现实。

通过搜索方式直接获取科普信息或获取科普信息的解决方案,是越来越多网民的主动选择和主要选择。目前,通过百度搜索的日均请求达到60亿次。因此,通过网民科普需求搜索行为的大数据挖掘,可以准确地了解网民科普需求的实时动态、精准刻画有科普需求的网民的独有特征,为科普信息化建设的宏观决策、科普的精准推送服务提供科学依据。

为准确了解我国网民科普需求搜索在“搜什么”、“谁在搜”、“用什么搜”等情况,中国科协科普部、百度数据研究中心、中国科普研究所于2015年3月共同开展中国网民科普需求搜索行为研究,从2015年起,每季度定期发布《中国网民科普需求搜索行为报告》。

(二)研究对象和内容

研究对象:使用百度搜索的中国大陆网民

研究内容:侧重于了解中国网民的科普搜索行为特点、科普主题搜索份额、科普搜索人群的年龄、地域性别等结构特征,并对不同终端上的搜索行为进行分析,以期了解中国网民的科普需求状况。自2018年第一季度起,报告增加了对“科普中国”的专题分析,旨在反映这一全国性科普品牌在互联网以及网民群体中的关注和传播情况。

(三)研究方法

此次科普需求搜索报告基于2015年至今的百度搜索数据。

研究步骤为:

1.根据科普热点研究提出8个科普主题,参考专家意见根据科普主题提出种子词,调取百度数据对种子词进行计算衍生,得到衍生词库,即网民搜索词词库,作为科普需求热度的计算基础。

2.由百度去掉与科普无关的衍生词后,各领域专家对衍生词进行进一步的科学取舍和归并。

3.基于衍生词库和百度积累的历年搜索数据,利用百度的技术开发实力,进行数据的统计和筛选、开发数据分析平台。

4.对数据分析平台的结果进行分析解读,形成报告。

根据本季度新闻热点事件,增加5个种子词。属于航空航天主题的有张衡一号、蓝血月,属于健康与医疗主题的有安乃近,属于前沿技术主题的有克隆猴、机器翻译。

(四)术语释义

搜索指数:以百度网页搜索次数为基础,科学分析并计算关键词搜索频次的加权和,反映特定内容在百度上被搜索的热度。

TGI指数:TGI(Target Group Index)即目标群体指数,指在总体中,目标群体相对于其他子群体在某项特征上的显示度。TGI指数大于100,表示有此特征。TGI指数越大,特征越明显。

百度资讯指数:百度资讯指数基于百度智能分发和推荐内容数据(被动行为数据),综合了网民的阅读、评论、转发、点赞等信息凭据(主动行为数据),能够全面反映信息推送网络中的网民信息回应行为特征。

(责编:赵鹏、姚欣雨)