DB4401/T 12-2018 网络舆情分级与判定
DB4401/T 12-2018 Network public opinion classification and determination
基本信息
发布历史
-
2018年10月
-
2023年05月
研制信息
- 起草单位:
- 起草人:
- 出版信息:
- 页数:20页 | 字数:- | 开本: -
内容描述
ICS35.240.01
M11
备案号:
DB4401
广州市地方标准
DB4401/T12—2018
网络舆情分级与判定
Classificationandjudgmentfornetworkpublicopinion
2018-10-10发布2018-12-01实施
广州市质量技术监督局发布
DB4401/T12—2018
目次
前言Ⅲ
1范围1
2术语和定义、缩略语1
2.1术语和定义1
2.2缩略语1
3网络舆情评价一般流程2
4指标体系2
5指标量化3
5.1量化要求3
5.2事件指标3
5.3网民指标4
5.4媒体指标5
5.5舆情态势指标6
6综合评价7
7等级划分与风险程度评价7
7.1等级划分7
7.2结果评价8
附录A(资料性附录)文档主题生成模型9
附录B(资料性附录)基于层次分析法(AHP)的权重计算方法12
I
II
DB4401/T12—2018
前言
本标准按照GB/T1.1—2009给出的规则起草。
本标准由中国共产党广州市委员会宣传部提出并归口。
本标准起草单位:广州市网络舆情信息中心、广州市标准化研究院、广州市云润大数据服务有限公
司。
本标准主要起草人:李伟滨、陈韶航、徐湛、萧玉珊、王贺珍、郑裕钊、曾庆贤、林毅、李永康、
陈敏华、陈振兴、裴炜。
本标准是首次发布。
III
DB4401/T12—2018
网络舆情分级与判定
1范围
本标准规定了网络舆情研判评价的一般流程、指标体系、指标量化、综合评价、等级划分与风险程
度评价等内容。
本标准适用于广州市网络舆情的监测、评估、预警及相关软件开发等。
2术语和定义、缩略语
2.1术语和定义
下列术语和定义适用于本文件。
2.1.1
网民倾向性Netizens'tendency
网民对舆情的评价和态度取向。
2.1.2
焦度Focalpower
舆情在传播过程中最受关注点所处的状态。
2.1.3
拐度Flexion
舆情生命周期中拐点所处状态。
2.1.4
网站的PR值PageRank
全称为PageRank,是google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,PR值
越高说明该网页在搜索排名中的地位越重要。
2.1.5
传播扩散度Propagationdiffusivity
影响网络舆情信息安全的重要指标之一,它用来刻画某一具体的舆情事件或细化主题的相关信息在
一定的统计时期内通过互联网呈现的传播扩散状况。
2.2缩略语
下列缩略语适用于本文件。
AHP:层次分析法(TheAnalyticHierarchyProcess)
LDA:文档主题生成模型(LatentDirichletAllocation)
1
DB4401/T12—2018
3网络舆情评价一般流程
网络舆情评价工作应遵循一定的流程,主要包括以下三个环节,如图1所示:
a)舆情获取与分析:全面收集数据并获取网络舆情源头,对涉穗数据进行分类筛选,对影响因素
进行细致辨识;
b)数据分析:构建层次结构的指标体系,选择科学可行的方法,进行定性和定量的数据处理;
c)评价与措施:对舆情的危险程度进行分析,得出评价结果,给出建议的处理方法。
舆情数据获取
舆情获取与分类数据信息筛选
舆情分类
网络舆情评价一般流程
建立指标体系
数据分析选定评价方法
定性、定量分析
等级划分
评价与措施结果评价
建议处理方法
图1网络舆情评价一般流程
4指标体系
网络舆情评价指标体系包括事件指标、网民指标、媒体指标、舆情态势指标等,这些指标又包含各
自的子参数,构成了一个层次的指标体系,如图2所示。针对不同的对象可选择不同的指标,包含但不
限于这些指标。
2
DB4401/T12—2018
事件性质(P11)
事件指标(P1)事件波及度(P12)
事件风险度(P13)
网民活跃度(P21)
网络舆情评价指标体系网民指标(P2)网民结构(P22)
情感倾向度(P23)
媒体权威度(P31)
媒体指标(P3)传播扩散度(P32)
传播阶段(P33)
热度(P41)
舆情态势指标(P4)
关注度(P42)
图2网络舆情评价指标体系
5指标量化
5.1量化要求
5.1.1对网络舆情评价各指标量化可采用定性或定量的方法,标度范围为[0,1]。
5.1.2对指标定性量化以评价小组成员的平均值作为最终量化值。评价小组成员应受过专业培训。
5.2事件指标
5.2.1事件性质P11
3
DB4401/T12—2018
按照社会矛盾产生的原因对涉穗舆情信息主题进行分类,通常包括公共安全、群体事件、重大灾害、
官员负面、经济财经、城市治理、意识形态等。事件性质可以通过文档主题生成模型(LDA,参见附录A)
进行聚类分析,其它合适的分析方法亦可使用。
5.2.2事件波及度P12
网络舆情波及度是衡量所有网络媒体中涉及到相关信息网站的比例指标。这一指标的意义在于评判
某一话题在网络中传播的广泛程度,或网民在任意登陆一家网站后能够获取到相关信息的概率。波及度
为一个在[0,1]之间的值,可由公式(1)计算。
N1
∑wSij
ij=1,=1
P12=N
……(1)
∑wi
i=1
式中:
P12——波及度;
N1——表示涉及到相关信息的网站数量;
wi——表示网站的权重;
Sj——表示网站涉及到与事件相关的信息程度;
N——表示网站总数量。
5.2.3事件风险度P13
网络舆情信息内容风险度是指某一特定的网络舆情信息内容可能造成的危害程度,与评估者的着眼
点密切相关,如涉及重大安全事故、重大舆论危机等的负面舆情信息内容,风险度就较高。其评判结果
是通过专家问卷调查确定的,可分为高风险、一般风险、无所谓、不敏感四档。
网络舆情信息内容风险度经过专家问卷调查确定,构建层次分析法(AHP,参见附录B)的判断矩阵
建立。
5.3网民指标
5.3.1网民活跃度P21
网民活跃度通过单位时间内发布信息次数、回复次数来衡量,计算方式见公式(2)。
At()
P=
21tend
∑(At()+N)………(2)
tt=start
式中:
P21——网民活跃度;
A(t)——在t时刻相关事件的网民活跃值,见公式(3);
tend——最近更新时间;
tstart——发布时间;
N——平滑参数,表示网民活跃值大于N时具有参考价值。
Na
………………(3)
At()=∑wii×(Pt()−−Pti(1))
i=1
4
DB4401/T12—2018
式中:
At()——在t时刻相关事件的网民活跃值;
N——网民行为种类数量;
a
——各种行为的权重,权重之和为1;
wi
——网民在时刻对事件发布的信息、回复等各种对信息的关注行为次数。
Pti()t
5.3.2网民结构P22
网民结构包括年龄结构、教育程度结构等多个三级指标。通过文本挖掘技术的智能分析,得出一个
在[0,1]之间的值,如:判别式方法、矢量距离法
定制服务
推荐标准
- DB64/T 1062-2015 旱地丰产坑一膜三用种植模式玉米(第2茬)栽培技术规程 2015-07-06
- DB62/T 2583-2015 社区养老服务管理规范 2015-08-12
- DB64/T 1060-2015 宁夏引黄灌区春小麦高产栽培技术规程 2015-07-06
- DB15/T 897-2015 饲用燕麦与箭筈豌豆间作栽培技术规程 2015-08-31
- DB64/T 1059-2015 宁夏引黄灌区春小麦套种玉米栽培技术规程 2015-07-06
- DB64/T 1061-2015 旱地丰产坑一膜三用种植模式西瓜(第1茬)栽培技术规程 2015-07-06
- DB64/T 1063-2015 旱地丰产坑一膜三用种植模式向日葵(第3茬)栽培技术规程 2015-07-06
- DB15/T 902-2015 向日葵菌核病综合防控技术规程 2015-08-31
- DB62/T 2581-2015 机构养老服务管理规范 2015-08-12
- DB64/T 1066-2015 旋耕起垄覆膜机 作业质量 2015-07-06