DB4401/T 12-2018 网络舆情分级与判定

DB4401/T 12-2018 Network public opinion classification and determination

广东省地方标准 简体中文 被代替 已被新标准代替,建议下载标准 DB4401/T 12-2023 | 页数:20页 | 格式:PDF

基本信息

标准号
DB4401/T 12-2018
标准类型
广东省地方标准
标准状态
被代替
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2018-10-10
实施日期
2018-12-01
发布单位/组织
广州市市场监督管理局
归口单位
-
适用范围
-

发布历史

研制信息

起草单位:
起草人:
出版信息:
页数:20页 | 字数:- | 开本: -

内容描述

ICS35.240.01

M11

备案号:

DB4401

广州市地方标准

DB4401/T12—2018

网络舆情分级与判定

Classificationandjudgmentfornetworkpublicopinion

2018-10-10发布2018-12-01实施

广州市质量技术监督局发布

DB4401/T12—2018

目次

前言Ⅲ

1范围1

2术语和定义、缩略语1

2.1术语和定义1

2.2缩略语1

3网络舆情评价一般流程2

4指标体系2

5指标量化3

5.1量化要求3

5.2事件指标3

5.3网民指标4

5.4媒体指标5

5.5舆情态势指标6

6综合评价7

7等级划分与风险程度评价7

7.1等级划分7

7.2结果评价8

附录A(资料性附录)文档主题生成模型9

附录B(资料性附录)基于层次分析法(AHP)的权重计算方法12

I

II

DB4401/T12—2018

前言

本标准按照GB/T1.1—2009给出的规则起草。

本标准由中国共产党广州市委员会宣传部提出并归口。

本标准起草单位:广州市网络舆情信息中心、广州市标准化研究院、广州市云润大数据服务有限公

司。

本标准主要起草人:李伟滨、陈韶航、徐湛、萧玉珊、王贺珍、郑裕钊、曾庆贤、林毅、李永康、

陈敏华、陈振兴、裴炜。

本标准是首次发布。

III

DB4401/T12—2018

网络舆情分级与判定

1范围

本标准规定了网络舆情研判评价的一般流程、指标体系、指标量化、综合评价、等级划分与风险程

度评价等内容。

本标准适用于广州市网络舆情的监测、评估、预警及相关软件开发等。

2术语和定义、缩略语

2.1术语和定义

下列术语和定义适用于本文件。

2.1.1

网民倾向性Netizens'tendency

网民对舆情的评价和态度取向。

2.1.2

焦度Focalpower

舆情在传播过程中最受关注点所处的状态。

2.1.3

拐度Flexion

舆情生命周期中拐点所处状态。

2.1.4

网站的PR值PageRank

全称为PageRank,是google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,PR值

越高说明该网页在搜索排名中的地位越重要。

2.1.5

传播扩散度Propagationdiffusivity

影响网络舆情信息安全的重要指标之一,它用来刻画某一具体的舆情事件或细化主题的相关信息在

一定的统计时期内通过互联网呈现的传播扩散状况。

2.2缩略语

下列缩略语适用于本文件。

AHP:层次分析法(TheAnalyticHierarchyProcess)

LDA:文档主题生成模型(LatentDirichletAllocation)

1

DB4401/T12—2018

3网络舆情评价一般流程

网络舆情评价工作应遵循一定的流程,主要包括以下三个环节,如图1所示:

a)舆情获取与分析:全面收集数据并获取网络舆情源头,对涉穗数据进行分类筛选,对影响因素

进行细致辨识;

b)数据分析:构建层次结构的指标体系,选择科学可行的方法,进行定性和定量的数据处理;

c)评价与措施:对舆情的危险程度进行分析,得出评价结果,给出建议的处理方法。

舆情数据获取

舆情获取与分类数据信息筛选

舆情分类

网络舆情评价一般流程

建立指标体系

数据分析选定评价方法

定性、定量分析

等级划分

评价与措施结果评价

建议处理方法

图1网络舆情评价一般流程

4指标体系

网络舆情评价指标体系包括事件指标、网民指标、媒体指标、舆情态势指标等,这些指标又包含各

自的子参数,构成了一个层次的指标体系,如图2所示。针对不同的对象可选择不同的指标,包含但不

限于这些指标。

2

DB4401/T12—2018

事件性质(P11)

事件指标(P1)事件波及度(P12)

事件风险度(P13)

网民活跃度(P21)

网络舆情评价指标体系网民指标(P2)网民结构(P22)

情感倾向度(P23)

媒体权威度(P31)

媒体指标(P3)传播扩散度(P32)

传播阶段(P33)

热度(P41)

舆情态势指标(P4)

关注度(P42)

图2网络舆情评价指标体系

5指标量化

5.1量化要求

5.1.1对网络舆情评价各指标量化可采用定性或定量的方法,标度范围为[0,1]。

5.1.2对指标定性量化以评价小组成员的平均值作为最终量化值。评价小组成员应受过专业培训。

5.2事件指标

5.2.1事件性质P11

3

DB4401/T12—2018

按照社会矛盾产生的原因对涉穗舆情信息主题进行分类,通常包括公共安全、群体事件、重大灾害、

官员负面、经济财经、城市治理、意识形态等。事件性质可以通过文档主题生成模型(LDA,参见附录A)

进行聚类分析,其它合适的分析方法亦可使用。

5.2.2事件波及度P12

网络舆情波及度是衡量所有网络媒体中涉及到相关信息网站的比例指标。这一指标的意义在于评判

某一话题在网络中传播的广泛程度,或网民在任意登陆一家网站后能够获取到相关信息的概率。波及度

为一个在[0,1]之间的值,可由公式(1)计算。

N1

∑wSij

ij=1,=1

P12=N

……(1)

∑wi

i=1

式中:

P12——波及度;

N1——表示涉及到相关信息的网站数量;

wi——表示网站的权重;

Sj——表示网站涉及到与事件相关的信息程度;

N——表示网站总数量。

5.2.3事件风险度P13

网络舆情信息内容风险度是指某一特定的网络舆情信息内容可能造成的危害程度,与评估者的着眼

点密切相关,如涉及重大安全事故、重大舆论危机等的负面舆情信息内容,风险度就较高。其评判结果

是通过专家问卷调查确定的,可分为高风险、一般风险、无所谓、不敏感四档。

网络舆情信息内容风险度经过专家问卷调查确定,构建层次分析法(AHP,参见附录B)的判断矩阵

建立。

5.3网民指标

5.3.1网民活跃度P21

网民活跃度通过单位时间内发布信息次数、回复次数来衡量,计算方式见公式(2)。

At()

P=

21tend

∑(At()+N)………(2)

tt=start

式中:

P21——网民活跃度;

A(t)——在t时刻相关事件的网民活跃值,见公式(3);

tend——最近更新时间;

tstart——发布时间;

N——平滑参数,表示网民活跃值大于N时具有参考价值。

Na

………………(3)

At()=∑wii×(Pt()−−Pti(1))

i=1

4

DB4401/T12—2018

式中:

At()——在t时刻相关事件的网民活跃值;

N——网民行为种类数量;

a

——各种行为的权重,权重之和为1;

wi

——网民在时刻对事件发布的信息、回复等各种对信息的关注行为次数。

Pti()t

5.3.2网民结构P22

网民结构包括年龄结构、教育程度结构等多个三级指标。通过文本挖掘技术的智能分析,得出一个

在[0,1]之间的值,如:判别式方法、矢量距离法

定制服务