查找:                      转第 显示法宝之窗 隐藏相关资料 下载下载 收藏收藏 打印打印 转发转发 小字 小字 大字 大字
【期刊名称】 《四川警察学院学报》
大数据环境下网络舆情演化规律及预警模型问题探讨
【英文标题】 Exploration on Evolution Law and Early Warning Model of Network Public Opinion
【作者】 侯学慧【作者单位】 新疆警察学院
【分类】 公安管理法
【中文关键词】 函数拟合;多项式函数;最小二乘法;相关系数
【英文关键词】 function fitting; polynomial function; least squares method; correlation coefficient
【文章编码】 1674-5612(2019)05-0104-07【文献标识码】 A
【期刊年份】 2019年【期号】 5
【页码】 105
【摘要】

大数据环境下的网络舆情事件可以分为突发型、持续型、混合型等几类。通过对网络舆情真实案例的数据提取、挖掘、分析,可得到结构化数据,在此基础上,再对新闻报道量与时间序列的离散点进行函数拟合——基于多项式函数拟合,可建立预警数学模型。利用其图像特征分析所得出的突发型舆情事件符合指数函数分布,持续型舆情事件符合多峰值的高斯分布函数,混合型舆情事件符合分段函数的概率分布特征。据此有助于做好网络舆情监控、对策制定、预警机制建立等工作。

【英文摘要】

Online public opinion events can be classified into emergent, persistent and mixed types in the big data environment. Structured data are obtained through extraction, excavation and analysis of the data from the real cases. An early warning mathematical model is established based on polynomial function fitting of discrete points of news reporting volume and time series with these structured data. Analysis from the image features shows that the emergencies public opinion event conforms to the exponential function distribution, the persistent public opinion event conforms to the Gaussian distribution function with multiple peaks, and the mixed public opinion event conforms to the probability distribution of the segmented function. It is helpful to monitoring network public opinion, making corresponding countermeasures, and establishing an early warning mechanism.

【全文】法宝引证码CLI.A.1279715    
  
  

一、问题提出

在大数据环境下网络信息和舆论信息的监管及正确引导是非常重要的,保护好我们祖国、人民群众的安全是我们警察的使命和义务。网络舆情是指由于各种事件的刺激而产生的通过互联网传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合{1}。我们生活在一个突发事件频发的大数据网络时代下,突发事件是指突然发生,造成或可能造成严重的社会危害,需要采取应急处置措施予以应对的公共事件{2}。突发事件的网络舆情演化是指“没有对事件源和次发生事件进行人工应急干扰的原扩散路径”{3}。突发事件爆发后,一定会引起网络舆情发生,在各种网络平台上信息快速传播和蔓延下,政府部门要发挥常规的传播模式的效力,还要积极有效的给予矫正型的传播影响作用,才能更好有效地控制网络舆情发酵。为此,必须要做到日常网络舆情的预警、完善舆情监管监督机制、加强舆情的导控。

目前对网络舆情的预警机制的定量研究,更多是注重网络舆情的构成因素和因素之间的关系方面,没有对时间序列模式与网络舆情的变化规律上研究更深入。在大数据的网络环境下,只有定量、深层次地分析网络舆情的动态演化过程,分析其函数特征和演化规律,才能针对将要发生的网络舆情做出预警应对。针对现有的网络上热门案例,通过信息提取工作包GooSeeker等信息提取软件,对案例建立事件发生的时间与每天新闻发布数量做函数拟合,得到网络舆情随时间周期的发生、发展、扩散、消亡的动态演化过程,从而建立网络舆情导控和预警机制。

研究者们运用不同的模型和方法对网络舆情演化阶段和构成因素进行分析,建立预警机制,主要包括三方面的研究。一是建立预警指标因素体系,注重于影响舆情变化的关键指标讨论。二是基于情感倾向性分析,这里包括群众的态度是“赞同”“中立”“反对”,从海量信息中,发现潜在的危机隐患。三是基于数据挖掘的预警,这种方法是从网络中提取和目标相关的数据,构成数据集。本文就是基于真实数据,从数据挖掘中找到规律,从而做到更加精确的预警。

大数据环境下网络舆情具有突发性、群体性、不确定性等特征,本文从其特征分析,建立数学模型符合基于多项式函数的数据特征。可以通过已有的国内热门网络舆情案例与实际数据挖掘,建立网络舆情演化模型,分析、量化舆情动态,做好预警模型。分析事件的真实性、敏感度、主题吸引力、发布者影响度、主题聚焦度、舆情观点倾向度、参与度、容忍度、变化频度、突变度等。在大数据环境下建立基于多项式函数的网络舆情预警机制,并用MATLAB软件对预测数据作仿真实验。从而建立网络舆情随时间发展,每个时间段的预警信号及相关参数、关键词、事件的动态演化预警模型。

二、研究方法与模型

持有、接受、表达某种相同、相似的观点的人在社会人群中所占的比例超过一定的阀值,这时候这种观点就上升为舆论{1}。我们从定量的、模型化的分析大数据环境下网络舆情的演化规律:

(一)分析网络平台(微博)得到相应的数据背景

我们主要针对互联网上的网络舆情进行研究、分析。关注的新媒体网络平台主要是新闻网站微博等。也通过相应的舆情观测平台和软件得到相应的数据和图表。利用数据挖掘和分析突发事件随时间的演化规律和普通民众对突发事件的关注度等指标因素,从而做到下一阶段的舆情预警机制,并且对下一次发生的相同突发案件有应对的预警模型。

(二)数据挖掘、分析方法

对于大数据背景下,已有的网络突发案件的客观数据,利用网络爬虫、信息提取工具包GooSeeker中的抓取规则和网页信息抓取工DataScraper等,抓取网站的新闻报道数量和相应的时间分布,以及频繁出现的关键词等指标因素{4}。通过DataStudio定义搜索信息属性为url(网页链接地址)、title(新闻标题)、time(新闻发布时间)、num(新闻机构名称以及新闻关注条数)

(三)函数拟合方法-基于多项式函数的网络舆情演化规律

对通过信息抓取的获得的数据进行挖掘、分析,我们知道突发事件的网络舆情新闻报道数量(普通民众关注、评论程度)是分布在事件发生时间轴上的一些离散的点,制止整个事件最终消亡。在网络热门事件影响力较大、关注度较高的突发事件,往往这些离散点成规律性的变化,假定任何事件的真实发展都可以被看成是时间的连续函数。在网络的大数据背景下,从已经发生的突发事件案例挖掘的数据入手,量化的去分析网络舆情的演化和发展。根据散点图的规律,拟合相应的多项式函数,找到其函数分布规律,从而做好更好、更早、更加正确的预警机制和应对手段。此人家庭地位极低

笔者采用根据大数据背景下具体真实案例的数据进行挖掘和分析,做出相应的散点图,通过MATLAB软件进行函数拟合,得到与网络舆情的动态演化最贴近的连续曲线-多项式函数拟合,建立数学模型,分析其演化特征。在考虑是否符合相应的函数拟合时,采用最小二乘法{5}来分析误差,找到离散点的最佳的函数逼近,在有限数据的基础上建立合适的、合理化的数学模型。利用变量之间的相关系数R,分析拟合的多项式函数的预测值与真实值之间的具体的相关性。

分析突发事件的舆论数据是一些在时间轴上离散的数据点。根据其图像,规律的发现散点图符合基于最小二乘法的多项式函数拟合。下面给出一些定义:

多项式函数:形如:pn an an a a的函数,叫做多项式函数,它是由常数与自变量x经过有限次乘法与加法运算得到的。

最小二乘法:通过最小化误差的平方和找到数据的最佳拟合函数,对挖掘出的真实数据{(Xi, Yi)}i=0,1, …,n,再取定相应的多项式函数Px(x),使得误差的平方和E2达到最小值,定义:

(公式略)其中Yi为数据的真实值、p(xi)为数据预测值,我们称pn(x)为拟合函数或最小二乘解。

由最小二乘法原理,可以知道拟合函数应该满足:

(公式略)

(四)突发事件网络舆情演化的函数特征分析——基于概率的指数型分布、多峰值高斯分布函数演化规律

我们通过分析案例的散点图,得到拟合多项式函数图像,发现突发事件网络舆情的演化规律,从概率和统计学上分析,服从指数分布(突发型)和多峰值高斯函数分布特征(持续型),函数分布成分段函数型(混合型)。

指数分布(突发性):在概率论和统计学中,指数分布是一种连续概率分布,可以用来表示独立随机事件发生的时间间隔。一个指数分布的概率密度函数是:

p(x, a)=a*e-a*x(x ﹥0)X是时间变量;其中a >0是分布的一个参数,常被称为率参数,即每单位时间发生该事件的次数。其中我们定义a是影响因子,a决定着突发事件网络舆情的开始影响程度,a的值越大,整个事件的影响力就越大,所以在预警时一定要关注影响因子的值。

多峰值高斯分布模型(持续型):高斯分布又称为正态分布,根据具体的案例分析,我们不难发现持续型舆情案例,呈现峰多值的高斯分布,其函数如下:

(公式略)其中n是指峰的个数决定。当n=1时,是一次单峰的持续型舆情p

案例,当n=2时,是双峰的持续型案例;ai是第i个峰值的影响因子,ai决定着突发事件网络舆情该峰值的影响程度,ai的值越大,整个事件的影响力就越大。βi是事件的关注因子,当βi的值说明在该峰值内的关注时间长短,越大时,说明事件关注时间较长。

分段概率分布函数(混合型):根据分析具体的舆情案例,有些较为复杂的突

  ······

法宝用户,请登录后查看全部内容。
还不是用户?点击单篇购买;单位用户可在线填写“申请试用表”申请试用或直接致电400-810-8266成为法宝付费用户。
开弓没有回头箭
【注释】                                                                                                     
【参考文献】

{1}曾润喜.网络舆情管理工作机制研究[J].图书情报工作,2009,53(18):79-82.

{2}李岳德,张禹《.突发事件应对法》立法的若干问题[J].行政法学研究,2007(4):769-75.

{3}曹学艳,韦永智,赵鹏飞.非常规突发事件演化机理研究[C].第四届国际应急管理论坛,2009:68-71.

{4}李玉海,李友巍.网络舆论风险评估体系探讨[J].情报杂志,29(6):128-131.

{5}贾小勇,徐传胜,白欣.最小二乘法的创立及其思想方法[J].西北大学学报(自然科学版),2006(3):507-511.

©北大法宝:(www.pkulaw.cn)专业提供法律信息、法学知识和法律软件领域各类解决方案。北大法宝为您提供丰富的参考资料,正式引用法规条文时请与标准文本核对
欢迎查看所有产品和服务。法宝快讯:如何快速找到您需要的检索结果?    法宝V5有何新特色?
扫码阅读
本篇【法宝引证码CLI.A.1279715      关注法宝动态:  

法宝联想
【相似文献】

热门视频更多