来源:期刊VIP网所属分类:计算机信息管理发布时间:2021-06-09浏览:次
摘 要: 公共政策涉及到对社会资源的分配和协调,与社会大众的利益密切相关。对公共政策实施进行科学评估有利于提升政府施政能力。传统评估方式存在一定局限,利益相关方参与度不够。本文基于互联网大数据对公共政策实施评估进行了研究。通过对论坛、微博等互联网站点在政策出台后一段时间(如半年)的海量数据,以及部分用户行为数据,进行聚类分析,建立公共政策实施评估指数模型。
关键词: 公共政策; 互联网数据; 聚类分析; 指数模型
0 引言
公共政策從某种意义上说是公共权力机关经由某个法定的程序所制定的为解决公共问题、达成公共目标、实现公共利益,以协调经济社会活动及相互关系的实施方案。公共政策的评估主要从两个方面着力,一是在公共政策出台之前,对政策的可行性进行评估;二是在政策出台之后,对政策的实时效果进行评估,找出与公共政策设计目标的差距。传统的评估方法有两类,一类是现场调研考察。选取与公共政策相关的不同层次的利益相关方,通过深入座谈、问卷调查、文档查看、实地考察、专家打分等方式,形成评估报告。另一类是建立统计分析模型。运用数理经济学、计量经济学和统计学等多种数理经济模型和计量经济模型,对公共政策进行量化评估,通过数据分析对政策实施进行量化评估。
近年来,互联网技术发展迅速,产生了海量的数据,为大数据的应用打下了坚实的基础。据有关文献报道[1,4],国内、外利用互联网大数据对公共政策实施进行评估取得了较好的应用效果。
本文对基于互联网大数据的公共政策实施评估进行了研究,通过对论坛、微博、微信、贴吧、博客、手机APP、平媒、政府网站互动栏目等互联网站点在政策出台后一段时间(如政策出台后半年内)的海量数据,以及部分用户行为数据,进行建模分析,将互联网上的公众意见引入到公共政策的实施效果评估中。
1 公共政策实施评估方法简述[2]
公共政策评估,从评估的范围看,有对公共政策实施效果及价值进行判断的专项评估,也有只对公共政策实施整个过程的分析和评判。从评估的过程看也有广义和狭义之分。广义的政策评估包含事前评估、执行评估和事后评估三种类型,而狭义的政策评估常常指事后评估。从评估的方法看,有定性分析评估和定量分析评估,定性评估在国内现有的评价模式中应用较为广泛。
1.1 定性评估方式
定性评估是基于经验的实证研究,常常采用访问法、观察法、案例研究法等非数字技术方法,依赖于评估方对公共政策实施的了解、调查和感性认识。如通过相关会议上的汇报交流、实地调研座谈、上报材料、媒体报道、内参反映、相关利益方来信/来访等,归纳总结为政策实施评估报告。定性评估方式相对简单,容易实施,速度快、方便、直接,比较受到各级政府的推崇。但定性评估方式易受各类条件的约束,其科学性、客观性难有保障,评估人员的直觉和经验作用明显,评估对象面较窄,利益相关方参与度不够。
1.2 定量评估方式
定量评估是相对定性评估的另一种评估方法,通过数据归集建立统计分析模型,把理论性概念量化成具体数据,通过科学计算,对公共政策实施进行定量评估。定量研究在某些方面相比定性研究方法有优势,能够用数据直观表达评估结果,但也存在不可靠的风险,过多地强调客观性和普遍性,忽略了人的主观性和特殊性。定量分析的方法对于解决常规性问题效果很好,对于非常规性的复杂问题,往往效果不佳。
1.3 互联网大数据评估
随着互联网和自媒体的高速发展,互联网本身的海量数据为基于大数据的公共政策评估带来便利。尽管在数据处理方式上,大数据的分析方法与传统定量分析的建模分析有相通之处,但存在较大差异。大数据评估由于数据采集方式、处理方式的变革,将会带来评估模式革命性的变化。一是数据采集从样本数据转向全数据,使评估更加接近事实本身;二是分析方法上由重视变量之间的因果性转向更加关注相关性,通过分析、揭示公共政策制定、实施与效果之间的相关性,使政策评价更趋于科学、民主和客观;三是参与对象更加广泛,通过大量收集互联网上利益相关者的情感、意愿、评价等信息,更多的了解公共政策实施对象参与的积极性和对公共政策实施效果的看法和评价。
2 互联网大数据评估基础准备
2.1 数据准备
2.1.1 数据采集
根据行政区划和政策评估有效时间和区间进行限定,采用互联网爬虫技术或以购买服务的方式从互联网爬虫公司采集数据,包括新闻、论坛、微博、微信、贴吧、博客、手机APP、平媒、政府网站互动栏目、综合网站互动栏目等互聯网站点在政策出台后一段时间(如出台后半年内的数据)的数据,构建基于舆情内容的热度、重点、焦点、敏感度、高频词、粘度等用户关注的行为数据,为多维度的舆情分析打基础。
2.1.2 数据预处理
互联网采集的数据与实际建模分析的要求相差甚远,极易受噪声、重复数据、缺失值和不一致数据的侵扰,必须进行预处理,数据预处理主要完成采集数据中的噪声清洗,纠正不一致性。一是检测、剔除重复数据。主要是记录去重和特征去重。考虑到中文处理的复杂性,可以采用特征去重、哈希去重等技术消除重复记录。二是异常数据处理。可以采用统计方法、关联分析、聚类方法进行异常数据处理,如缺失值处理、异常值(离群点)处理、噪音数据处理等。三是特定领域的数据清洗。这种数据清洗方案和算法都是针对特定领域,通过聚集、删除冗余、特征聚类来减少无关数据,实现数据的规范化。在公共政策评估中,可以根据公共政策的关键描述,建立关键词知识库和清洗模型,进行定向采集或定向清洗。四是数据集成入库。完成数据清洗后,通过规范、转换和规整处理,把采集数据规范到可以进行比较分析的某一度量空间,进行数据入库。
2.1.3 评估模型算法
由于互联网汉字文本信息的特点,只能通过语义分析找到文本数据内在的固有属性。基于互联网舆情对公共政策实施效果评估是一种常见的聚类分析评估,通过对海量数据的采集分析,按照舆情特点对公共政策评估进行聚类分析,通过关键词频度和特征表述并进行适度的加权值,实现类似满意、比较满意、一般、不满意的聚类分析。聚类算法是一种典型的无监督学习算法,根据样本之间的相似程度,将样本划分到不同的类别中。聚类分析的主要算法有划分聚类、层次聚类、基于密度的聚类、基于模型的聚类、基于网格的聚类和基于模糊的聚类。
3 基于聚类分析的公共政策模型结构研究
3.1 研究准备
一是建立大数据评估的相关知识库。对已发布的公共政策建立关键词知识库,如公共政策主题(政府文件名称、文号、会议名称、政策主题),关键词,主要内容描述,利益相关对象描述等。二是数据抽取和基本清洗。选取公共政策出台后一段时间(如出台后半年内的数据),选取特定的互联网渠道作为数据采集来源,采用爬虫技术或向第三方数据爬虫公司购买相关数据,经去重、去噪、数据归一化后集成入库。三是数据定向抽取和建模清洗。按照评价模型体系评价指标的要求和聚类分析的数据规范,对单个指数进行数据抽取和规范化建模清洗,形成每个指数聚类分析所需的数据集市。
3.2 评价模型指标体系
采用传统指数分析与大数据聚类分析相结合的方式建立评价模型指标体系。评价模型为三级指标模型,建立层次化结构的公共政策评估指标体系。一级指标从政策关注度(A)、政策舆情评价(B)、利益相关者评价(C)、网上调查问卷(D)等四个层面反映互联网大数据对公共政策实施评估的主题评价,二级指标是对上一级影响因素的进一步细分,第三级指标通过数据处理和聚类分析,采用可量化的数据对前一级指标的每个方面进行描述。三级指标的数据处理,主要是在对定向数据集进行分词处理、语义分析的基础上,通过聚类分析算法,得出量化评分。
计算公式:P=k1*A+k2*B+k3*C+k4*D;
0
K1-k4为权重,取值范围为0-1,且k1+k2+k3+k4=1;
A-D为一级指标取值,通过二级指标加权计算得出,取值范围0-100之间,如A=k11*A1+k12*A2,K11-k12为权重,取值范围为0-1,且k11+k12=1。
二级指标取值通过三级指标加权计算得出,取值范围0-100之间,如A1=k111*a11+k112*a12+k113*a13+k114*a14,K111-k114为权重,取值范围为0-1,且k111+k112+k113+k114=1。
推荐阅读:大数据挖掘的论文投刊指导
期刊VIP网,您身边的高端学术顾问
文章名称: 大数据框架下公共政策实施评估研究
文章地址: http://www.qikanvip.com/jisuanjixinxiguanli/57879.html