R语言与网络舆情处理
于卫红
内容简介
进入互联网时代后,网络舆情形成迅速,影响着社会生活的方方面面,如何高效全面地采集舆情数据并利用数据挖掘算法及数据分析工具将舆情文本中有价值的信息挖掘出来,对于舆情监管、舆情研判、舆情引导至关重要。本书以R语言作为舆情分析的工具,在阐述相关原理的基础上,介绍了网络舆情信息采集、舆情信息预处理、舆情文本分类、舆情文本聚类、舆情数据关联规则挖掘、舆情相关指标预测等舆情分析环节,所有分析都使用R语言进行实现,给出了完整的过程和代码。本书可以作为舆情处理、数据分析等教学或科研的技术参考书,适于本科生、研究生、数据分析爱好者、舆情分析工作者及研究人员等阅读参考。 前言
2013年8月19日和20日,习近平总书记出席全国宣传思想工作会议并发表重要讲话;2014年10月15日,习近平总书记主持召开文艺工作座谈会并发表重要讲话;2015年12月25日,习近平总书记视察解放军报社并发表重要讲话;2016年2月19日,习近平总书记到人民日报社、新华社、中央电视台三家中央新闻单位进行了实地调研后,主持召开党的新闻舆论工作座谈会并发表重要讲话。从这些讲话中,我们可以深刻地领会到:党中央高度重视舆论宣传工作,根据形势发展的需要,更是把网络舆情监督和引导当作重中之重来抓。
在当前的互联网及大数据的时代背景下,网络舆情形成迅速,影响着社会生活的方方面面,如何高效全面地采集舆情数据并利用数据挖掘算法及数据分析工具将舆情文本中有价值的信息挖掘出来,对于舆情监管、舆情研判、舆情引导至关重要。网络信息的不断膨胀给舆情工作提出了新的挑战,为了更好地进行舆情收集、舆情研判、加快构建舆情引导新格局,舆情工作方式、舆情管理思维、舆情数据分析技术等都需要不断创新。
作者在本书的写作过程中阅读了大量的相关文献。文献研究表明,目前,越来越多的学者加入到了网络舆情的基础理论、支撑技术和演化机制等的研究中,网络舆情…