
如何以理念、价值和原则为导向,把握技术的运用、规制技术的边界,是互联网宗教舆情研判至为重要的落脚点。从整体上看,“互联网宗教舆情研判系统”至少要包括智能化的数据采集、分析、呈现与干预等4个环节。以下从每个环节的需求起点、技术对接以及具体案例的技术流程等方面作一简略介绍。一、智能化数据采集案例:垂直领域的精准搜索引擎开发涉及宗教的互联网数据的呈现、收集和抓取,需要有理论框架设计。在实际的智能数据采集环节,首先需要确立的是依据理念架构与价值判断来指导抓取什么、如何抓取,然后再进入具体的结构化数据库搭建与抓取工具开发。服务于数据采集的常见技术手段之一是搜索引擎。从需求的角度来看,使用互联网通用搜索引擎搜索宗教类词汇时,由于网络海量信息的淹没,导致检索结果中无效信息太多,稀释了有价值的信息,很难有专业性、针对性和精确性,搜索结果对于舆情监测而言往往不具备太多参考价值。于是,开发宗教舆情监测领域垂直搜索引擎的必要性就显得十分突出。具备实用价值的垂直搜索引擎可以专门对互联网宗教领域的资讯和各类信息进行专业和深入的分析挖掘、过滤筛选,并以结构化的有效方式返回给使用者以辅助决策。进一步,对于涉及宗教的互联网舆情而言,主题化、事件化、热点化的网络舆情,是最为常见的爆发形式。宗教互联网舆情的传播,有“人群聚类现象”“较强的观点性”“扩散节点较为固定”等基本特征。普通水平化的垂直搜索引擎也难以满足需求,需要进一步探索主题式的垂直搜索引擎。比如,从现有实践看,在佛教界弘法经验的指导下开发的“禅林搜索”,是舆情监测领域主题式垂直搜索引擎的案例之一。“禅林搜索”基于Elasticsearch开源搜索与分析平台,进行了二次开发,针对佛教的特定领域、特定人群、特定需求,搜索符合主题需要的信息资源,提升信息的价值密度,构筑起佛教专有的网络信息资源库。从数据来源和数据特点上看,“禅林搜索”通过人工设定网址和网页分析技术等方式,在渠道上覆盖了和佛教舆情紧密相关的“两微一端”平台(微信、微博、新闻APP),以及网站、论坛、贴吧、博客、视频、报刊(主流报刊多已实现电子化)等,在类型上覆盖了原文、评论、转发、原贴、跟/回帖等形式。从数据处理上看,“禅林搜索”突破了关键字搜索的单一化功能,对查询需求进行主题化、事件化、热点化的建模,在与用户高度交互中提取结构化的信息进行反馈,实现用户对舆情热点事件的掌握和追踪。“禅林搜索”所采用的面向主题的网络信息采集技术,如主题爬虫技术、主题搜索引擎等,是宗教舆情监测智能化采集的一个代表性发展方向。这一专业搜索引擎还能够进一步承载后续的智能化分析、呈现与干预所需要的信息抓取任务。
二、智能化分析案例:“情感态度监测与预判”系统
互联网宗教的治理需要合理运用技术,下沉到人的源点来了解宗教舆情事件爆发的源头,并对接有效的治理手段。比如,在互联宗教网舆情的智能化分析环节,现有的开发案例如“情感态度监测与预判”系统(佛教),已尝试在个别宗教舆情事件的进程中,追踪参与者的情感态度变化,关注个体行动细节给整个事件走势带来的影响。具体操作方法是对主题化、事件化、热点化的佛教网络舆情事件,在大范围抓取互联网相关评论的基础上,通过适量的人工标注与机器学习技术,对网民尤其是宗教信仰者的评论立场、态度变化与发展趋势进行观察。从与主题式垂直搜索引擎衔接的角度看,基于主题的网络舆情分析还有赖于宗教界根据自身特质与实践积累来自行研发。较为传统和一般化的数据分析如趋势分析、重点媒体分析、热度分析、对比分析等,虽然在比较成熟的商用民用分析平台上都不难实现,但往往只能进行以关键词为线索、以单篇资讯为单位的分析,难以对主题化、事件化、热点化的宗教网络舆情进行综合观照。佛教界现有的“情感态度监测与预判”系统是以主题或事件为单位的互联网评论分析系统,是一个与主题式垂直搜索引擎相衔接的数据分析上的初步尝试。以2018年“滴滴公司世界杯广告戏谑佛教事件”为例,该系统可以实现在爬取目标媒体平台百万数量级的网络公众相关涉数据的基础上,分析网络公众的情感态度格局与走势,并通过向涉事方展示相关舆情数据而推动事件本身的积极解决。值得注意的是,从上述“情感态度监测与预判”系统的研发中可以看到,佛教界长期弘法护法实践中的知识积累与经验积累,不但是对技术提出准确需求的基础,同时也对诸如语义特征抽取转换方法、信息聚类和分类算法、基于情感本体的倾向性分析等技术开发环节,起到了重要的启发作用。这一系统还具备一定的扩展潜力,有望通过调试升级等迁移到类似的需求情境中进行应用。
三、智能化呈现案例:互联网佛教舆情指数体系
舆情监测状态与结果的呈现,实质上也是一种直观化的舆情分析形式。当前各个行业都在流行“数据可视化”,依据已获得的数据及其内在模式和关系,利用计算机生成图像来获得深入认识并辅助决策。数据可视化的有效和有益,首先应归功于其背后基本分析思想的完备性。比如,在互联网佛教舆情的呈现与可视环节探索中,“佛教舆情指数体系”就是一种通过指数设计与指数计算,对热点舆情事件进行排名而集中展现一个周期内佛教舆情态势的技术应用形态。该指数体系通过关注度、活跃度与共识度三个指标的综合计算,全面汇总提炼佛教热点舆情事件的相关资讯与数据,在此基础上对年度、月度热点事件进行排名,量化反映佛教事件综合影响力,并产出附有事件简要分析的年度、月度舆情报告,协助业界对该领域内的热点与动态进行掌握。这一体系中所使用的权重的确定,以及有关事件属性(正面、负面、中性)的确定,通常由德尔菲法(专家打分法)确定,即将佛教界大德、意见领袖、舆情专家的意见统计在其中,是定量计算与定性界定的结合。
具体到数据结果的可视化上,“佛教舆情指数体系”有三种图文呈现形式:一是佛教舆情热点事件影响力指数排名列表,简要列出一级指标即关注度、活跃度与共识度的得分以及加权汇总的最终指数得分;二是佛教舆情热力地图,直观呈现舆情事件爆发地以及影响力的地理分布情况;三是舆情热点事件述评,在追踪和抓取到的事件相关资讯和数据基础上进行人工分析并形成舆情报告,勾勒出重要事件的舆情结构、传播路径与影响态势。值得一提的是,前文提及的主题式垂直搜索引擎“禅林搜索”可以结合机器学习与人工研判,直接实现舆情指数的计算与舆情报告的生成。
四、智能化干预案例:宗教活动场所商业化预警系统
宗教活动场所商业化预警系统,是一个非常鲜明的以需求为导向、服务于互联网宗教舆情干预的技术开发案例。仍以佛教界的先行实践为例,正规佛教活动场所遭遇不合理不合法的商业化开发,是一直以来佛教界合法权益被侵损的典型形式之一。“佛教活动场所商业化预警系统”,就是旨在从互联网新近公开的新闻报道、城镇化规划文件、改扩建与拆迁规划文件、商业与旅游开发和环保消防政策变化等资料的在线图文中,发现与佛教寺院地理位置相关的规划与开发信息,对商业化侵损寺院的潜在可能性提出预警的系统,由此改善佛教寺院信息不对称、合法权益维护滞后等被动局面。佛教活动场所商业化预警系统的大致框架由佛教活动场所的地理位置信息数据库、在线图文抓取系统和以Xgboost和Random Forest为主的机器学习算法所建立的联结构成。
首先,建立和完善“佛教活动场所地理信息数据库”。逐步收集佛教活动场所的地理位置信息,包括省、市、区县、乡镇/街道和具体所在名称,并进行编码;同时与包含全国各地旅游景点、商业场所、地标性建筑、城市规划等信息的数据库进行对接。由此,用行政区划上的地理位置与周边经济社会领域的关键词,对每一个寺院进行地理信息数据层面的描述。其次,拓展主题式垂直搜索引擎技术,周期性爬取互联网新近公开的新闻报道、城镇化规划文件、改扩建与拆迁规划文件、商业与旅游开发、环保消防政策变化等资料中出现的佛教寺院地理信息数据相关图文,结合人工评判与机器学习技术,设置预警算法与门槛。这一系统也可以移植到其他各类宗教活动场所的相关应用领域中。
来源:虚云老和尚、中国宗教
延伸资源下载(千G中华传统经典古籍|儒释道古本及民间术数大全超强版持续更新中......)

版权声明:本站部分内容由互联网用户自发贡献,文章观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请拨打网站电话或发送邮件至1330763388@qq.com 反馈举报,一经查实,本站将立刻删除。
文章标题: 明贤法师:关于开发“互联网宗教舆情研判系统”的思考发布于2022-01-21 18:10:16