《电子技术应用》
您所在的位置:首页 > 其他 > 设计应用 > 基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究
基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究
网络安全与数据治理
高娜1,东梅2
1.宁夏大学农学院; 2.宁夏大学经济管理学院
摘要: 运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、技术应用等方面随时间推移呈现不同演化趋势;四大区域受经济发展水平、文化资源禀赋、政策导向影响,在企业角色强调程度、地区特色旅游发展以及国家级项目和竞争力方面存在地域差异。
中图分类号:G120;D601文献标识码:ADOI:10.19358/j.issn.2097-1788.2024.07.008
引用格式:高娜,东梅.基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究[J].网络安全与数据治理,2024,43(7):47-55.
A textual study of cultural policies in Chinese provincial five-year plans based on Word2Vec and LDA topic model
Gao Na1, Dong Mei2
1. College of Agriculture, Ningxia University; 2. College of Economics and Management, Ningxia University
Abstract: This paper use the theme model analysis technique combining Word2Vec and LDA to identify the themes of cultural policies in the texts of the five-year plans of 31 provinces in China in three periods, and carry out the mining and evolution analysis of the themes of "cultural policies" in two dimensions: time and space.The paper found that the theme of "cultural policy" has shown different evolution trends over time in terms of development trends, shifting focus, policy orientation, and technology application, etc. The four regions are influenced by the level of economic development, cultural resource endowment, and policy orientation, and there are geographical differences in the degree of emphasis on the role of enterprises, the development of regional tourism with special characteristics, and the development of nationallevel projects and competitiveness.
Key words : LDA topic model;Word2Vec;five-year plan;cultural policy;text analysis

引言

政策指政党或国家为实现一定历史时期的任务而制定的行动纲领、方针和准则[1]。政策文本是在政策制定与实施中所产生的过程性文件,包括法律法规、行政规章、办法、通知等。省级政府颁布的五年规划文本为地方经济发展远景规定目标和方向,具有战略性和规划性的特点,成为政策文本研究的重要工具和载体。随着文化产业的兴起及其在经济发展中的作用日益凸显,文化发展也成为推动地方繁荣与创新的关键。“文化政策”是国家干预文化的工具,是影响文化生产的政府行为[2]。通过五年规划中“文化政策”文本进行主题抽取分析,可以掌握政府的政策倾向与关注焦点,助力区域高质量发展。政策文本分析被广泛应用于气候变化协议(Lipschutz & McKendry,2014)、环境政策(Lester et al.,2016)以及公共卫生政策(Gruening et al.,2017)等领域。现有研究有文本内容分析、政策文献计量、社会网络分析和政策文本挖掘等,其中政策文本挖掘又涵盖政策文本分类、情感分析及主题挖掘等诸多方法[3]。潜在狄利克雷分布模型(Latent Dirichlet Allocation,LDA),通过对文本语义降维处理,使其结果具有更好的可解释性,被广泛应用于政策文本主题挖掘,该模型最早由Blei等人提出,但其不考虑单词之间的关联以及使用onehot形式进行编码,导致词间的语义关系缺失和双重稀疏性,后来Nguyen等提出将LDA与Word2Vec结合,创建LDA2Vec模型以克服传统模型的缺点[4]。“文化政策”主题研究聚焦于政策制定、政策实施、政策评价方面。国内学者专注于“文化事业”和“文化产业”两大领域,一部分学者研究文化事业的公共文化服务领域[5]、公共治理[6]等问题;另一部分学者从理论层面关注文化产业概念辨析[7]、发展战略研究[8]以及文化高质量发展[9]等问题,在实践层面聚焦文化产业的园区建设[10]、发展方式转变[11]、数字文化产业设计[12]。国外学者对于文化政策研究主要聚焦于文化消费[13]、文化认同[14]、文化产业政策与产业能力的研究[15]、文化产业政策与全球化研究[16]。总体而言,目前政策文本挖掘集中于信息抽取、聚类、分类等方向,缺乏语义相关的视角,基于政策特征的“文化政策”文本挖掘欠缺,难以揭示政策文本隐含语义和关系,不利于政策文本主旨内涵的准确把握等问题。本文在内涵挖掘与差异化比较分析需求的驱动下,基于LDA2Vec构建政策文本主题挖掘模型,对比分析不同区域、不同时间的主题特征,以期实现“文化政策”文本核心重点的挖掘和差异分析,据此提出对策建议,推动政府对已有工作的准确梳理以及政策布局的优化调整,进而为我国文化领域发展决策提供参考。


本文详细内容请下载:

http://www.chinaaet.com/resource/share/2000006091


作者信息:

高娜1,东梅2

(1.宁夏大学农学院,宁夏银川750000; 

2.宁夏大学经济管理学院, 宁夏银川750000)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。