

英语原文共 25 页,剩余内容已隐藏,支付完成后下载完整资料
电信政策41(2017)-877
ScienceDirect提供的内容列表
电信政策
期刊主页:www.elsevier.com/locate/telpol
电信政策议程的演变:电信政策四十年的文章
JoseLuisGoacute;mez-Barroso a,*,Claudio Feijoo b,Manuel Quiles-Casas c,Erik Bohlin d
应用经济学和经济史系 - UNED(国立远程教育大学),Po Senda del Rey,11,28040 Madrid,
西班牙
b西班牙马德里理工大学 - 中国同济大学
c经济学研究硕士 - 西班牙UNED(国立远程教育大学)
d瑞典查尔姆斯理工大学
A R T I C L E I N F O.
关键词:电信政策文本挖掘
聚类分析文献计量信息政策议程
摘要
本文通过“电信政策”杂志上的文章从1976年到2016年的文本挖掘,研究了电信政策议程的演变。文本挖掘技术有助于识别这一多学科 - 技术,经济,社会,政策 - 学科中的关键主题,概念的主要组合和主要研究领域。此外,它们描绘的政策议程的演变比传统的公共服务,竞争前和自由化后的电信阶段更为细微。此外,结合文献计量信息,结果显示了研究领域和方法,国家和作者背景之间的关系,共同提供了对电信政策研究过去,现在和未来途径的更深入理解。
- 介绍
与大多数学术期刊不同,“电信政策”有两个显着特征:(1)它的成立具有明确和无限的目标,多年来没有改变,(2)其标题准确地反映了这一目标。电信政策第一主编劳伦斯·H·戴(Lawrence H. Day)在1976年12月(1976年,日)发表的第一份编辑评论中写道,该期刊将以某种方式继续讨论电信期货和政策选择[...]这对政府和行业的决策者和政策分析师最有用,同时承认期刊上发表的大量材料预计来自学术界,国家和国际政策研究组织。
学术界和利益相关者之间寻求对话的方式是双重的。首先,来自这里和那里的决策者毫无疑问地利用了期刊上发表的进展和想法。不幸的是,这种情况发生的程度和方式无法在本文的框架内阐明。相反,政策议程已经导向甚至限制了研究议程,因此,研究期刊中发表的文章涵盖了主题。
热门政策和监管问题以及出版物之间的这种持续联系具有特定的目的。当达到一定程度的成熟度时,每个学科都回过头来分析它自身的演变。通常,这需要相当大的努力来收集和组织事实和文件,这些事实和文件通常分散在各种来源中。如果是
*通讯作者。
电子邮件地址:jlgomez@cee.uned.es(J.L。Gomez-Barroso),克劳迪(C. Feijoo),erik.bohlin @ chalmers.se(E。Bohlin)。
HTTPS://do i.org/10.1016/就.特伦破裂.2016.11.005
2016年11月20日收到; 2016年11月21日接受
2017年4月20日在线提供
0308-5961 /copy;2016 Elsevier Ltd.保留所有权利。
电信政策 - 作为一门学科 - 电信政策 - 作为期刊 - 的特权渠道的存在为这项任务带来了实质性的简化。在没有明显否认可以在其他地方找到许多有趣的作品的情况下,电信政策一直保持并保持领先地位作为该领域的参考。电信相关市场发生的事情在期刊的页面上有所反映;在那些值得发表的文章中讨论过的内容经常出现在监管机构和决策者的网站上。
考虑到这一点,本文打算回顾电信行业议程的演变 - 这是这个议程中最相关的项目以及它们如何随着时间的推移而发展 - 通过眼镜看待它电信政策中发表的文章。为此,已经采用了多种针对文本挖掘的多变量(大)数据分析技术。使用这些方法的目的有两个:这些是用于识别一组文本文档(如期刊论文)中的重要项目的最合适的工具,而从作者的角度来看,它们的用法提供了文本可能性的说明。信息和通信技术研究领域的分析,是许多行业和研究领域日益流行的方法,但很少应用于ICT领域。除了文本挖掘分析,但总是偏离它,还增加了文献计量信息,以探索研究的主要维度 - 政策议程中的主题 - 与方法论方法或地理分布等其他变量之间的联系。
本文的结构如下:在介绍之后,下一节简要讨论学术出版物与政策制定之间的联系,以便将本文的发现置于上下文中。接下来,关于方法的部分解释了数据的收集,预处理,文本挖掘技术和所使用的软件。随后的部分介绍和讨论了结果,特别关注聚类分析。最后,结论部分结束了这篇文章。
- 学术期刊以外的学术期刊的作用
学术期刊的有用性总是用学术术语来衡量。期刊排名和评级是评估期刊绩效的标准。在不否认这些指标的重要性的情况下,它们并未反映出它们可能产生的更广泛影响。科学研究本身没有意义,但被理解为帮助社会进步的努力。
如何评估超越学术期刊最重要的游戏领域的影响是一个悬而未决的挑战 - 确实是一个非常艰巨的挑战。对于那些技术领域的期刊,可以通过追踪从学术文章中获得的知识转移到可销售的产品来衡量它们的重要性。例如,已经提出了一种排名系统,该系统将专利中的引用次数视为衡量期刊技术价值的代表(Liaw,Chan,Fan,&Chiang,2014)。对于其他类型的期刊,特别是政策期刊,很难预料到会有这样一个类似的排名。
然而,这并不意味着没有反映如何最好地利用 - 在现实世界的条件下 - 学术中所包含的知识与政策含义有关。几乎与电信政策一样古老的是两项贡献,即便在今天继续支持任何进一步的工作。 “两社区理论”(Caplan,)在很大程度上主导了随后的辩论,他们声称政策过程中研究的不充分利用问题或者不利用研究的问题在于政策制定者和学术界形成两个独立和不良的问题。连接的社区,根据不同的规则运作,说不同的语言,并受到不同奖励制度的激励。通过更积极的方法,“社会研究的启蒙功能”(Weiss,1977)指出决策者倾向于间接地使用研究,作为“思想,信息和对世界的定位(......)的来源,尽管过程是不容易辨别,随着时间的推移,它可能会对政策产生深远的影响“。
在过去的40年里,进一步的贡献得到了调整,但没有取代这些理论。有许多合理的中间方法可以使更极端的位置变得微妙。总之,可以说决策者在使用和不使用研究之间没有简单的二分法;相反,这种关系发生在一系列互动中,一些公务员与学术研究的关系比其他人更为密切(Newman,Cherney,&Head)。
尽管人们都在努力深入了解这种相互作用是如何发生的,但整体证据在某种程度上令人沮丧:“除了一些传记账户和案例研究之外,在更一般的层面上,政策制定者的做法令人惊讶地知之甚少。实际上参与学术研究和专业知识“(Talbot&Talbot,)。因此,结论是,在电信政策的特殊情况下,它无疑会影响电信政策,尽管它无法确定或衡量。
但同样明显的是,电信政策影响了电信政策。政策活动与学术研究之间的这种反向联系以前从未被探索过。虽然可能并不总是像直接关系那样具有吸引力,但它有助于提出其他一些问题,其中最突出的是分析特定领域的历史演变。
本期刊和这一知识领域就属于这种情况。 1974年由美国司法部对AT&T提起的反垄断诉讼可以被认为是标志着现代电信政策时代开始的里程碑。电信政策目睹了这一漫长过程的解决,以及此后发生的任何其他具有里程碑意义的事件。在其页面中,当时的时事已被解剖,分析,讨论和挑战;在进入市场之前,已经预见到即使在长期内也将发挥关键作用的问题;作者已经起草了提案并提出了建议。学术或从业者,任何有话要说的人都已将他/她的工作首先发送到电信政策。解开电信政策过去的路线是了解电信政策的历史和议程。
图表1.每年分发电信政策文件。注:1976年只发表一期; 2016年至6月期间的数据。资料来源:Elsevier数据自己的计算结果。
- 方法
现在,作为一个活跃的研究领域,文本挖掘 - 或文本分析 - 是一个广泛的术语,用于描述分析和处理半结构化和非结构化文本数据的一系列技术。在类似于数据挖掘的方式中,文本挖掘试图通过识别和探索有趣的规则,模式,趋势或关联来从数据源中提取有用的信息。然而,在文本挖掘的情况下,数据源是自然语言文档集合,并且有趣的模式不是在形式化的数据库记录中发现的,而是在这些集合中的文档中的非结构化文本数据中发现的(Feldman&Sanger,)。受数据挖掘的启发,文本挖掘依赖于预处理例程,模式发现算法,模式分类和表示层元素(如可视化工具(Weiss,&Damerau))。文本挖掘可以包括许多相互关联的目标:搜索和信息检索,文档聚类,文档分类,信息提取,自然语言处理和概念提取。其中,本文着重于聚类 - 相互关联的论文 - 分类 - 这是在特定类别中安排类似论文的基础 - 和
概念提取 - 电信议程。
-
- 文字收集
本文分析了自1976年12月发布的初始编号以来电信政策期刊上发表的信息,直到起草本工作时的最后一期(2016年6月)。该批次共有272个问题,共有2,216篇论文。从这些只有2,121个进行了检查,留下了76篇社论和19个没有足够数据分析信息的笔记。这是使用文本挖掘术语,用于分析的文档的“语料库”。
论文的平均页长为11.8(中位数12和模式11),标准差为5.95。图表1显示了可以区分四个主要时期的论文的年度分布:(i)从1976年到1991年的论文数量相对较多; (ii)1992年至1998年的文件数增加; (iii)在1999年至2007年期间再次出现相对较低的情况; (iv)2008年至2016年的论文数量呈增长趋势,2014年达到绝对峰值。
对于每篇论文,标题,摘要,关键词,背景材料和作者国家以及引用次数都被收集。全文未被考虑有两个主要原因:假设摘要是论文主要内容的良好表示,全文检查会花费太多时间和资源,而不是对这些数据分析的方式提供不同的说明技术可用于ICT研究领域。
-
- 文字预处理
在进行分析之前,本文遵循了文本挖掘的常规工作流程。首先,所有单词都转换为小写;然后,删除非字母字符以及常用英语停用词。在这个初始阶段之后,文本语料库已准备好被标记化并传递到下一个阶段,这称为词干。基本的词干过程包括通常通过删除字符来减少和/或分组单词(例如复数形式的名词),直到找到共同的词根。这些任务是在Porter stemmer的最新版本(Snowball)中完成的。
预处理的下一步是合并三个不同的文本字段:标题,摘要和关键字。虽然有些作者喜欢避免使用关键词(Delen&Crossland,2008),甚至是标题(Miner et al。,2012),但引用偏见的可能性是因为它们可能是作者想要的术语。为了使他们的文件与文章的真实描述符相关联,本文倾向于同等地权衡和组合三个文本字段,假设大多数作者 - 在电信政策的高质量审查过程的帮助下 - 将正确描述这篇文章的标题和关键词都是如此
这种组合将是对其他可能方法的关键术语的更好权重
1根据Ramampiaro的说法,提高标题,摘要或特定句子或术语可以提高文本挖掘结果的质量。特别是,他们建议将标题字段加权为摘要的两倍。有更复杂的方法可以通过关键字的数量和它们包含的标题词来衡量句子,甚至是包含段中句子的段落的位置,以及句子在包含段落中的位置(Tseng,2007)。
整体结果是6,348个根词,在修剪动词,形容词和副词后减少到4,333个。
-
- 数据分析
文本挖掘工作流程的第一步是建立频率 - 逆文档频率(tf-idf)这一术语。这是一个统计数据,用于衡量文档中单词与语料库的相关性。它随着文档中一个单词的出现频率而增加,但它通过整个语料库中单词的频率进行校正,从而允许一些单词在一般情况下更频繁但不一定非常重要的事实。
接下来,本文选择了探索性因素分析,其目的是找出文本中概念之间的基本模式和关系,并作为首先尝试在较小的关键因素中压缩论文集中可用的信息。这部分分析的结果是一组高度相互关联的词,称为因子,组件或维度,假设它们代表概念关系。在文本挖掘的情况下,由于文档矩阵与术语的稀疏性质,奇异值分解(SVD)是提取这些概念关系的推荐实用技术(Miner 2012)。 SVD通常用于统计自然语言处理,以识别在语料库中组织文档的“潜在的意义维度”。以这种方式分组的信息包含所有原始信息,但变
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[20419],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
