如何衡量网络时代下的公众舆论:在谷歌统治或谷歌政体下运作?外文翻译资料

 2022-12-08 11:12

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


如何衡量网络时代下的公众舆论:在谷歌统治或谷歌政体下运作?

肖恩·j·韦斯特伍德

通信系,斯坦福大学,麦克拉奇大厅,塞拉商城450,斯坦福大学,CA94305,USA

seanjw@stanford.edu

摘要:互联网的兴起把信息获取从媒体精英发起的一个自上而下的过程向自我选择和搜索的过程转化。这引发了关于信息获取和意见形成之间关系的一个根本性问题:这个过程是平行发生的或作为一个自我导向的反馈回路的一部分流程?也就是说,我们搜寻资料来制造舆论,我们搜索信息来支持自己的观点,还是两者同时进行?从2008年的美国总统大选的分析表明,社会公众使用谷歌搜索结果和查询信息,公共信息查询是反映调查数据和选举结果的。在政治方面搜索数据的绝对数量还表明,人民对公共信息的欲望可能超过公共政治成熟的标准假设。

关键词:网络;搜索;公共舆论;新媒体;信息获取

1、介绍

信息和舆论形成的可用性之间的良好关系证明:可用的信息越多,舆论普遍被认为是越有理有据的[1]。传统机制中信息获取的过程是利用口头传述或者直接搜索。互联网搜索引擎的介导结构是利用嵌入算法搜索的概念作为信息获取的过程中几乎不可分割的内在组成部分。搜索引擎对排名和过滤数据的突出提出了关于信息获取和舆论形成之间关系的一个关键问题:这个过程是平行发生还是作为一个自我导向的反馈回路的一部分流程?在介导的环境中,我们搜索信息制造舆论,我们搜索信息来支持自己的观点,还是我们两者同时进行?此外,如果舆论是通过中介的信息采集形成,那么谷歌和其他搜索引擎的力量是否成为强加给公众所知的威胁?本文列出了社会对谷歌和其他搜索引擎的依赖可能带来的威胁[2,3,4]和优势[5]的建议,但对网络社会舆论的形成结构的调查是必要的,用以证明是谷歌政体的威胁还是谷歌统治的承诺。本研究调查2008年总统大选期间谷歌搜索记录和传统舆论措施之间的关系,比较两个搜索量和舆论的日常情况。这些数据突出强调了公共舆论和信息查询之间的强烈关系,并暗示在网络时代的舆论形成是社会驱动反馈回路的一部分,而不受搜索信息的约束。如果有的话,从这项研究的数据表明,在网上新闻搜索中的普遍舆论倾向有更大的偏差(即互联网有利于问题的两面,即使对那些固定观点)。

从自上而下的媒体系统对信息的绝对垄断转化为互动性和用户驱动的信息获取过渡理论上说增加了可用的信息量,但互联网的设计使定位相关信息在没有搜索引擎和同行推荐的援助下变得很困难。过去的研究显示出了用户从搜索引擎访问网站的有限的多样性,现代搜索引擎越快的更新其索引,谷歌推广由高排名的页面链接的页面的倾向,以及可替代消息的增长,比如博客经常更新可能会提供额外的信息广度等。至少,信息在搜索结果中更大。在外部控制的实验室实验,衡量人们如何搜索政治信息的第一步是要看相关的具体措施的搜索字词的相对普及度。对于本文中,搜索“奥巴马”和“麦凯恩”的比较主要在于投票的数据和主要的竞选活动。

在对2008年的运动的搜索结果进行正式讨论之前,有几个重要的考虑因素需要进一步的阐述。智能搜索引擎如何评价网站在互联网上是通用的,每个搜索引擎的算法作为专有信息的具体实现。在最简单的层面上,谷歌和最新的搜索引擎在互联网上相对受欢迎程度根据排名数据可见。通过辛德曼等人的“谷歌网页排名”算法的初步分析。[ 2 ] 这表明,谷歌限制用户在一个小集合的热门网站曝光网络上的政治信息。进一步的研究表明,尽管搜索结果的算法生成的,有根深蒂固的偏见[ 3 ],限制了信息的获取和分配[ 4 ]。这种分析是有用的,但作为一个实验研究,它有2个现代的问题:谷歌算法的结构和减少的时间间隔之间的索引更新。

首先,谷歌的算法优先评级网站的链接数量而不是链接的质量,因此,通过谷歌设计促进上市的相对不受欢迎的网站,被链接到的网站,在谷歌现有的数据库是高度排名[5]。对于瞬息万变的政治信息,意味着谷歌政体可能更像谷歌统治,在新的政治信息均视为由同行的重要相关的是在谷歌的排名尽管链接到新的信息较低的总数提升。这可能不是淡化目前在谷歌搜索查询的顶级网站施加的霸主地位,但对高排名的政治网站的链接倾向到基于内容相关的注入新的来源到谷歌通过准“社区行动”前,不仅通过由谷歌搜索的互联网内容随机评估。其次,谷歌的数据,很多互联网领域最受欢迎的是更新的增量小于一小时不断变化的指数来反映互联网最新的结构,而辛德曼等人。研究描述了谷歌每隔几天更新其指数,甚至每周的状态。而用户往往放置在搜索结果[6],目前谷歌的算法可以提供比现有文献更具活力和快速的结构。

互联网信息的关注量呈指数增长,而一些过滤和选择在几乎无限的搜索结果,以更小的和更易于管理的列表中的压缩发生。一些人认为,这种压缩人为地限制提供给人们的信息[7],所以问题“谷歌的数据从何而来?”对理解人们如何通过谷歌搜索引擎过滤的信息交互变得至关重要。详细的研究已经讨论了打印介质的过渡到互联网[8],基于因特网的新闻组织[9],以及博客内的信息源之间的关系的进化[10],但要理解的政治信息流在互联网上的所有三个数据源是必要的。虽然每个类别源在谷歌搜索结果中的人气有所不同,谷歌是包括所有三个在一起是提供给所有用户一个单一的指标。

2、方法

用于该项目的两个数据集。第一个数据集捕捉搜索引擎的流量,第二捕获研究调查数据的时期。

搜索数据。来自三大搜索引擎的数据将是最完整的,但是目前数据仅一应俱全来自谷歌。使用只有谷歌的数据确实存在局限性,作为谷歌命令的搜索市场超过50%,并有相似的其他两个主要的搜索引擎人口统计数据[11],谷歌为代表的互联网搜索活动的一个合理的样本。在这个项目中使用的谷歌数据是通过谷歌趋势聚集。谷歌趋势是一个网络小程序,它提供了有关地理位置和时间的搜索查询信息。这个项目在谷歌搜索引擎使用了搜索词“奥巴马”和“麦凯恩”这关注度差不多高的2名候选人。在这个项目中使用的配置,谷歌趋势包括所有的查询包含的指定条款,所以要求对“奥巴马”的数据,包括搜索词条如“奥巴马的税收政策。”

其他搜索引擎已经收到了关于结果操作的批评,谷歌一直在批评广告放置,核心搜索结果不会改变。谷歌报告数据作为标准化和标准值。数据是由谷歌的查询的总数中的时间段选择和所选择的地理区域内标准化,且由平均数量搜索术语的自2004年1月标准化。对于多个搜索词,搜索的第一个搜索词的平均数量标准化为其他搜索条件的值。因此数据是相对受欢迎的功能搜索项之间易于比较。

政治候选人的相对利益是很难从谷歌的数据进行评估,作为原料的搜索量是不可用的,而是相对的普及与包含一个众所周知的参考项的近似。性,其中最一致流行的搜索自2004年在谷歌使用的术语,被列入中,谷歌的所有数据提取提供一个参考点[12]。

此外,从谷歌收集的数据的两个子集。要显示整个过程主要在两个奥巴马和麦凯恩的利益长期趋势,从数据2007年12月至2008年12月收集的。有关搜索活动和投票数据和每日的搜索活动,更小的时间从2008年8月1日至11月2日之间可能存在的相关性主要竞选活动的影响,更有针对性的探索,2008年被选中。第二个示例抓住最重要的事件在2008年的竞选活动的最后部分,并形成为广大本文的基础。从11月2日至11月4日的数据,因为奥巴马的搜索人气极高的价值压缩的其它数据,使可视化绘制值之间的差异是巨大的无图(比打印的页面大)不可能不包含的样本。

人们还广泛搜索网上信息在许多不同的方式和方法中[13]的高方差,但条款的人要约洞察一般意图进行搜索。搜索条件,包括总统候选人的名字可能从大约围绕每个候选搜索具体的政策细节察觉阴谋搜索。搜索条件,包括总统候选人的名字可能从大约围绕每个候选搜索具体的政策细节察觉阴谋搜索。尽管如此,用户仍在寻找有关候选人的信息,所以把所有的搜索每位考生提供评估每个候选在线利息一般指标。

调查数据。从2008年8月1日至2008年11月2日,所有可用的调查数据是从Pollster.com(轮询N =436,响应N =345910)收集。在此期间,大部分民调均好几天领域,这样就方便谷歌的数据和调查数据之间的更有意义的比较,从投票数据计算每日值。要建立日常的轮询平均数,每个民调数据被分成日常段(样本n/现场天)重达民调结果每天投票在外地。每天的所有值随后平均,与只在本文中所用的结果数据。

3、结果和讨论

全局摘要:2007年12月至2008年12月。对麦凯恩和奥巴马的兴趣在2007年12月和2008年十二月期间大幅增长。在此期间,奥巴马与麦凯恩相比仍然更受欢迎,麦凯恩超越奥巴马的受欢迎程度(缩放和四舍五入问题,这个不起眼的图1)除外。麦凯恩比参考检索词“性”来说显得不太受欢迎,而奥巴马则较10月19日和11月9日之间的性行为更受关注。为了美国人的信用,人们在这短暂的窗口中搜索奥巴马的性材料来代替。

总体而言,奥巴马和麦凯恩的关注度在整个样本期间显著增长。奥巴马在高峰期搜索量比11月6日在取样的出发点的平均水平从0.15增长到6.6倍的平均比例水平。同样,在麦凯恩的兴趣达到顶峰1.5(仍低于窥探奥巴马人口的四分之一),从11月2日0.05奥巴马的比例平均搜索量的起点看奥巴马的平均比例搜索水平。同样,麦凯恩的兴趣在从0.5奥巴马的平均规模的搜索量在11月2日的一个起点达到顶峰。

在谷歌搜索活动的增加通常对应于活动期间的重要事件,但有几个峰值不是活动事件能解释的。讨论中的每个最后三个月选后续的特定事件的,但重要的是要注意,运动事件和谷歌搜索波动之间的不精确匹配的背景情况的讨论。

图1.谷歌搜索数据2007年12月至2008年12月

图2.谷歌和调查数据2008年8月

表1.八月重大竞选活动

整个8月,一些颠簸在对两位候选人的搜索兴趣中发生。在马鞍峰出现之前,对于“麦凯恩”的搜索量是比较平坦的,而对于“奥巴马”的搜索量略有增加。继马鞍峰出现急剧上升的搜索量为“麦凯恩”号和“奥巴马”的搜索量更清晰的上扬发生,虽然奥巴马之间的相对差异之前的查询和马鞍后低。搜索量为两位候选人拜登是在宣布奥巴马的副总裁之前相对平坦,而消息公布后,奥巴马的兴趣增加了两倍,而在麦凯恩的兴趣明显的跳跃出现。对奥巴马的兴趣也增加了他的正式接受提名,虽然没有像拜登宣布的那样。

最有趣的观察,从8月恰逢麦凯恩宣布佩林为副总统候选人。在麦凯恩的兴趣增加到了本月最高点,但奥巴马的兴趣也增加到它的最高水平的一个月。奥巴马,甚至在佩林的公告期间,是一个在整个一个月比麦凯恩更热门的搜索词。虽然有理由认为,奥巴马在宣布佩林普及过程中造成的积聚,并从他的高度电视接受提名的演讲流血,奥巴马为搜索词的热度在他讲话后立即下降。这是很难解释这一观察,但它有可能在奥巴马的兴趣在这段时间增加,因为互联网用户等待麦凯恩的副总统候选人提名不满意佩林,并希望奥巴马看作为替代。它也可能是奥巴马忠臣有兴趣奥巴马响应于帕林公告。两种解释,虽然并不详尽,也可能是因为更年轻,更自由的互联网受众的出现。

八月期间,搜索感兴趣的是大致相当于调查数据,通过奥巴马搜索流量的增长远远超过了他的民主党全国代表大会投票左右的收益。

表2,2008年9月重大活动事件

虽然麦凯恩谷歌的关注度并未与佩林的最初宣布作为共和党副总统候选人时一样,在共和党全国代表大会时期超过奥巴马,“麦凯恩”比“奥巴马”的搜索量更多。这昙花一现是唯一的一次,麦凯恩的搜索超过了奥巴马的搜索,对应于麦凯恩和奥巴马在调查数据的简要反转。

相比之前房利美和房地美的置入政府接管事件发生后和雷曼兄弟倒闭的金融危机期间看到了奥巴马和麦凯恩的搜索量略有增加。在此期间上升了,但非常小,相对均匀。两位候选人之间除了9月5日,当麦凯恩竞选兴趣很高,但下降了。在此期间,奥巴马搜索和搜索麦凯恩之间的相对差异在大约0.24基本一致。

表3.2008年10月和11月重要竞选活动

这一点与佩林的最初宣布的情况下,麦凯恩的竞选活动暂停和金融部门救助计划增加了谷歌两位候选人的关注度,但同时增加的候选人中大致相等,奥巴马麦凯恩相比仍然更受欢迎。

对于大多数月的奥巴马和麦凯恩搜索的相对数量上升,沉没在齐声大致符合民调数字线,以搜索为奥巴马整个月显著增加的数量和搜索麦凯恩保持相对平坦的数量。对于两位候选人搜索在第三个总统辩论的时间上涨,但其他的新闻价值的事件,如佩林的衣橱成本和Al史密斯晚宴的相对嗡嗡声似乎并没有出现在搜索数字的任意显著的变化。

奥巴马的兴趣开始,奥巴马电视购物之前上升,期间播出的当晚选举前的时期达到顶峰。不像在麦凯恩的竞选,其中奥巴马的兴趣玫瑰麦凯恩大型活动,在麦凯恩的兴趣围绕奥巴马的电视直销广告期间没有显著变化。

从这个项目中的数据显示,政治上的搜索字词相对普及增加了时间和有利于奥巴马是有偏见的。互联网的人口大约青睐那些年龄小于65(主要是那些29岁以下)和那些高收入[11]。在这种环境下,搜索奥巴马较高频率麦凯恩使给定的更年轻,更经济安全之间的美国人支持民主党更高层次感。虽然也有可能是支持奥巴马的一般运动的影响搜索奥巴马的普及,不能麦凯恩期间比RNC其他任何时期获得比奥巴马更多的搜索表明,人口统计数据在解释搜索普及显著的作用。这是最有可能的因为当麦凯恩失去兴趣,在奥巴马的兴趣通常上升到高于麦凯恩的水平。

而“性”,在互联网上最流行的搜索查询之一,被列入初步分析为参考项来衡量如何频繁地搜索奥巴马和麦凯恩的近似值是,术语的选择表现出一种有趣的挥杆奥巴马和性别之间的普及。对于上周的运动,可能是由于奥巴马电视购物和重型的新闻报道暗示奥巴马获胜,奥巴马搜索

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[31849],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。