找回密码
 立即注册
搜索
查看: 277|回复: 1
打印 上一主题 下一主题
收起左侧

[转帖] 《大数据预测》特朗普试图用大数据实现连任?这招奥巴马早就用过了

[复制链接] [已阅至1楼]

原创版主 - 原创版主管理员 - 管理勋章

 成长值: 34500

灰铜v1_05绿金v1_01灰金v1_05绿银v1_01绿铜v3_05绿银v3_05红铜v1_05紫银v2_05

跳转到指定楼层
楼主
 楼主| 发表于 2018-4-1 21:37 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 cooldaddy 于 2018-4-1 21:38 编辑

"我们犯了错误。"在沉默了五天之后,扎克伯格终于不得不亲自出面道歉,就用户数据外泄事件作出详细解释。

据《纽约时报》和《卫报》这两大英美主流左派媒体周末的报道,英国的一家基于数据分析的政治咨询公司CambridgeAnalytica被控利用Facebook的信息管理不力,窃取了高达5000万名Facebook用户的个人资料。在2016年美国大选期间帮助帮助共和党候选人、现任总统特朗普投放针对性的政治广告。

此事件一出,Facebook市值蒸发500亿美元。

其实美国总统想利用大数据来帮助竞选早就不是什么新鲜事,社交网站的数据泄露问题也由来已久。

《洛杉矶时报》克里斯蒂·帕森斯和凯瑟琳·亨尼西就曾说:"没有任何总统竞选活动像奥巴马那样如此仰仗于科学分析方法,奥巴马的竞选团队充分运用信息来预测投票态势。或许美国总统选举的方式已经彻底改变了。"

在《大数据预测》一书中,作者详细分析了当年奥巴马是如何依靠大数据技术来预测投票态势的。

或许你知道,奥巴马在2012年美国总统选举中投入重金,聘请了超过50多名分析学专家。

或许你也知道各种令人眼花缭乱的总统竞选活动,这些旨在夺取全世界最有权势职位的活动,虽然一直要吵吵嚷嚷到投票前的规定静默期,但实际上最终只是为了影响一小部分选民,即那些在政治立场不坚定的州里的摇摆选民。

但大部分人所不知道的是,总统竞选活动要把针对范围进一步缩小,美国总统竞选确实是把微观定位提到了全新的高度。奥巴马的竞选团队押对了宝,他们通过上提模型设计了数百万份针对个体选民的竞选决策,由此也打破了竞选周期的常规,收到了十分积极的说服效果。

但2012年的风潮还不止于此。现在,人们的关注点已经超越了竞选活动定位,而是开始关注竞选背后的数理分析,内特·西尔弗就是在这样的背景中名声大噪的。西尔弗是民调分析记者的宠儿,其风头迅速超越了那些著名的数量分析师和美女科学家,成为预测的代言人。如果说我们要给通过数理手段预测明天的技术冠以人名,那么这个名字就应该是西尔弗。在西尔弗的预测结果得到验证之前,他就已经是电视访谈类节目的常客,至少在所有左翼节目中,西尔弗都曾在上面侃侃而谈,而脱口秀节目的主持人无不用赞叹而膜拜的眼神看着这位预测之神。

竞选民调并不需要什么高深的分析,也不用费劲儿去算计如何预测人类的行为。相反,民调的结果只是选民公开说他们打算怎么做。这好像是竞选的彩排。当然,如何统计民调结果是有诀窍的,西尔弗本人就长于此道,但他也承认,这其中并没有奇迹或不可思议之事。"这并不复杂,"在选举前一天的电视访谈节目中,他对主持人斯蒂芬·科尔伯特说道,"世界上有许多事情都比分析民调以及计算平均值要复杂……对不对?"

想拥有真正的力量吗?力量来自对未来施加影响而不是猜测未来。奈特·西尔弗在预测竞选结果上赢了,奥巴马的分析团队赢得了这场竞选。

这就是普通预测和预测分析之间的差距。普通预测是等到美国各州结果出来之后进行总结判断,但预测分析却可提供旨在指导行动的知识:对每个选民进行预测。

天堂鸟:可说服的摇摆选民

摇摆选民是传说。其定义也充满着瑕疵和主观色彩。民主党全国委员会曾给出这样的定义方法,说摇摆选民是那些党派色彩不强或自称独立的选民,即那些投身杂七杂八政党的选民。尽管如此,许多摇摆选民并不摇摆,他们观点鲜明,不会轻易被说服。

但竞选活动不用去分清到底谁是神秘的摇摆选民,不必费心去寻找这神秘的天堂鸟。对于竞选组织者而言,他们只需要搞清这样的问题:"如果我们打电话、家访、发放宣传材料或者让他们看到电视广告,哪些选民会支持我们阵营的候选人?"

总统选举的标准一定要超过那些普通的商业营销。在这种精益求精的无情竞争中,可支配的资源显得尤为宝贵,无论是付费的邮寄广告还是竞选志愿者的时间都是如此。因此,如果要把这些资源用在本来就会支持本阵营的选民上,这无疑是巨大的浪费。更为糟糕的是,某些接触还会起到反作用,本来会给本阵营投票的选民,可能在看到了无效的竞选广告后,改变主意而投奔对方阵营。

在商业领域,营销活动难免会产生一些这样的"误伤",不可避免地覆盖那些绝对会买以及谢绝推销的客户,尽管如此,最后汇总起来的利润率可能还是可以接受的。只要活动整体能带来积极收益,那么营销活动本身有些粗线条也就情有可原,因为要想把这些活动做到精细化,可能需要耗费较大的成本,而其带来的收益可能会相对有限(当然,许多商家也在心底有这样的想法:说服模型还是新事物,现在还没有普及)。

但美国总统选举每4年才举行一次。兹事体大,因此,所有细节务必都做到尽善尽美。迟早有一天,竞选的组织者会对每个选民的可影响度进行预测,由此来实现最优的竞选影响。

另一天堂鸟:说服模型专家

拉伊德·加尼就是佼佼者。他是2012年美国总统选举中奥巴马阵营的首席数据科学家。没有人比他更适合做这份工作。加尼获卡内基梅隆大学机器学习硕士学位,曾在埃森哲咨询公司的实验室工作10年。加尼对上提模型有着深刻的理解和研究,奥巴马竞选团队将上提模型称为"说服模型"。加尼曾研究过针对具体病患提供最佳的治疗方案,在为奥巴马竞选团队效力时,他的任务是确定对具体选民的接触是否有助于让该选民把票投给奥巴马。

这是分析学的严峻挑战。一个预测说服力的模型并非普通的预测模型。加尼不仅要预测那些接触后能为奥巴马投票的选民,还要预测出哪些选民无论接触与否都会给奥巴马投票,以及哪些选民在被接触之后可能会转而投给奥巴马的竞选对手米特·罗姆尼。如果仔细思考,加尼的模型实际是要预测"可说服产生积极效果"的选民。

预测分析的应用:政治活动中对选民的说服

1.预测内容:哪些选民会因为电话、家访、宣传以及广告等政治活动接触而产生积极反应。

2.采取行动:接触那些可说服的选民,避开那些可能因接触而产生不良反应的选民。

对此项目,奥巴马的竞选团队需要的不是政治资金的投入,而是数据。不管奥巴马竞选团队如何聪明,他们必须要获得相应的数据序列才能解决说服问题。为此,他们选择了数千名摇摆选民开始进行试验。如果试验成功,这样的方法将会被推而广之。某些选民获得了竞选活动的接触,无论是家访、广告还是电话;而另外一些选民则没有接触(对照组)。随后对不同组别的选民进行民意调查,看看他们是否支持奥巴马。

旨在说服的积极活动

如果数据表明,竞选活动整体上可发挥积极作用,这对于竞选团队而言当然是好消息,但这也意味着分析活动才刚刚开始。加尼团队面对的终极挑战是要逐个区分,究竟接触哪些选民才能取得预想效果。这是说服模型可以发挥作用的地方。

"我们的建模团队对每个政治意向不明确的州都建立了说服模型,"加尼表示,"然后再用模型去预测,在这些州里,数百万摇摆选民中每个选民的具体情况如何。模型会告诉我们,我们能为奥巴马赢得哪些选民,以及我们应该避免接触哪些选民。

为了改善这些模型,竞选团队尝试了无数最新的说服模型技术。尽管竞选团队并未披露他们采用了什么类型的选民数据来预测选民的可说服程度,但他们预测选民是否会给奥巴马投票(不论有无竞选活动接触)的影响因素却覆盖了80多项变量,其中包括人口结构、投票历史以及杂志订阅等。该竞选团队最为宝贵的数据来源是民主党全国委员会的数据库,这里记录着此前总统选举中每个选民对家访的反应,到底是热情迎接还是闭门不见。

对模型所预测的每个可说服的选民,竞选团队都配备了大量的资源,志愿者会站在街上宣传鼓劲,也会拨打电话到家里,劝说他们为奥巴马投票。当志愿者开始家访时,他们并不是挨家挨户敲门,而是针对那些被预测系统定位为可影响的选民敲门。正如这场竞选的首席分析学主管丹尼尔·瓦格纳对《洛杉矶时报》所言:"居住在郊区的白人女性也都有着不同的情况。拉丁裔有着各种各样的诉求。"这样的微观定位甚至让志愿者有底气去传统共和党的领地敲门,因为即便在传统的共和党支持地区,也会有选民值得争取,这样的举动完全打破了美国总统选举中的传统做法。

传单也主要用来针对那些可说服的选民。正如敲门家访那样,只有那些被预测为可能会改变主意投票给奥巴马的选民才会获得传单。传统的营销活动是把传单和广告寄给那些在收到材料之后会购买的客户,而不是那些因为传单才购买的客户。虽然其中的差异可能很微妙,但这些差异却极为重要。换句话说,说服建模不是要确定接触是否可行,而是与不接触相比,它是否能取得"更好"的效果。

说服建模取得了效果。相比其他传统竞选定位方法,这种方式让更多的选民选择了奥巴马。"传统方法仅仅定位那些没有拿定主意的选民或登记为无党派的选民,而这种方法则让竞选定位有了重大的提升,取得了更为明显的效果。"贾尼表示。

这种方法发挥效用的途径之一就是避免了那些接触之后反而会起到反作用的选民(即那些"谢绝打扰"的选民)。正如大家此前猜测的那样,有些选民如果主动去接触,还不如让他们自己拿主意。因此,在竞选活动最激烈的时候,竞选团队也有意避开那些被预测为不应接触的选民。

说服模型也引导了奥巴马竞选团队的广告投放。电视节目的广告时段会按收视人群的多寡和分布来售卖广告位,例如,福克斯新闻频道晚间节目在坦帕市的收视人群。奥巴马竞选团队会用说服模型来梳理这些收视人群数据,然后确定在哪里投放广告。

这是先进技术,也是分析学的前沿应用,但这并不神秘,说服模型会开启政治竞选中的全新篇章,即便Facebook被曝光了,特朗普寻求连任的路上,也离不开大数据的应用。


《大数据预测》(修订版)

中信出版社出版


管理员已阅至此楼
插件设计:zasq.net
沙发
发表于 2018-4-4 11:23 | 只看该作者
说的太离谱吧,有点掌控思想的节奏
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| ( Q群816270601 )

GMT+8, 2024-6-26 15:27 , Processed in 0.676966 second(s), 48 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表