
昨天川普和希拉里的辯論大家都看了嗎?看這篇就夠了。
要說這場辯論賽,確實很有看頭。因為這兩人在政策取向、個人風(fēng)格方面反差很大,而所受的爭議也為美國歷史所罕見。川普大叔和希拉里進行了第一場總統(tǒng)候選人辯論,數(shù)據(jù)顯示,全美有超過8000萬人觀看直播。
單從辯論能力來說,川普一個商人能和律師出身的高級政客辯到這份兒上,大數(shù)據(jù)分析科學(xué)家們幫了不少忙。
最早運用大數(shù)據(jù)技術(shù)的是奧巴馬,但在目前數(shù)據(jù)源的渠道越來越多、先進的分析工具陸續(xù)開發(fā),以及大規(guī)模計算能力增長,2016 年這場大選簡直就是大數(shù)據(jù)的盛宴。
本篇不打算重復(fù)他們說了什么,而要扒一扒他們背后使了什么高科技?
希拉里堪比硅谷公司的大數(shù)據(jù)團隊:希拉里擁有一支由50名專業(yè)的程序員和開發(fā)者構(gòu)成的技術(shù)團隊,他們原本供職于 Facebook、Google、Twitter等大型的科技公司,現(xiàn)在想利用更多技術(shù)手段幫助希拉里贏取更多選票和資金。比如,民主黨對于競選頁面進行細微的調(diào)整,讓捐贈人可以儲存信用卡信息。電商公司的經(jīng)驗告訴我們,這是將窗口用戶變?yōu)楦顿M用戶的關(guān)鍵,在政治上也同樣如此。

此外,希拉里的技術(shù)團隊還能應(yīng)對一些突發(fā)的技術(shù)問題。2015 年,聯(lián)邦競選委員會報告競選籌資截止日當(dāng)天,外部郵箱系統(tǒng)突然崩潰,競選團隊在 4個多小時內(nèi)搭建了一個臨時郵箱系統(tǒng) Balloon,以應(yīng)對突如其來的危機。
那么,希拉里科技團隊就是一硅谷公司,川普只有Twitter?錯!
在辯論中起效果的川普大數(shù)據(jù)團隊:川普的競選團隊則運用大數(shù)據(jù)來分析希拉里過去十來年的辯論演講,尋找她的弱點與習(xí)慣性語言和動作。

因此,此次辯論與初選期間比較,川普的表現(xiàn)比較平和,沒有叫對手外號,也沒有說些尖刻的挖苦話。這也許是為了爭取那些對川普個性感到不舒服的選民,但是另外一方面,也讓他在進攻時顯得畏首畏尾。在對手發(fā)言的時候,川普臉上表情很多,令人覺得有點孩子氣。看來自身問題還得靠自己改變。 不過,川普已經(jīng)很努力了,綜觀整場辯論會,川普開場26分鐘就打斷希拉里25次,推特上的相關(guān)討論亦有六成以上有關(guān)川普,僅三成不與希拉里相關(guān),換句話說,川普再度以一個走入美國主流政治的非典型候選人形象,吸引普羅大眾的目光。
重點來了,大數(shù)據(jù)當(dāng)真能助選嗎?
早在 2012 年奧巴馬競選時,民主黨的競選團隊中就吸納了一批有類似特質(zhì)的科技人員,開發(fā)了一套數(shù)據(jù)庫 Narwal 用于管理投票情況。助奧巴馬連任成功,功不可沒。
與過去相比,現(xiàn)今的總統(tǒng)選舉在利用大數(shù)據(jù)分析這一塊更加旗鼓相當(dāng)。拼的就是誰做得更好。
任何數(shù)據(jù)分析工作的執(zhí)行,都需要做好三方面的準(zhǔn)備:
1. 幕后的兩家大數(shù)據(jù)公司收集和整理數(shù)據(jù)
從目前來看,大數(shù)據(jù)分析現(xiàn)在是大型政治選舉的桌面籌碼。當(dāng)需要幫助政治家盡可能有效地拉選票時,大數(shù)據(jù)收集和整理就必不可少。
先扒一下兩家大數(shù)據(jù)公司。
TargetSmart 給民主黨派和州民主黨派以及他們的同盟提供大數(shù)據(jù)分析和服務(wù);Deep RootAnalytics,給共和黨及其從屬團隊提供數(shù)據(jù)分析。

Deep Root 和 TargetSmart 都是利用 Alteryx 的軟件來說明他們?nèi)菁{、凈化、混合以及分析來源不同的大規(guī)模資料。這種分析軟件以一種最有效的方法,來分析所有選民的年齡結(jié)構(gòu),根據(jù)不同年齡段來分段并且打分,然后利用這些資訊來優(yōu)化他們在媒體上的花銷,特別是在非常重要的電視廣告上。
Deep Root 利用它的分析模型來告訴參選者,在他們已有電視預(yù)算的條件下,哪些地方能獲得最大的收獲。正如 Seawright 表示,資料分析在每天的決策過程中發(fā)揮很重要的作用。
資料將會指示客戶該將他們的競選廣告放到哪,才能讓他們的目標(biāo)人群最有可能看到,也會提示他們花銷的紀錄,透過讓客戶在情景中能夠意識到這個問題,不僅提供他們所做的與目標(biāo)人群相關(guān)的理由,而且也會分析競爭對手或同盟所做的,對目標(biāo)人群的影響,這就允許他們能夠?qū)φ谶M行的分配任務(wù)具有策略性,并對廣告投放更聰明——把廣告投放在最不顯眼而又最高效的地方,同時根據(jù)其他人或組織的移動來及時做出反應(yīng)。
TargetSmart 也提供相似的分析服務(wù),但是透過利用資料來優(yōu)化移動不僅只是在電視廣告投放上,也在客服中心活動、傳統(tǒng)郵件及社區(qū)拉票,TargetSmart 在它的 360 度投票者聯(lián)系技術(shù)上比他們的老對手走得更遠。
2.“精準(zhǔn)”,了解個性化需求
大數(shù)據(jù)技術(shù)顯然已經(jīng)推翻了美國歷史上總統(tǒng)選舉的定律:誰籌的錢越多誰勝出可能性越大、誰花的錢越多誰就會贏。
但要做到“精準(zhǔn)”是一個與業(yè)務(wù)定制的過程。
曾經(jīng)奧巴馬團隊能取得顛覆性的勝利,是因為他們做到了三個最根本目標(biāo):讓更多的人掏更多的錢,讓更多的選民投票給奧巴馬,讓更多的人參與進來!這些都緣于他們對選民的認知達到了“微觀”層面:每個選民最有可能被什么因素說服?每個選民在什么情況下最有可能掏腰包?什么樣的廣告投放渠道能夠最高效獲取目標(biāo)選民?這些都緣于他們對選民的認知達到了“微觀”層面:每個選民最有可能被什么因素說服?每個選民在什么情況下最有可能掏腰包?什么樣的廣告投放渠道能夠最高效獲取目標(biāo)選民?
機器學(xué)習(xí)是數(shù)據(jù)挖掘中常用的方法,它的基本原理是讓計算機從歷史數(shù)據(jù)中“學(xué)習(xí)”其中的規(guī)律,并利用該規(guī)律對未來數(shù)據(jù)進行預(yù)測,這個過程也就是建模和預(yù)測的過程。因此,當(dāng)用戶數(shù)據(jù)因業(yè)務(wù)而異時,每一組數(shù)據(jù)中都會有自己獨特的數(shù)據(jù)模型,這也就是與實際業(yè)務(wù)相定制的過程。比如,奧巴馬的數(shù)據(jù)團隊就會對每一個群體的選民都進行建模,進而預(yù)測他們的捐款行為方式(通過網(wǎng)絡(luò)捐款,還是會匯款)。
因此,在激烈的市場競爭中,誰能夠深入的了解他的每一個用戶的個性化需求,誰就能在競爭中擊敗對手,獲取勝利。
兩家公司還幫助川普和希拉里在社交領(lǐng)域進行加碼:
兩家大公司都正在越過電視領(lǐng)域來到類似社交媒體的數(shù)碼媒介來探險。但是這種嘗試是非常艱難的,因為數(shù)碼媒介上的資料更概略,透過媒體分析并不容易知道你所要到達的目標(biāo)人群。
TargetSmart 在這一領(lǐng)域正在做一些創(chuàng)新性的工作,透過利用個人可辨識的資訊,這家公司將2.55 億國內(nèi)投票者資料與類似 Facebook、Google、Yahoo 及 MSN 等數(shù)碼平臺上的使用者匹配。他們不能夠?qū)⒚總€推特用戶與注冊的投票者相匹配,但是能得到一個內(nèi)部可以利用的相當(dāng)規(guī)模的資料。如果按正確的方法來做這件事,它就會注入到你的模型中。這也是這次選舉一個重要的副產(chǎn)品。
利用社交媒體資料來更廣泛地理解人們的消費方式,還有人們與社交媒體連接的方式,這對于大數(shù)據(jù)分析而言將會更有價值。
3 .動態(tài)調(diào)整模型
模型需要根據(jù)實際情況進行動態(tài)調(diào)整。用戶因環(huán)境、喜好或其他因素常常會導(dǎo)致其行為規(guī)律發(fā)生一定的變化,使得其產(chǎn)生的數(shù)據(jù)也隨之變化,這些變化將會影響模型的精準(zhǔn)性。
比如奧巴馬在第一次電視辯論結(jié)束后,選民的投票傾向發(fā)生改變。而數(shù)據(jù)分析團隊可以立即知道什么樣的選民改變了態(tài)度,什么樣的選民仍堅持原來的投票選擇。
不過,自從英國公投后,民調(diào)變得不那么靠譜了。
據(jù)CNN于辯論后公布的最新數(shù)據(jù),有62%的民眾認為希拉里技壓全場,只有27%的民眾認為川普占了上風(fēng);而彭博發(fā)出的數(shù)據(jù)顯示,川普已經(jīng)領(lǐng)先了兩個百分點。

進一步分析,亞裔多數(shù)不喜歡川普,支持川普的華裔多是新移民有強烈的民族主義,崇尚財富,認為美國必須嚴執(zhí)移民法。

但川普已經(jīng)步步為營,與希拉里拉小了差距,未來結(jié)果還未可知,想必數(shù)據(jù)科學(xué)家們此時還在針對投票趨勢在調(diào)整模型中。
11月8日,美國大選日見分曉!