編者:2012年底問世的《大數(shù)據(jù)時代:生活、工作與思維的大變革》,,以一個帶有預見性的新概念,,引起全球熱議,至今仍居各大圖書排行榜前位,,作者維克托·邁爾—舍恩伯格也因之被譽為“大數(shù)據(jù)時代的預言家”,。輿論認為,“大數(shù)據(jù)”顛覆了千百年來人類的思維慣例,,對人類的認知和與世界的交流方式提出了全新的挑戰(zhàn),。同時,因“大數(shù)據(jù)”理論引發(fā)的激辯和質(zhì)疑也絡繹不絕……
近日,,美國兩本著名學術雜志同時關注大數(shù)據(jù)話題:《外交》雜志5/6月刊將《大數(shù)據(jù)的興起》一文作為封面文章,,認為大數(shù)據(jù)將改變?nèi)祟愃伎己涂创澜绲姆绞健6锻饨徽摺冯s志則在網(wǎng)站上發(fā)表微軟研究院首席研究員,、麻省理工學院公民媒體中心客座教授凱特·克勞福德的文章《對大數(shù)據(jù)的再思考》,,從五個方面對大數(shù)據(jù)理論提出質(zhì)疑。
大數(shù)據(jù)帶來變革
《大數(shù)據(jù)的興起》一文作者是近期引發(fā)熱議的專著《大數(shù)據(jù)時代:生活,、工作與思維的大變革》作者肯尼思·庫克耶和維克托·邁爾—舍恩伯格,。在文章中,庫克耶和舍恩伯格肯定了大數(shù)據(jù)對社會的巨大變革能力,,稱大數(shù)據(jù)不僅將改變?nèi)藗兊纳詈凸ぷ�,,而且將改變�(nèi)祟愓J識和思考世界的方式。
兩人認為,,隨著技術環(huán)境的變化,,一方面世界出現(xiàn)“數(shù)據(jù)爆炸”的現(xiàn)象,另一方面人類處理數(shù)據(jù)的能力也大為增強。由此,,人們對待數(shù)據(jù)的方式出現(xiàn)了三個變化:第一,,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,,由于是全樣本數(shù)據(jù),,人們不得不接受數(shù)據(jù)的混雜性,而放棄對精確性的追求,;第三,,人類通過對大數(shù)據(jù)的處理,放棄對因果關系的渴求,,轉而關注相互聯(lián)系,。這一切代表著人類告別總是試圖了解世界運轉方式背后深層原因的態(tài)度,而走向僅僅需要弄清現(xiàn)象之間的聯(lián)系以及利用這些信息來解決問題,。
《大數(shù)據(jù)的興起》列舉了大數(shù)據(jù)在醫(yī)學,、消費品領域的應用實例,。但作者同時認為,,大數(shù)據(jù)的影響力絕不僅限于商業(yè)范疇,它將深遠地改變政府的運作方式和政治的性質(zhì),。他們在文章中寫道,,“在推動經(jīng)濟增長、提供公共服務或進行戰(zhàn)爭等方面,,那些能夠有效利用大數(shù)據(jù)的人將擁有勝過別人的巨大優(yōu)勢”,。不過,兩位作者承認,,大數(shù)據(jù)應用在公共服務領域比較成功的案例出現(xiàn)在城市這一級,,因為在這個級別上獲取數(shù)據(jù)和利用信息進行試驗要容易一些。
學者提出五質(zhì)疑
克勞福德的文章認為,,大數(shù)據(jù)是當前的時髦術語,,但人們是否能依靠海量數(shù)據(jù)揭示人類行為的規(guī)律仍值得懷疑。她針對大數(shù)據(jù)理論從五個方面提出質(zhì)疑,。
第一,,大數(shù)據(jù)中存在偏見和盲區(qū)。大數(shù)據(jù)的倡導者認為,,“有了足夠的數(shù)據(jù),,數(shù)字就可以自己說話”。但克勞福德認為,,數(shù)字無法自己說話,。不論其規(guī)模有多大,數(shù)據(jù)集歸根到底是人類設計的產(chǎn)物,,而大數(shù)據(jù)的工具并不能使人們擺脫曲解,、隔閡和錯誤的成見,。當大數(shù)據(jù)試圖反映人類所生活的社會化世界時,認清這些因素就尤為重要,。偏見和盲區(qū)存在于大數(shù)據(jù)中,,從大數(shù)據(jù)得出的結論并不比人為的意見更客觀。
第二,,大數(shù)據(jù)在一定程度上可以使城市變得更加智能和高效,,但具體效果如何取決于市政官員對數(shù)據(jù)及其局限性的了解�,?藙诟5路Q,,大數(shù)據(jù)的倡導者認為,“大數(shù)據(jù)將使我們的城市變得更加智能和高效”,,在一定程度上確實如此,。但另一方面,數(shù)據(jù)在生成或采集的過程中并不都是平等的,,大數(shù)據(jù)集存在“信號問題”——即某些民眾和社區(qū)被忽略或未得到充分代表,。因此,要想運用好大數(shù)據(jù),,市政官員必須對數(shù)據(jù)及其局限性有充分了解,。
第三,大數(shù)據(jù)可能導致基于群體的歧視,。大數(shù)據(jù)的倡導者認為,,“大數(shù)據(jù)對不同的社會群體不會厚此薄彼”,其理由是,,原始數(shù)據(jù)的分析是在大規(guī)模水平上進行的,,因而避免了基于群體的歧視。但克勞福德認為,,實際情況并非如此,。由于大數(shù)據(jù)能夠作出有關群體不同行為方式的論斷,而且其使用的主要目的是把不同個體歸入不同的群體中,,因此大數(shù)據(jù)不僅不會避免群體歧視,,還可能加重這一趨勢。
第四,,隱私泄露是大數(shù)據(jù)應用中的重要問題,。克勞福德認為,,大數(shù)據(jù)的倡導者關于“大數(shù)據(jù)是匿名的,,因此它不會侵犯我們的隱私”一說大錯特錯。盡管許多大數(shù)據(jù)的提供者盡力消除數(shù)據(jù)中的個體身份,但身份重新被確認的風險仍然很大,。鑒于利用大量公共數(shù)據(jù)集可以推斷很多信息,,這使泄露個人隱私成為“日益嚴重的擔憂”。
第五,,大數(shù)據(jù)為科學研究提供了新的途徑,,但不可斷言“大數(shù)據(jù)是科學的未來”�,?藙诟5路Q,,大數(shù)據(jù)的研究方法只能統(tǒng)計某件事情發(fā)生的頻率和相關性,但不能得出因果關系,。將大數(shù)據(jù)策略和小數(shù)據(jù)研究相結合也許是更好的科學研究途徑,。
庫克耶和舍恩伯格也認識到了大數(shù)據(jù)理論的一些內(nèi)在瑕疵。在《大數(shù)據(jù)的興起》一文結尾,,兩位作者表示,,大數(shù)據(jù)是一種資源和工具,它的目的是告知,,而不是解釋,;它意在促進理解,但可能導致誤解——關鍵在于人們對它的掌握程度,。他們認為,,人們必須用一種不僅欣賞其力量、而且承認其局限的態(tài)度來接納大數(shù)據(jù),。