A5交易A5任務(wù)SEO診斷 淘寶客站長(zhǎng)團(tuán)購
大數(shù)據(jù)的發(fā)展前提關(guān)于大數(shù)據(jù)的概念其實(shí)在1998年已經(jīng)就有人提出了,但是到了現(xiàn)在才開始有所發(fā)展,這些其實(shí)都是和當(dāng)下移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展分不開的,移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,為大數(shù)據(jù)的產(chǎn)生提供了更多的產(chǎn)生大數(shù)據(jù)的硬件前提,比如說智能手機(jī),智能硬件,車聯(lián)網(wǎng),pda等數(shù)據(jù)的產(chǎn)生終端。這些智能通過移動(dòng)通信技術(shù)和人們的生活緊密的結(jié)合在一起,在人流、車流的背后產(chǎn)生了信息流,也就產(chǎn)生了大量的數(shù)據(jù)。
其次就是移動(dòng)通信技術(shù)的快速發(fā)展,在2G時(shí)代,無線網(wǎng)速慢,數(shù)據(jù)產(chǎn)生也非常慢,數(shù)據(jù)體量也不夠,所以還是無法形成大數(shù)據(jù),而到了4G時(shí)代,終端數(shù)據(jù)的增加,使得任何的移動(dòng)終端都在無時(shí)無刻的產(chǎn)生著大量的數(shù)據(jù),這個(gè)也是大數(shù)據(jù)到來的一個(gè)條件之一。
第三個(gè)方面的就是大數(shù)據(jù)相關(guān)技術(shù)的飛速發(fā)展,如云計(jì)算,云存儲(chǔ)技術(shù),他們的快速發(fā)展,是大數(shù)據(jù)誕生的溫床,如果沒有這些技術(shù),即使有大量的數(shù)據(jù)也只能望洋興嘆。傳統(tǒng)的存儲(chǔ)技術(shù)相對(duì)落后,根據(jù)不同數(shù)據(jù)實(shí)行單一存儲(chǔ),這個(gè)顯然滿足不了大數(shù)據(jù)的需求,而云時(shí)代的存儲(chǔ)系統(tǒng)需要的不僅僅是容量的提升,對(duì)于性能的要求同樣迫切,與以往只面向有限的用戶不同,在云時(shí)代,存儲(chǔ)系統(tǒng)將面向更為廣闊的用戶群體,用戶數(shù)量級(jí)的增加使得存儲(chǔ)系統(tǒng)也必須在吞吐性能上有飛速的提升,只有這樣才能對(duì)請(qǐng)求作出快速的反應(yīng),云儲(chǔ)存技術(shù)的成熟為大數(shù)據(jù)的快速發(fā)展奠定了基礎(chǔ)。
什么是大數(shù)據(jù)?不過說起大數(shù)據(jù),估計(jì)大家都覺得只聽過概念,但是具體是什么東西,怎么定義,沒有一個(gè)標(biāo)準(zhǔn)的東西,因?yàn)樵谖覀兊挠∠笾泻孟窈芏喙径冀写髷?shù)據(jù)公司,業(yè)務(wù)形態(tài)則有幾百種,感覺不是很好理解,所以我建議還是從字面上來理解大數(shù)據(jù),在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時(shí)代》提到了大數(shù)據(jù)的4個(gè)特征,一個(gè)是數(shù)量大,一個(gè)是價(jià)值大,一個(gè)是速度快,一個(gè)是多樣性。
一個(gè)是數(shù)量比較大,大致有多大,就是大到PB級(jí)別,甚至ZB級(jí)別,1PB等于1024TB,1TB等于1024G,那么1PB等于100多G,當(dāng)然了具體的計(jì)算方法可以相關(guān)資料數(shù)據(jù)進(jìn)行查詢,總之,和傳統(tǒng)的單個(gè)網(wǎng)站數(shù)據(jù)庫存儲(chǔ)的數(shù)據(jù)相比,已經(jīng)是它的上百倍還多,而只有數(shù)據(jù)體量達(dá)到了PB級(jí)別以上,才能被稱為大數(shù)據(jù)。第二個(gè)是價(jià)值大,價(jià)值是大體量數(shù)據(jù)的更深一步的演變,就是說,你如果有1PB以上的全國所有20-35年輕人的上網(wǎng)數(shù)據(jù)的時(shí)候,那么它自然就有了商業(yè)價(jià)值,比如通過分析這些數(shù)據(jù),我們就知道這些人的愛好,進(jìn)而指導(dǎo)產(chǎn)品的發(fā)展方向等等。如果有了全國幾百萬病人的數(shù)據(jù),根據(jù)這些數(shù)據(jù)進(jìn)行分析就能預(yù)測(cè)疾病的發(fā)生。這些都是大數(shù)據(jù)的價(jià)值。
第三個(gè)就是多樣性,如果只有單一的數(shù)據(jù),那么這些數(shù)據(jù)就沒有了價(jià)值,比如只有單一的個(gè)人數(shù)據(jù),或者單一的用戶提交數(shù)據(jù),這些數(shù)據(jù)還不能稱為大數(shù)據(jù),所以說大數(shù)據(jù)還需要是多樣性的,比如當(dāng)前的上網(wǎng)用戶中,年齡,學(xué)歷,愛好,性格等等每個(gè)人的特征都不一樣,這個(gè)也就是大數(shù)據(jù)的多樣性,當(dāng)然了如果擴(kuò)展到全國,那么數(shù)據(jù)的多樣性會(huì)更強(qiáng),每個(gè)地區(qū),每個(gè)時(shí)間段,都會(huì)存在各種各樣的數(shù)據(jù)多樣性。
第四個(gè)是速度快,就是通過算法對(duì)數(shù)據(jù)的邏輯處理速度非??欤?秒定律,可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息,這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。
總之,這些就是大數(shù)據(jù)的四個(gè)特征,只有具備了這些特征的數(shù)據(jù)才能稱為大數(shù)據(jù),那么實(shí)際中的大數(shù)據(jù)是怎么樣呢?業(yè)內(nèi)著名的和大數(shù)據(jù)相關(guān)的公司,七牛云存儲(chǔ)將要在8月29日、30日舉辦一次大數(shù)據(jù)的會(huì)議,對(duì)于位于大數(shù)據(jù)技術(shù)產(chǎn)業(yè)鏈上的公司來說,我們應(yīng)該可以獲得更多的干貨爆料。
大數(shù)據(jù)的三個(gè)層次說起大數(shù)據(jù),大數(shù)據(jù)有三個(gè)層次,第一個(gè)是數(shù)據(jù)采集層,以App、saas為代表的服務(wù)。第二個(gè)技術(shù)服務(wù)層,以七牛云存儲(chǔ)為代表的大數(shù)據(jù)技術(shù)服務(wù)層,這些包括數(shù)據(jù)的存儲(chǔ),數(shù)據(jù)的分析,數(shù)據(jù)的挖掘等等,第三個(gè)是數(shù)據(jù)應(yīng)用層,以數(shù)據(jù)為基礎(chǔ),為將來的移動(dòng)社交、交通、教育,金融進(jìn)行服務(wù)。下面我就主要的講下三個(gè)層面。
數(shù)據(jù)采集層——App、saas服務(wù)在移動(dòng)互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)的來源層有兩個(gè)方面,一個(gè)方面是面向個(gè)人的數(shù)據(jù)來源前端如各種各樣的App,一方面是面向企業(yè)服務(wù)的saas服務(wù)的產(chǎn)品。面向個(gè)人的App
在飲食領(lǐng)域的App,如餓了么,用戶通過App進(jìn)行選餐,下單,通過App交互就會(huì)形成飲食領(lǐng)域的大數(shù)據(jù);在o2o領(lǐng)域,如嗒嗒巴士,用戶通過使用App進(jìn)行乘坐交通,上班下班,就會(huì)形成交通領(lǐng)域的大數(shù)據(jù),如穿衣助手,用戶通過App進(jìn)行選擇衣服顏色,樣式,進(jìn)行搭配,就會(huì)形式服務(wù)類的大數(shù)據(jù),當(dāng)然了還有秒拍、快看等娛樂類的消費(fèi)數(shù)據(jù)。面向個(gè)人用戶的App,以滿足用戶的需求為主要出發(fā)點(diǎn),產(chǎn)生用戶的數(shù)據(jù),這些數(shù)據(jù)包括以個(gè)人基礎(chǔ)的數(shù)據(jù),也包括隨群體數(shù)據(jù),隨著App用戶量的增長(zhǎng),這些App數(shù)據(jù)就成了大數(shù)據(jù)。
面向個(gè)人的數(shù)據(jù)來源,直接通過用戶的需求產(chǎn)生數(shù)據(jù),而面向企業(yè)服務(wù)的——saas服務(wù)則不一樣,他們通過為企業(yè)提供一套完整的解決方案,而產(chǎn)生數(shù)據(jù),比如圖靈機(jī)器人,人臉識(shí)別技術(shù),氣象plus、??低暤?,他們通過完美的解決方案服務(wù)企業(yè),最終服務(wù)用戶,從而產(chǎn)生大數(shù)據(jù),數(shù)據(jù)采集層,是大數(shù)據(jù)的來源,也是大數(shù)據(jù)的基礎(chǔ)。
云存儲(chǔ)對(duì)大數(shù)據(jù)的促進(jìn)作用有了數(shù)據(jù)采集層,那么下一步就是數(shù)據(jù)的存儲(chǔ)層了,使用云存儲(chǔ)技術(shù)將數(shù)據(jù)存儲(chǔ)在云主機(jī)上,保證數(shù)據(jù)的安全、穩(wěn)定、高效都需要云存儲(chǔ)技術(shù)來完成。云存儲(chǔ)主要負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)以及計(jì)算,比如七牛的云存儲(chǔ)技術(shù),云存儲(chǔ)技術(shù)是大數(shù)據(jù)發(fā)展跨不過去的一道坎,如果沒有云存儲(chǔ)技術(shù),大數(shù)據(jù)就不能得到發(fā)展。
云存儲(chǔ)中面向企業(yè)存儲(chǔ)的數(shù)據(jù)最大當(dāng)前的云存儲(chǔ)分為公共云存儲(chǔ)和私有云存儲(chǔ),公共云存儲(chǔ)主要是面向個(gè)人,比如百度網(wǎng)盤等,而私有云存儲(chǔ)主要是面向企業(yè),其實(shí)面向企業(yè)的云存儲(chǔ)的存儲(chǔ)的大數(shù)據(jù)最終來源還是來自個(gè)人,比如目前的很多saas服務(wù),IM、統(tǒng)計(jì)等企業(yè)服務(wù),服務(wù)主要是面向個(gè)人的App,而類似七牛云存儲(chǔ)這樣的云存儲(chǔ)則是出于更底層,基于云主機(jī)之上,而位于所有個(gè)人服務(wù)、企業(yè)服務(wù)之下,所以說,七牛云存儲(chǔ)應(yīng)該積累了更多的大數(shù)據(jù),而通過即將月底舉辦的這次《數(shù)據(jù)重構(gòu)未來》的大會(huì),我想可以獲得更多的關(guān)于大數(shù)據(jù)的干貨。
云存儲(chǔ)滿足了海量大數(shù)據(jù)海量數(shù)據(jù)的存儲(chǔ)需求
隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,傳統(tǒng)的存儲(chǔ)方式已經(jīng)在容量、性能、智能化等方面無法滿足需求。云存儲(chǔ)的出現(xiàn),比如類似和七牛一樣的云存儲(chǔ)技術(shù),從功能上彌補(bǔ)了傳統(tǒng)存儲(chǔ)的不足,通過虛擬化大容量存儲(chǔ)、分布式存儲(chǔ)和自動(dòng)化運(yùn)維等功能,實(shí)現(xiàn)了存儲(chǔ)空間無限增加和擴(kuò)容,自動(dòng)化和智能化功能提高了存儲(chǔ)效率。另外,規(guī)模效應(yīng)和彈性擴(kuò)展,降低運(yùn)營(yíng)成本,避免資源浪費(fèi)。
云存儲(chǔ)技術(shù)節(jié)省了開發(fā)者的成本特別是當(dāng)下移動(dòng)互聯(lián)網(wǎng)的火爆,使得App行業(yè)出現(xiàn)了爆發(fā)式的增長(zhǎng),App的數(shù)量已經(jīng)達(dá)到了300百萬以上,同時(shí)圖片App、視頻App、音頻App如camera360、優(yōu)酷視頻、荔枝FM等App都會(huì)在發(fā)展過程中產(chǎn)生大量的數(shù)據(jù),對(duì)于這些數(shù)據(jù)來說,如果讓企業(yè)自身去開發(fā)一款分布式的存儲(chǔ)系統(tǒng),這可能需要構(gòu)建一個(gè)幾十人的開發(fā)團(tuán)隊(duì),成本也會(huì)大大增加,而通過使用類似七牛一樣的云存儲(chǔ),可以節(jié)約企業(yè)成本,讓企業(yè)發(fā)展更加迅速。
云存儲(chǔ)技術(shù)為大數(shù)據(jù)的數(shù)據(jù)分析提供了基礎(chǔ)依據(jù)作為大數(shù)據(jù)的存儲(chǔ)服務(wù)商,云存儲(chǔ)有著非常大的數(shù)據(jù)挖掘潛力,云存儲(chǔ)平臺(tái)為大數(shù)據(jù)的分析提供了“水”的來源,有了這些數(shù)據(jù),同時(shí)配置上一些數(shù)據(jù)分析工具,完全可以產(chǎn)生一些非常有價(jià)值的分析數(shù)據(jù)報(bào)告。
比如基于云存儲(chǔ)服務(wù)這個(gè)基礎(chǔ),七??梢栽谄髽I(yè)的需求下,為企業(yè)提供企數(shù)據(jù)分析,例如這款應(yīng)用在哪些地區(qū)受訪問次數(shù)多、怎樣的用戶更喜歡這款應(yīng)用等,但不會(huì)涉及分析用戶隱私相關(guān)的數(shù)據(jù)。當(dāng)然了,還可以針對(duì)整個(gè)圖片行業(yè)、視頻行業(yè)、以及音頻行業(yè)提供受眾的用戶行為、以及特征這一系列的群體特征。
這些都是云存儲(chǔ)在存儲(chǔ)的數(shù)據(jù)體量達(dá)到大數(shù)據(jù)的特征后,能做的一系列的分析依據(jù)。所以說云存儲(chǔ)是大數(shù)據(jù)發(fā)展中的最重要的一個(gè)環(huán)節(jié)。
大數(shù)據(jù)未來的行業(yè)應(yīng)用說了大數(shù)據(jù)的采集層,數(shù)據(jù)存儲(chǔ)層,那么最后講下大數(shù)據(jù)的應(yīng)用層,既然有了大數(shù)據(jù),那么以大數(shù)據(jù)為基礎(chǔ),就會(huì)產(chǎn)生以移動(dòng)金融,移動(dòng)社交,o2o,在線教育等多方面的應(yīng)用。
移動(dòng)金融隨著移動(dòng)互聯(lián)網(wǎng)金融的發(fā)展,金融交易與支付已經(jīng)從桌面電腦延伸到移動(dòng)智能終端,企業(yè)自身只能從內(nèi)部洞察經(jīng)營(yíng)情況,或從市場(chǎng)中獲得不全面的統(tǒng)計(jì)信息,作為決策參考。比如銀聯(lián)智惠可以幫助企業(yè)能夠從外部了解市場(chǎng),洞察對(duì)手的位置,了解市場(chǎng)趨勢(shì)和自身的地位,通過利用自身優(yōu)勢(shì)通過全行業(yè)的交易記錄得到高質(zhì)量的基礎(chǔ)數(shù)據(jù),并替企業(yè)完成了大量繁瑣的數(shù)據(jù)采集、清理工作,整合到企業(yè)的基礎(chǔ)經(jīng)營(yíng)分析數(shù)據(jù)庫中,讓企業(yè)事半功倍。
當(dāng)基礎(chǔ)數(shù)據(jù)進(jìn)入企業(yè)數(shù)據(jù)庫后,通過銀聯(lián)智惠的用戶畫像模擬器進(jìn)行目標(biāo)客戶消費(fèi)行為建模,將歷史交易行為分得出目標(biāo)客戶的交易共性特征,從而完整的從消費(fèi)性別、消費(fèi)年齡、消費(fèi)習(xí)慣、消費(fèi)頻率、消費(fèi)區(qū)域、消費(fèi)偏好等多重維度完整描述客戶群的輪廓,并得出客戶的上下游關(guān)聯(lián)交易行為特征,讓企業(yè)真正認(rèn)知客戶群體的全貌,從而進(jìn)行有效的商業(yè)決策。
移動(dòng)社交隨著脈脈,戀愛記等社交應(yīng)用的用戶越來越多,用戶的社交行為將會(huì)成為大數(shù)據(jù)的分析基礎(chǔ),通過分析用戶的社交時(shí)間、對(duì)象、地點(diǎn)以及行為,可以分析出用戶的愛好、年齡、需求,同時(shí)基于用戶的大數(shù)據(jù),可以針對(duì)這些數(shù)據(jù)做定向營(yíng)銷,從而大大提升了營(yíng)銷的效果,而相比之前的營(yíng)銷手段,則是基本根據(jù)人員的策劃和想象得出,沒有數(shù)據(jù)參考,營(yíng)銷的效果也不好把控。比如脈脈可以通過一些用戶數(shù)據(jù)為企業(yè)招聘到合適的人,同時(shí)還能為一些用戶提供一些合適的職位,完成需求和供求的高精度的匹配。
而戀愛記,是一款記錄戀愛為主的社交App,更加垂直,那么通過分析情侶之間的數(shù)據(jù),可以獲得更多的情感數(shù)據(jù),從而為一些適齡男女提供戀愛的指導(dǎo)。這些都是基于大數(shù)據(jù)的應(yīng)用。
O2O類的應(yīng)用移動(dòng)互聯(lián)網(wǎng)的深入發(fā)展,促進(jìn)了o2o的繁榮,以嗒嗒巴士為代表的定制公交車應(yīng)用,就是大數(shù)據(jù)的代表應(yīng)用。
傳統(tǒng)的公交出行在公交站、公交路線的設(shè)定上,相對(duì)來說比較固定,通過分析一個(gè)城市內(nèi)的群體出行數(shù)據(jù),可以獲得人群隨著時(shí)間的出行規(guī)則,比如知道在早上8點(diǎn)為出行高峰,而從某個(gè)小區(qū)到某個(gè)寫字樓的人流數(shù)為最大,那么我就定制一條公交線路出來,對(duì)于用戶來說,滿足了用戶的需求,而對(duì)于公交公司來說,則是優(yōu)化了交通路線,節(jié)約了資源,間接提升了成本,這些都是大數(shù)據(jù)的好處。
……
還有更多的領(lǐng)域可以用到大數(shù)據(jù),如大數(shù)據(jù)醫(yī)療,大數(shù)據(jù)營(yíng)銷,可穿戴設(shè)備等等。通過大數(shù)據(jù)可以創(chuàng)造出更多價(jià)值,正如一篇文章說到,通過大數(shù)據(jù)讓做事的方法更加容易,讓現(xiàn)實(shí)從三維空間變成了二維碼空間,就像宇宙的蟲洞一樣,可以直接達(dá)到目標(biāo)。意思是在過去沒有大數(shù)據(jù)做參考,我們需要試驗(yàn)多次,才能知道那條路是對(duì)的,但是現(xiàn)在有了大數(shù)據(jù)做數(shù)據(jù)參考,我們可以直接到達(dá)終點(diǎn)。所以說大數(shù)據(jù)使得事情的發(fā)展變得更加簡(jiǎn)單。
當(dāng)然,這些都是關(guān)于大數(shù)據(jù)的一些想象和預(yù)測(cè),但是在現(xiàn)實(shí)中,真正的大數(shù)據(jù)是什么樣子呢?他們做到了哪些事情?我想還要去聽一聽8月29日七牛主辦的《數(shù)據(jù)重構(gòu)未來》大會(huì),看看會(huì)議上嘉賓的數(shù)據(jù)分享報(bào)告里,預(yù)測(cè)的那些商業(yè)價(jià)值和機(jī)會(huì)
如今,業(yè)界和學(xué)術(shù)界一直在討論一個(gè)詞,那就是大數(shù)據(jù)。不管是學(xué)術(shù)圈還是IT圈,只要能談?wù)擖c(diǎn)兒大數(shù)據(jù)就顯得很高大上。然而,大數(shù)據(jù)挖掘、大數(shù)據(jù)分析、大數(shù)據(jù)營(yíng)銷等等事情僅僅只是個(gè)開始,對(duì)大多數(shù)公司來說,大數(shù)據(jù)仍有很強(qiáng)的神秘色彩。于是,在我們還沒有完全搞明白如何運(yùn)用大數(shù)據(jù)進(jìn)行挖掘時(shí),各種過于神化大數(shù)據(jù)的輿論就已經(jīng)不絕于耳了。當(dāng)然,也有很多人直接批判大數(shù)據(jù)或大數(shù)據(jù)營(yíng)銷給我們?cè)斐傻碾[私威脅。也有很多人根本沒有搞清楚什么是大數(shù)據(jù),到底有什么價(jià)值。 于是,站在客觀的角度,圍繞下面幾個(gè)問題與大家分享有關(guān)大數(shù)據(jù)的幾個(gè)觀點(diǎn),也扒扒大數(shù)據(jù)的那些事兒: 1、大數(shù)據(jù)營(yíng)銷和個(gè)人隱私泄露究竟有無因果和邏輯關(guān)系? 2、大數(shù)據(jù)營(yíng)銷到底能帶給企業(yè)什么樣的價(jià)值?到底能帶給用戶什么價(jià)值?用戶是否全盤否定或反感大數(shù)據(jù)營(yíng)銷? 3、如何正確看待大數(shù)據(jù)?如何看待大數(shù)據(jù)和傳統(tǒng)調(diào)查方法或統(tǒng)計(jì)學(xué)的關(guān)系? 4、大數(shù)據(jù)營(yíng)銷究竟面臨什么樣的挑戰(zhàn)?
一、大數(shù)據(jù)的迅猛發(fā)展與數(shù)據(jù)隱私的憂慮相伴而生社交媒體的出現(xiàn),讓用戶數(shù)據(jù)的分享數(shù)量達(dá)到了難以估量的程度。而如今,社交媒體的種類有增無減,智能手機(jī)的更大普及,又讓更多用戶轉(zhuǎn)移到移動(dòng)互聯(lián)網(wǎng),從而又進(jìn)一步貢獻(xiàn)更多數(shù)據(jù)和內(nèi)容。這樣的數(shù)據(jù)增量讓全球社交媒體的收入大漲,僅根據(jù)咨詢公司Gartner2012年的研究結(jié)果顯示,2012年全球社交媒體收入估計(jì)達(dá)到169億美元。 一邊是社交媒體因?yàn)榇髷?shù)據(jù)的盆缽滿載,另一方面則是用戶不斷毫無保留的將個(gè)人信息交給互聯(lián)網(wǎng),這些信息包括年齡、性別、地域、生活狀態(tài)、態(tài)度、行蹤、興趣愛好、消費(fèi)行為、健康狀況甚至是性取向等。一時(shí)間,針對(duì)海量用戶信息的大數(shù)據(jù)挖掘、大數(shù)據(jù)分析、大數(shù)據(jù)精準(zhǔn)營(yíng)銷、廣告精準(zhǔn)投放等等迅速被各大公司提上日程。 比如,一個(gè)發(fā)生在美國的真實(shí)故事就會(huì)告訴我們,利用數(shù)據(jù)挖掘如何掌握我們的行蹤。一個(gè)美國家庭收到了一家商場(chǎng)投送的關(guān)于孕婦用品的促銷劵,促銷劵很明顯是給給家中那位16歲女孩的。女孩的父親很生氣,并找商場(chǎng)討說法。但幾天后,這位父親發(fā)現(xiàn),16歲的女兒真懷孕了。而商場(chǎng)之所以未卜先知,正是通過若干商品的大量消費(fèi)數(shù)據(jù)來預(yù)估顧客的懷孕情況。 類似的大數(shù)據(jù)挖掘和營(yíng)銷事件在今天更多的發(fā)生,尤其是社交媒體產(chǎn)生大量數(shù)據(jù)后。于是,許多人對(duì)個(gè)人隱私數(shù)據(jù)開始擔(dān)憂,開始批判大數(shù)據(jù)精準(zhǔn)營(yíng)銷侵犯了個(gè)人隱私,憂慮我們進(jìn)入了大數(shù)據(jù)失控的時(shí)代,并將原因更多歸結(jié)于社交媒體。
二、大數(shù)據(jù)營(yíng)銷和個(gè)人隱私泄露之間不能完全劃等號(hào)!邏輯關(guān)系不成立!如果客觀的分析一下上述問題就會(huì)發(fā)現(xiàn),這是一個(gè)難以分說的雞生蛋還是蛋生雞的問題。一味地批判大數(shù)據(jù)分析對(duì)個(gè)人用戶數(shù)據(jù)的泄露或?yàn)E用是不客觀的。 因?yàn)?,社交媒體的本質(zhì)在于分享和傳播,社交媒體的出現(xiàn)的確滿足了人們分享個(gè)人信息、曬各種數(shù)據(jù)的欲望,讓人們?cè)谶^去無聲無息的生活中突然轉(zhuǎn)移到了可以讓全世界看到自己的平臺(tái)上來。人們從而達(dá)到了內(nèi)心的滿足感和存在感。因此,單從個(gè)體的背后心理來考慮,社交媒體對(duì)他們來說是有益的,他們不認(rèn)為自己貢獻(xiàn)的是不可告人的秘密,既然分享出來,那一定是希望或允許別人看到的。因此,這是一種無形的默許的交易,用戶樂意把自己的各種瑣碎細(xì)節(jié)暴露于社交媒體,而對(duì)社交媒體上雜亂無章的海量用戶數(shù)據(jù)進(jìn)行有序的分類和分析也沒有什么不妥。 當(dāng)然,如果社交媒體平臺(tái)隨意濫用或泄露用戶的后臺(tái)數(shù)據(jù),比如個(gè)人聯(lián)系方式、家庭住址、銀行等極為隱秘的信息,這的確是赤裸的侵犯隱私的行為,極其沒有道德,必須要受到譴責(zé)和法律制裁。 但目前,許多大數(shù)據(jù)精準(zhǔn)營(yíng)銷的前提是對(duì)用戶在互聯(lián)網(wǎng)上留下的公開顯在的信息進(jìn)行算法歸類和內(nèi)容分析,從而對(duì)海量用戶進(jìn)行人群劃分,或者對(duì)小眾群體進(jìn)一步細(xì)分化,甚至達(dá)到某種程度上針對(duì)單個(gè)人的個(gè)性化定制,最終達(dá)到精準(zhǔn)推送廣告或有針對(duì)性推出營(yíng)銷活動(dòng)的目的。 所以,從這個(gè)角度來看,大數(shù)據(jù)精準(zhǔn)營(yíng)銷與個(gè)人主動(dòng)分享和傳播到網(wǎng)絡(luò)上的信息數(shù)據(jù)之間并沒有矛盾。人們起初或許會(huì)驚訝:為什么他們知道我想買什么?為什么他們知道我的需求?但隨著“猜透心思”的推送行為讓人們的生活越來越便利時(shí),比如省去大量搜索、查找和對(duì)比產(chǎn)品或服務(wù)的時(shí)間,他們可能會(huì)十分習(xí)慣并依賴這種精準(zhǔn)性,并不會(huì)在意他們本來就隨意分享到網(wǎng)絡(luò)上的雜亂信息被如何挖掘和利用。 因此,用戶發(fā)布和分享的信息是否為隱私,在用戶分享信息之前就做過慎重考量和篩選。這一點(diǎn)非常重要,這是侵犯隱私與否的界限。那些被用戶選擇為不適合發(fā)布或不希望別人知道的信息就是用戶認(rèn)為的隱私,而那些已經(jīng)公開發(fā)布到社交媒體或網(wǎng)絡(luò)上的信息則被用戶認(rèn)為是可以傳播的。 所以,普通的對(duì)海量公開信息的分析、挖掘、歸類,從而進(jìn)行精準(zhǔn)營(yíng)銷的大數(shù)據(jù)行為不能一味被罵成是對(duì)用戶利益的損害。而那些對(duì)用戶存儲(chǔ)在某些位置、不希望被他人了解的信息(私人存儲(chǔ)的信息)如果被別有用心的人泄露或利用,那這就是隱私侵犯行為。但這就不能歸罪于大數(shù)據(jù),而應(yīng)質(zhì)問存貯平臺(tái)的安全性問題。 因此,我們不能過分解讀大數(shù)據(jù)精準(zhǔn)營(yíng)銷。其實(shí),問題的本質(zhì)在于,人們是否真的在意雜亂信息的去向(涉及到分享信息的背后心理和動(dòng)機(jī))?以及大數(shù)據(jù)營(yíng)銷是否真的觸碰了人們不可告人的秘密或底線(需要對(duì)秘密和底線重新定義)?因?yàn)?,如果人們默認(rèn)分享的都是公開的,那么侵犯隱私的概念就是不成立的。如果人們有不希望別人知道的信息,也不會(huì)貿(mào)然在網(wǎng)絡(luò)上分享和傳播。
三、大數(shù)據(jù)營(yíng)銷究竟會(huì)給企業(yè)和用戶帶來什么價(jià)值?討論完上面的問題之后,我們是否應(yīng)該誠懇對(duì)待大數(shù)據(jù)精準(zhǔn)營(yíng)銷這件事?那么大數(shù)據(jù)營(yíng)銷究竟對(duì)于企業(yè)和用戶兩方面來說,都有什么樣的價(jià)值? 1、對(duì)于企業(yè)的價(jià)值 讓我們先看一個(gè)國外案例: 我們都知道美劇《紙牌屋》,提到《紙牌屋》的成功,最大的功勞便是大數(shù)據(jù)分析。因此,《紙牌屋》幾乎成了大數(shù)據(jù)營(yíng)銷的經(jīng)典案例,也是美國Netflix公司基于用戶信息挖掘來決定內(nèi)容生產(chǎn)的成功嘗試。 Netflix的訂閱用戶達(dá)到了3000萬左右,而大多數(shù)用戶的觀影都與精準(zhǔn)推薦系統(tǒng)有關(guān)。Netflix會(huì)定時(shí)收集并分析用戶觀看電影或電視劇的行為,比如根據(jù)用戶對(duì)電影的評(píng)分、用戶的分享行為、用戶的觀影記錄等信息去分析用戶的收看習(xí)慣,從而推斷用戶喜歡什么樣的影視劇,喜歡什么樣的風(fēng)格,喜歡什么樣的導(dǎo)演和演員。在此基礎(chǔ)上利用算法對(duì)用戶感興趣的視頻進(jìn)行推薦排序,直到用戶找到最喜歡的影視劇?!都埮莆荨返膶?dǎo)演和主演就是Netflix挖掘用戶信息后的預(yù)測(cè)出來的。 那我們?cè)倏匆粋€(gè)國內(nèi)案例: 我們都知道阿里巴巴和新浪微博合作的事情,阿里巴巴斥資5.86億入股新浪微博。除了網(wǎng)絡(luò)上各大媒體分析的,認(rèn)為阿里巴巴希望打造生態(tài)圈、強(qiáng)化流量入口、挑戰(zhàn)騰訊等等原因之外,還有一個(gè)重要原因或許就是大數(shù)據(jù)營(yíng)銷的戰(zhàn)略。 如今各大互聯(lián)網(wǎng)大佬都在跑馬圈地,圈住用戶,誰能圈住用戶,讓用戶在其平臺(tái)上活躍,誰就掌握了用戶的大量信息(包括顯在的前臺(tái)信息和隱藏的后臺(tái)信息)。新浪微博在中國有幾億用戶,這個(gè)量十分龐大,但如果新浪不能把這些用戶產(chǎn)生的信息合理的利用,那么這些資源就是巨大的浪費(fèi)。我們?cè)倏窗⒗锇桶停袊畲箅娚唐脚_(tái),它有產(chǎn)品,但是卻沒有完整的用戶日常生活行為信息,只有購買信息,但這些購買信息不足以了解人群特點(diǎn)和喜好。所以,只有跟新浪微博合作,掌握大量用戶的行為信息,從而對(duì)其分類,找到不同人群甚至不同個(gè)體的喜好、偏好、興趣、愛好、習(xí)慣、傳播習(xí)慣、分享路徑等等,那么就能實(shí)現(xiàn)精準(zhǔn)營(yíng)銷,甚至還可以通過不同用戶的信息傳播規(guī)律,而制定產(chǎn)品的最佳品牌傳播途徑。這是一座巨大的金礦。 新浪微博和阿里巴巴合作后,微博上出現(xiàn)了一些產(chǎn)品推薦信息,同時(shí)新浪微博已經(jīng)推出支付功能。可以想象:未來你在微博上看到相關(guān)推薦的產(chǎn)品,恰好是你喜歡的產(chǎn)品,那么你就可以直接在微博上實(shí)現(xiàn)支付和購買。從而新浪微博和阿里巴巴各取所需,共享收益。當(dāng)然,這是我個(gè)人的觀察和分析,不過阿里巴巴的大數(shù)據(jù)戰(zhàn)略也很明顯了。 2、對(duì)于用戶的價(jià)值 上述兩個(gè)例子說的都是大數(shù)據(jù)帶給企業(yè)的價(jià)值,那么,大數(shù)據(jù)營(yíng)銷對(duì)于用戶來說,到底有沒有價(jià)值?用戶是否十分反感精準(zhǔn)營(yíng)銷?讓我們?cè)賮砜纯匆粋€(gè)新的調(diào)查數(shù)據(jù): 中國傳媒大學(xué)國家廣告研究院剛剛發(fā)布一份《2014中美移動(dòng)互聯(lián)網(wǎng)發(fā)展報(bào)告》,這份調(diào)查報(bào)告對(duì)比了中美兩國用戶移動(dòng)互聯(lián)網(wǎng)的使用習(xí)慣,以及移動(dòng)用戶對(duì)于移動(dòng)廣告的態(tài)度。 調(diào)查顯示,最可能得到智能終端用戶回應(yīng)的廣告內(nèi)容為:(1)與用戶要購買物品相關(guān)的廣告(2)與要購買物品相關(guān)的優(yōu)惠券(3)搞笑的廣告(4)與用戶最喜愛品牌相關(guān)的廣告(5)與用戶在線上訪問過網(wǎng)站或使用過的應(yīng)用相關(guān)的廣告(6)與最近線上購物相關(guān)的廣告(7)與用戶所在場(chǎng)所相關(guān)的廣告(8)與最近收聽、收看的廣播/電視相關(guān)的廣告。(占比>=20%) 從這些數(shù)據(jù)我們可以看出,在8個(gè)結(jié)果中,有6個(gè)都是跟大數(shù)據(jù)精準(zhǔn)營(yíng)銷扯上關(guān)系的。比如,與用戶要購買物品相關(guān)的廣告,更能引起用戶的回應(yīng)或互動(dòng)。如何理解?大數(shù)據(jù)營(yíng)銷的前提就是計(jì)算并推測(cè)用戶的真實(shí)需求,看用戶需要購買什么相關(guān)產(chǎn)品,然后給用戶直接推送用戶想要的、喜歡的,做到了精準(zhǔn)到達(dá)。那么用戶呢?用戶樂意對(duì)這樣的推動(dòng)廣告或產(chǎn)品做出回應(yīng),因?yàn)檫@些廣告少了對(duì)用戶的打擾,并且讓用戶費(fèi)勁心思對(duì)對(duì)比或貨比三家后才購買的決策過程降低,節(jié)省了時(shí)間,讓用戶直接找到內(nèi)心真正所需的產(chǎn)品或服務(wù)。 所以,這樣的結(jié)果就表明,大數(shù)據(jù)精準(zhǔn)營(yíng)銷并不是完全都會(huì)讓用戶反感,而是看你猜透用戶心思的程度。因此,如果你推送的內(nèi)容和用戶想要購買的物品相關(guān),與用戶最喜愛的品牌相關(guān)等等。那么這種精準(zhǔn)挖掘并不會(huì)受到用戶的反感,反而會(huì)給用戶帶來便利。
四、不要過分迷信大數(shù)據(jù);大數(shù)據(jù)的實(shí)質(zhì)究竟是什么?看了上面的分析,或許你會(huì)認(rèn)為大數(shù)據(jù)分析真是無所不能。但是,我們不能過分迷信大數(shù)據(jù),于是接下來的問題就產(chǎn)生了。 1、大數(shù)據(jù)分析和傳統(tǒng)統(tǒng)計(jì)學(xué)方法有什么樣的關(guān)系? 大數(shù)據(jù)所遵從的是:以大量數(shù)據(jù),甚至所有數(shù)據(jù)為基礎(chǔ),然后用算法去計(jì)算分析,從而更精準(zhǔn)的找到各個(gè)因素之間的相關(guān)關(guān)系(不是因果關(guān)系),以發(fā)現(xiàn)數(shù)據(jù)之間的規(guī)律。 那我們看看傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,統(tǒng)計(jì)分析學(xué)解決的就是如何通過選取少量的樣本,通過對(duì)樣本的分析,然后推斷整體的趨勢(shì)和規(guī)律。所以,用的是概率。一般會(huì)規(guī)定在90%、95%或98%的置信度(精確度)下最大程度推斷總體。如果目的明確,樣本選取得當(dāng),操作科學(xué),那么不需要大量數(shù)據(jù)就能分析出規(guī)律,從而推斷出總體的規(guī)律,并且可以發(fā)現(xiàn)不同因素之間的因果關(guān)系。比如,抽樣方法確定后,就可以確定樣本數(shù)量,如果抽樣得當(dāng),那么樣本的數(shù)量跟總體的數(shù)量之間沒有太多直接關(guān)系。 舉個(gè)不恰當(dāng)?shù)睦右怨├斫猓杭僭O(shè)選取1000個(gè)樣本,推斷的規(guī)律是A,選取2000個(gè)樣本,同樣呈現(xiàn)出A規(guī)律,選取3000也差不多這樣。那么,我們實(shí)際上科學(xué)選取1000多個(gè)樣本就可以達(dá)到目的了。所以,傳統(tǒng)的抽樣和統(tǒng)計(jì)方法,在最大程度上解決了成本問題,雖然會(huì)有誤差,但仍可以發(fā)現(xiàn)的顯在規(guī)律。 所以,從這個(gè)角度來說,大數(shù)據(jù)分析最終得到的結(jié)果很可能跟傳統(tǒng)統(tǒng)計(jì)學(xué)方法分析的結(jié)果類似,只不過把原來的小樣本變成了大樣本分析。雖然大數(shù)據(jù)分析理論上是更精準(zhǔn),也可以彌補(bǔ)傳統(tǒng)誤差的缺陷,但準(zhǔn)確度未必像我們想象的那樣提高非常多(因?yàn)榇髷?shù)據(jù)分析會(huì)嚴(yán)重受到數(shù)據(jù)源的影響)。另外,也不一定能發(fā)現(xiàn)更多新規(guī)律。如果是這樣的話,我們不禁要問,大數(shù)據(jù)究竟是為什么而存在? 另外,在傳統(tǒng)的統(tǒng)計(jì)學(xué)分析當(dāng)中,比如對(duì)市場(chǎng)情況的分析,我們要結(jié)合實(shí)際的環(huán)境和背景來解讀數(shù)據(jù)和分析數(shù)據(jù),我們并不把數(shù)據(jù)當(dāng)成唯一的和萬能的指引。所以,這里面就存在人根據(jù)經(jīng)驗(yàn)和實(shí)際情況進(jìn)行數(shù)據(jù)分析的過程,而人參與分析的能力是很重要的。 2、什么樣的事情是大數(shù)據(jù)做不到的,而傳統(tǒng)的調(diào)查分析方法卻可以做到? 大數(shù)據(jù)營(yíng)銷的前提是大數(shù)據(jù)分析,而大數(shù)據(jù)分析是基于算法的,是計(jì)算機(jī)固化的模式。也就是說,原來由人對(duì)數(shù)據(jù)分析的那部分工作,現(xiàn)在我們把它約定到算法里了。并且,大數(shù)據(jù)精準(zhǔn)營(yíng)銷是對(duì)用戶產(chǎn)生的網(wǎng)絡(luò)瀏覽數(shù)據(jù)、分享數(shù)據(jù)、搜索數(shù)據(jù)等等行為信息進(jìn)行分析,從而對(duì)人群或事物進(jìn)行分類,并由此推測(cè)人的偏好、興趣等。 但是,偏好不等于真實(shí)需求,點(diǎn)擊不代表一定喜歡。一個(gè)人今天在社交媒體上說:“這個(gè)產(chǎn)品不錯(cuò)”,就認(rèn)為他一定喜歡或一定需要這個(gè)產(chǎn)品嗎? 機(jī)器可以對(duì)行為分類,但卻不能真正探測(cè)到人的心理和真實(shí)需求。那么,對(duì)于人的真實(shí)心理和需求的探測(cè),我們?nèi)绾巫龅??這時(shí)候,傳統(tǒng)的市場(chǎng)調(diào)查和分析方法是不可取代的。比如,深度訪談法,比如焦點(diǎn)小組訪談法,投射法等等。這些方法都可以在最大程度上,從心理學(xué)的角度去分析和發(fā)現(xiàn),人真正的欲望和本質(zhì)需求。所以,今天很多大的廣告公司、營(yíng)銷公司,他們?nèi)匀徊捎眠@樣傳統(tǒng)的方法去了解表面數(shù)據(jù)背后的故事和原因。而這些故事和原因,是算法目前沒辦法做到的,必須由人來完成。人和人的交流才能探測(cè)人的內(nèi)心。 從這個(gè)角度來說,大數(shù)據(jù)并不是萬能的,也不能被一味神話,我們必須清晰的認(rèn)識(shí)到它的實(shí)質(zhì),它能用來干什么,不能用來干什么。我們可以這樣理解:人對(duì)數(shù)據(jù)的計(jì)算和分析工作如今可能會(huì)被機(jī)器替代,但是,人的另一部分工作(探測(cè)人內(nèi)心的能力)沒辦法被算法替代。 比如,前兩年我曾報(bào)道過《寫書都可以用算法實(shí)現(xiàn)自動(dòng)化了,拿什么挽救出版》這樣的新技術(shù),據(jù)稱目前亞馬遜上大量圖書都是被算法寫出來的,算法會(huì)根據(jù)人寫書的邏輯思路來組織語言。但是,這些書卻不能彌補(bǔ)人類情感的缺失,不能表達(dá)出社會(huì)背景和作者所處環(huán)境帶來的情感波動(dòng)等等。
五、大數(shù)據(jù)分析或大數(shù)據(jù)營(yíng)銷面臨的真正挑戰(zhàn)是什么?1、數(shù)據(jù)冗余問題,有沒有必要用這么多數(shù)據(jù)? 數(shù)據(jù)源問題,數(shù)據(jù)質(zhì)量有無保障,是否是真正所需? 大數(shù)據(jù)分析一直被人稱頌的優(yōu)點(diǎn)就是:海量數(shù)據(jù)的運(yùn)用。但是,數(shù)據(jù)是不是越多越好?如何篩選這些數(shù)據(jù)?如何找到有價(jià)值和有用的數(shù)據(jù)?數(shù)據(jù)的龐大和冗余會(huì)對(duì)大數(shù)據(jù)分析造成什么樣的影響? 對(duì)于大數(shù)據(jù)而言,巨量的數(shù)據(jù)來源是分析準(zhǔn)確性的根本保證。但是,數(shù)據(jù)量大到一定程度后也面臨著很大問題:想要保證準(zhǔn)確度就變的困難了。這樣就難以保障分析結(jié)果的準(zhǔn)確性了。大數(shù)據(jù)分析和預(yù)測(cè)失敗的例子也有很多。比如,最典型和著名的一個(gè)便是谷歌預(yù)測(cè)流感趨勢(shì)失敗的案例。 報(bào)道稱,谷歌是基于搜索引擎數(shù)據(jù)進(jìn)行的分析,其分析結(jié)果與美國疾病防控中心的監(jiān)測(cè)數(shù)據(jù)相差近兩倍。盡管谷歌不斷調(diào)整算法,但仍不能保證結(jié)果的準(zhǔn)確性。這就說明一個(gè)重要問題:數(shù)據(jù)源問題。谷歌是基于搜索引擎上的搜索詞來分析的,許多搜索詞都是無效的,沒有任何意義的,所以它們不能真的代表流感趨勢(shì),但它們同樣被計(jì)算在內(nèi)。這就造成了結(jié)果的嚴(yán)重偏差。 所以,你弄到的這些數(shù)據(jù),如何保障它們的確是你所需的?的確是重要的?如果數(shù)據(jù)源出現(xiàn)了嚴(yán)重偏差,那么你的分析再精準(zhǔn),那么也是徒勞。比如,你花費(fèi)了大量精力去搜集互聯(lián)網(wǎng)用戶產(chǎn)生的日常分享信息,你對(duì)他們的所有信息都進(jìn)行分析,結(jié)果預(yù)測(cè)出幾種消費(fèi)趨勢(shì)。但是,這些分享信息中有大量冗余信息,數(shù)據(jù)精準(zhǔn)度很差,許多都是跟消費(fèi)沒有關(guān)系的,那么這種分析結(jié)果很可能就是不準(zhǔn)確的。你按照這種結(jié)果進(jìn)行下一步營(yíng)銷戰(zhàn)略當(dāng)然可能是失敗的。 2、大佬平臺(tái)的游戲,普通企業(yè)難掌握大量數(shù)據(jù);難檢驗(yàn)可信性 各大互聯(lián)網(wǎng)公司平臺(tái)掌握著用戶資源,用戶產(chǎn)生的信息當(dāng)然也被聚集在各平臺(tái)內(nèi)。但是,各家公司或平臺(tái)的數(shù)據(jù)并不會(huì)完全向公眾開放。我們只能通過某些工具抓取到網(wǎng)絡(luò)上散落的信息,但不能準(zhǔn)確掌握完整的有實(shí)際價(jià)值和意義的后臺(tái)數(shù)據(jù)和信息。 而這些海量信息,對(duì)于像谷歌這樣的大互聯(lián)網(wǎng)公司來說,就是寶藏。大數(shù)據(jù)或許只是這些大佬平臺(tái)的游戲,普通企業(yè)比較難參與進(jìn)來。 并且,這些平臺(tái)之間并不互通和開放,他們分析出來的數(shù)據(jù)結(jié)果得不到第三方的驗(yàn)證和檢驗(yàn),我們就無法知道他們大數(shù)據(jù)分析結(jié)果的有效性和可信性。當(dāng)然,他們將這些數(shù)據(jù)分析用戶自身產(chǎn)品開發(fā)和自身發(fā)展上還是很有價(jià)值的。所以,普通人或普通企業(yè)對(duì)于大數(shù)據(jù)的渴望或許是奢望。將來互聯(lián)網(wǎng)大平臺(tái)公司或許會(huì)售賣大數(shù)據(jù)分析的服務(wù),這很有可能。并且,未來,個(gè)人數(shù)據(jù)管理領(lǐng)域的創(chuàng)新和創(chuàng)業(yè)將會(huì)增加,應(yīng)用也會(huì)增多。 另外,目前大數(shù)據(jù)分析的算法還沒有標(biāo)準(zhǔn),也沒有公認(rèn)和統(tǒng)一有效的工具。 所以,從以上這些方面看,大數(shù)據(jù)分析和大數(shù)據(jù)營(yíng)銷還有很長(zhǎng)的路要走。我們需要正確、理性地看待大數(shù)據(jù)。 |