一、大數(shù)據(jù)時代已來臨:
目前以云存儲為代表的公共存儲服務(wù)模式已初現(xiàn)端倪,將可能在未來5-10年成為主流 存儲模式之一。類似于水電氣公共服務(wù),存儲平臺服務(wù)化意味著現(xiàn)有的存儲系統(tǒng)面臨新的挑戰(zhàn)。存儲按需服務(wù)的公共模式將引入用戶應(yīng)用的多樣性、異構(gòu)性和個性化、用戶訪問的高并發(fā)性和動態(tài)性、以及數(shù)據(jù)自身的復(fù)雜性等特點,導(dǎo)致大數(shù)據(jù)時代的趨勢和特征凸現(xiàn)。大數(shù)據(jù)電子商務(wù)在現(xiàn)實世界中有著非常廣泛的分布和應(yīng)用,包括醫(yī)療信息、視頻監(jiān)控、移動設(shè)備、智能設(shè)備、非傳統(tǒng) IT
設(shè)備、傳統(tǒng)IT 非傳統(tǒng)應(yīng)用以及特定行業(yè)需求等。如在零售業(yè)中,對大數(shù)據(jù)電子商務(wù)的分析越來越受重視。沃爾瑪在全球有8400家門店,每周有20億筆客戶交易數(shù)據(jù),沃爾瑪公司很早就開始從日常交易記錄析出關(guān)聯(lián)交易,在2004年卡特里娜颶風(fēng)來襲前,沃爾瑪就從手電筒和電池的銷售中成功分析出餡餅即將熱銷。隨著計算機和存儲成本的下降,中小型零售企業(yè)也能夠利用IT技術(shù)對收集的大量數(shù)據(jù)分析,開展商務(wù)智能應(yīng)用。再如,在醫(yī)療健康領(lǐng)域,由于電子醫(yī)療記錄時代的來臨、醫(yī)療圖像技術(shù)進(jìn)步、基因研究以及制藥工程中對于大型數(shù)據(jù)庫的應(yīng)用,大規(guī)模復(fù)雜數(shù)據(jù)在醫(yī)療機構(gòu)中變得很普遍。通過對大量病人的各類數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析,有助于更有效地找出疾病成因,進(jìn)而提供針對性地預(yù)防、診斷和治療措施。美國著名的綜合管理式醫(yī)療財團Kaiser Permanente,擁有超過8百萬會員、36 家醫(yī)院以及超過400家醫(yī)療機構(gòu),各部門需要在同一時間分析眾多因素,包括治療、人口統(tǒng)計資料(如年齡、性別等)、實驗室結(jié)果、處方、診斷、醫(yī)療保險計劃以及付款記錄等,綜合這些不同的信息,以便決策系統(tǒng)向醫(yī)護(hù)人員提供完整的病人歷史,選擇最佳的醫(yī)護(hù)辦法。
二、潛在商機李開復(fù)的12月3日的更新的微博針對大數(shù)據(jù)電子商務(wù)時代進(jìn)行了預(yù)測【:大數(shù)據(jù)電子商務(wù)的可能應(yīng)用領(lǐng)域】
1. 保險業(yè):收集汽車駕駛數(shù)據(jù)制定個性化保險政策價等;
2. 零售商:基于全市場數(shù)據(jù)的商品推銷策略分析等;
3. 金融業(yè):利用歷史數(shù)據(jù)分析詐騙等;
4.醫(yī)療保障:通過健康數(shù)據(jù)提高病人護(hù)理條件等;
5.制造業(yè):估算保修費用,檢測零部件問題等。
針對大數(shù)據(jù)時代的進(jìn)行深度分析挖掘,將能創(chuàng)造巨大商機,目前各大電子商務(wù)網(wǎng)站如淘寶網(wǎng),
繁多的產(chǎn)品讓人無從抉擇,用戶能做的就是反復(fù)對比同類產(chǎn)品的優(yōu)缺點,過往買家的評論來決定自己的選擇,但是這對用戶來說是極其痛苦的,如果后臺能對海量的用戶行為數(shù)據(jù)進(jìn)行快速分析,推薦出用戶階段性最需要最適合的產(chǎn)品,將能極大的促進(jìn)商家的銷售額。
目前推薦做得較好的網(wǎng)站有亞馬遜和當(dāng)當(dāng)網(wǎng)等,能針對用戶需要,動態(tài)的給與極其準(zhǔn)
確的推薦信息,推薦結(jié)果準(zhǔn)確,推薦更新度極快。
三、大數(shù)據(jù)時代信息推薦相關(guān)技術(shù)
推薦技術(shù):主流的推薦算法有基于物品相似度的推薦和基于用戶相似度的推薦。目前各大電商網(wǎng)站普遍采用的是基于物品的相似度推薦,但是如何將準(zhǔn)確度量用戶的興趣仍然是個難題;基于用戶相似度推薦主要用在新聞等用戶遠(yuǎn)少于物品的網(wǎng)站,如新聞評論類網(wǎng)站。 并行計算技術(shù):為了提高用戶服務(wù)質(zhì)量,后臺采用Hadoop的mapreduce技術(shù)進(jìn)行分布式并行計算是主流趨勢,但是該技術(shù)存在嚴(yán)重的單點故障和性能瓶頸,目前國內(nèi)外各大研究所都在針對hadoop存儲平臺和mapreduce技術(shù)進(jìn)行優(yōu)化研究,最新銳的研究技術(shù)產(chǎn)品是MapR“構(gòu)建一個 HDFS 的私有替代品,這個替代品比當(dāng)前的開源版本快三倍,自帶快照功能,而且支持無Namenode單點故障(SPOF),并且在API上和兼容,所以可以考慮將其作替代方案?!保?
四、大數(shù)據(jù)時代信息推薦相關(guān)網(wǎng)站介紹
9 點優(yōu)品:該網(wǎng)站用戶定位做最有品質(zhì)的購物推薦,經(jīng)本人分析網(wǎng)站主要針對100 以上品牌商品進(jìn)行推薦,有較多針對攝影愛好控的權(quán)威推薦,優(yōu)質(zhì)正品推薦是
該網(wǎng)站的最大優(yōu)點,網(wǎng)站對產(chǎn)品的價格、銷量、質(zhì)量三方關(guān)注,同時附帶個人評價,有一定的參考價值,另外有個“我勒個趣”的趣味推薦,主要發(fā)布新奇特推薦信息,比較吸引眼球。網(wǎng)站缺點在于關(guān)聯(lián)推薦做得不夠好,如推薦榨汁機的關(guān)聯(lián)推薦中三款喲兩款是體恤刀,目測推薦技術(shù)采用的只是分類關(guān)聯(lián)推薦,粒度太大,有待改進(jìn);另外網(wǎng)站缺乏網(wǎng)友交互功能。逛:該網(wǎng)站定位女性逛街推薦品,主打推薦的產(chǎn)品很便宜,如小
飾品小零食,網(wǎng)站采用圖片瀑布流的推薦模式,很適合女生瀏覽,但缺點是推薦的描述信
息量小,難以判斷推薦產(chǎn)品的優(yōu)劣。什么值得買:該網(wǎng)站最大特點是交互做得很好,有網(wǎng)友對推薦信息的二度評價,幫助用戶做出判斷,但缺也很明顯,產(chǎn)品推薦缺乏層次,高中低端都有,且混雜在一起,難以去按價格分類選擇。 惠惠:該網(wǎng)站是網(wǎng)易旗下購物推薦網(wǎng)站,主打推薦是購物返現(xiàn)活動,頁面交互體驗很好,但是對于返現(xiàn)操作對很多用戶還是太陌生,如果想要發(fā)展,建議先做普及。否則用戶群體只能是網(wǎng)購資深達(dá)人,不適合普通用戶。
五、大數(shù)據(jù)時代信息推薦的未來
以上大數(shù)據(jù)時代推薦信息目前都是人工運營,運營強度極大,且具有個人偏好,對運營人員來說極辛苦,對用戶來說,隨機性較大;如果能將傳統(tǒng)的推薦算法與人工推薦有機結(jié)合,在后來采取 MapR計算框架,結(jié)合前臺推薦算法和人工推薦結(jié)果,將極大的推動這一產(chǎn)業(yè)的未來發(fā)展。