大發(fā)展時(shí)間尚短,對(duì)其的定義可謂“百家爭(zhēng) 鳴”,各有其說(shuō),卻尚無(wú)一致而權(quán)威的定義。結(jié)合現(xiàn)有的資料,大數(shù)據(jù)可作為數(shù)據(jù)集存在,通常涉 及不少于2種的數(shù)據(jù)形式,為使大數(shù)據(jù)更好地發(fā)揮作用,需 借助新型的處理模式。大數(shù)據(jù)包含“海量數(shù)據(jù)”數(shù)據(jù)規(guī)模 大的特點(diǎn),而并不局限于此。雖無(wú)明確而一致的定義,然 而大數(shù)據(jù)的4V特征卻得到各方面較為一致的認(rèn)可。所謂4V特征,即Volume(規(guī)模大), Variety(種類多),Velocity(處理速度高效),Value(價(jià)值密度低)的特征。
1 大數(shù)據(jù)及大數(shù)據(jù)處理概論
當(dāng)前互聯(lián)網(wǎng)繁榮發(fā)展,網(wǎng)絡(luò)上可檢索到數(shù)以億計(jì)、 千億計(jì)的數(shù)據(jù)信息,如此巨大的數(shù)據(jù)量,即為大數(shù)據(jù)。大 數(shù)據(jù)的最早提出是在九十世紀(jì)末1880年左右的一次人口普 查中,在二十世紀(jì)基本沒有變化,進(jìn)入二十一世紀(jì)尤其是 2009年開始爆發(fā)式增長(zhǎng)。大數(shù)據(jù)涵蓋的范圍十分廣泛,并 不局限于網(wǎng)絡(luò)中的信息或是人口普查中所涉及的信息,還 包含社會(huì)各領(lǐng)域、日常生活中的諸多信息,如來(lái)自工業(yè)、 電力、電子等多方面的各色信息。
大數(shù)據(jù)擁有非常巨大的數(shù)據(jù)量,而徒有數(shù)據(jù)并非大數(shù) 據(jù)成功的關(guān)鍵,其關(guān)鍵在于對(duì)大數(shù)據(jù)所具的海量的數(shù)據(jù)進(jìn) 行處理,選擇出合適的數(shù)據(jù)或信息投入使用,以創(chuàng)造更大 的價(jià)值,此過(guò)程即大數(shù)據(jù)的處理。對(duì)大數(shù)據(jù)良好的處理, 使大數(shù)據(jù)更具備價(jià)值,大數(shù)據(jù)的處理包含多種技術(shù),如數(shù) 據(jù)挖掘電網(wǎng)、大規(guī)模并行處理或分布式數(shù)據(jù)庫(kù)、云計(jì)算等 均為大數(shù)據(jù)的主要處理技術(shù)。大數(shù)據(jù)將發(fā)展成為一種“資 產(chǎn)”,并將貫穿于各個(gè)領(lǐng)域行業(yè),其處理技術(shù)將不斷地進(jìn) 行升級(jí),以為其增創(chuàng)價(jià)值。
2 大數(shù)據(jù)的主要特點(diǎn)分析
2.1 大數(shù)據(jù)具有極大的數(shù)據(jù)量。所謂大數(shù)據(jù),其首要 特點(diǎn)便是數(shù)據(jù)之“大”,能夠分析的數(shù)據(jù)至少應(yīng)在100TB 之上。大數(shù)據(jù)的此項(xiàng)特點(diǎn)主要源自二個(gè)方面:其一,信息 時(shí)代,網(wǎng)絡(luò)已經(jīng)步入千家萬(wàn)戶,網(wǎng)絡(luò)使用者增多,因而獲 取數(shù)據(jù)的途徑就越便利。其二,與過(guò)去傳統(tǒng)的以對(duì)單位或 對(duì)象收集數(shù)據(jù)方式相比,如今可謂人人有網(wǎng),而沒有以往
的種種限制,因而可利用的數(shù)據(jù)大為增多。
2.2大數(shù)據(jù)具有多樣的類型。傳統(tǒng)的數(shù)據(jù)往往多為結(jié) 構(gòu)化數(shù)據(jù),是原始數(shù)據(jù)的抽象化,類型較為單一。而大數(shù) 據(jù)下的數(shù)據(jù)常為非結(jié)構(gòu)化數(shù)據(jù),儲(chǔ)存更為復(fù)雜,涉及的領(lǐng) 域較多,規(guī)模又很大,處理起來(lái)也更為不易。至今,非結(jié) 構(gòu)化數(shù)據(jù)已經(jīng)更為普遍,接近結(jié)構(gòu)化數(shù)據(jù)的三倍之多,增 長(zhǎng)速度也高達(dá)結(jié)構(gòu)化數(shù)據(jù)的10到50倍不等。隨數(shù)據(jù)的不斷 擴(kuò)充,數(shù)據(jù)已具有越來(lái)越多的類型,這是大數(shù)據(jù)的優(yōu)勢(shì), 同時(shí)也是其所面臨的挑戰(zhàn)。
2.3大數(shù)據(jù)具有快速的處理能力。因大數(shù)據(jù)大而類型 多的特點(diǎn),就要求其具備快速處理數(shù)據(jù)的能力。與傳統(tǒng)模 式不同,當(dāng)前的數(shù)據(jù)的產(chǎn)生與收集都愈發(fā)容易,數(shù)據(jù)增長(zhǎng) 的頻率顯而易見。一方面,并非全部數(shù)據(jù)均可直接使用, 另一方面,數(shù)據(jù)沒有停止增長(zhǎng),因此就需要大數(shù)據(jù)具有快 速而高效處理的能力。
2.4大數(shù)據(jù)具有較低的價(jià)值密度。大數(shù)據(jù)多為非結(jié)構(gòu) 化數(shù)據(jù),其特點(diǎn)之一即為較低的價(jià)值密度。非結(jié)構(gòu)化數(shù)據(jù) 未經(jīng)程式化的處理,多為保持本質(zhì)的原始數(shù)據(jù)。結(jié)構(gòu)化數(shù) 據(jù)往往是經(jīng)抽象化的數(shù)據(jù),多為可用數(shù)據(jù),而原始數(shù)據(jù)未 被處理,包含所有有用或無(wú)用的信息,因而其價(jià)值密度是
相對(duì)較低的。
3 大數(shù)據(jù)處理的重要意義
3.1大數(shù)據(jù)處理為市場(chǎng)營(yíng)銷提供便利。市場(chǎng)營(yíng)銷是指 迎合于市場(chǎng)的營(yíng)銷,反之只有迎合了市場(chǎng)才能獲利于市 場(chǎng)。市場(chǎng)營(yíng)銷首先要做到迎合市場(chǎng),同時(shí)應(yīng)將成本最低 化、效率最高化,而大數(shù)據(jù)處理即是達(dá)到市場(chǎng)營(yíng)銷目的的 便利方式之一。企業(yè)利用大數(shù)據(jù)處理,對(duì)市場(chǎng)進(jìn)行分析, 得出營(yíng)銷中的利潤(rùn)點(diǎn)與市場(chǎng)中的潛在價(jià)值,從而提供更多 客戶所需的商品,因而獲利。
3.2大數(shù)據(jù)處理為個(gè)性化提供可能。隨生活水平的提 高,人們的生活更為富有,已經(jīng)從最初的溫飽需求上升為 了對(duì)物質(zhì)更高的追求,也有了更多對(duì)個(gè)性化的追求。傳統(tǒng) 的商業(yè)模式通常為用戶在對(duì)商品的瀏覽與比較中找到其所 購(gòu)買的商品,而大數(shù)據(jù)處理模式下,是通過(guò)對(duì)用戶的數(shù)據(jù) 分析來(lái)發(fā)現(xiàn)用戶的習(xí)慣性需求或潛在需求,從而為用戶推
薦更為精準(zhǔn)且更具個(gè)性化的商品。
4 大數(shù)據(jù)處理對(duì)電子商務(wù)的影響
4.1大數(shù)據(jù)處理使電子商務(wù)的運(yùn)營(yíng)方式數(shù)據(jù)化。在大 數(shù)據(jù)的影響下,電子商務(wù)領(lǐng)域很大程度上改變了傳統(tǒng)的運(yùn) 營(yíng)模式,現(xiàn)今更多哦地以數(shù)據(jù)方式為主導(dǎo),貫穿于企業(yè)運(yùn) 營(yíng)中的采購(gòu)、營(yíng)銷以及財(cái)務(wù)等過(guò)程。大數(shù)據(jù)處理使電商企 業(yè)數(shù)據(jù)化運(yùn)營(yíng),使企業(yè)能夠通過(guò)數(shù)據(jù)分析出顧客的需求, 并以此對(duì)日后的經(jīng)營(yíng)提前做預(yù)測(cè),從而使成本最小化、利 潤(rùn)最大化。例如,亞馬遜企業(yè)的分別為FDFC和FC的兩種 數(shù)據(jù)化運(yùn)營(yíng)模式,前者主要用于預(yù)測(cè)熱銷商品,而后者則 用于小眾商品的分析。
4.2大數(shù)據(jù)處理使行業(yè)應(yīng)用得以垂直整合。垂直整合 可以理解為一種方法,以將公司的投入與產(chǎn)出的比例提高 或者降低到某種程度。垂直整合與價(jià)值鏈模型緊密聯(lián)系, 可指公司、供應(yīng)商與經(jīng)銷商三者之間價(jià)值鏈的整合程度, 而當(dāng)公司將另外二者的價(jià)值鏈整合至其價(jià)值鏈之中,即是 完全垂直整合。電商領(lǐng)域?qū)Υ髷?shù)據(jù)處理的應(yīng)用,使得企業(yè) 自身對(duì)供應(yīng)商與營(yíng)銷商的整合能力不斷增強(qiáng),其間的資源 得到更好的共享,企業(yè)與用戶的關(guān)系越來(lái)越近,也就獲得
4.3 大數(shù)據(jù)處理使電子商務(wù)數(shù)據(jù)資產(chǎn)化。隨著信息時(shí) 代的發(fā)展與進(jìn)步,數(shù)據(jù)或大數(shù)據(jù)作為信息時(shí)代的產(chǎn)物將占 據(jù)越發(fā)重要的地位。有相關(guān)學(xué)者分析表示,數(shù)據(jù)化競(jìng)爭(zhēng)將 引領(lǐng)未來(lái)的商業(yè)競(jìng)爭(zhēng),而企業(yè)制勝的關(guān)鍵將以其對(duì)數(shù)據(jù)的 掌握來(lái)衡量。企業(yè)將越發(fā)重視數(shù)據(jù),將會(huì)有越來(lái)越多有關(guān) 數(shù)據(jù)的業(yè)務(wù)相應(yīng)而生,如對(duì)數(shù)據(jù)分析、可視化的業(yè)務(wù)和眾 包模式等。大數(shù)據(jù)在不久后的將來(lái)將發(fā)展成為一項(xiàng)產(chǎn)業(yè), 將為企業(yè)創(chuàng)造更多的利益。
5 結(jié)束語(yǔ)
大數(shù)據(jù)是IT行業(yè)的創(chuàng)新與革命,其發(fā)現(xiàn)與發(fā)展與云計(jì) 算、物聯(lián)網(wǎng)有同等的重要顛覆性價(jià)值。自發(fā)現(xiàn)而來(lái),大數(shù) 據(jù)一直是IT行業(yè)的熱點(diǎn),有著居高不下的關(guān)注點(diǎn),并帶來(lái) 巨額的利益。有許多學(xué)者及企業(yè)家對(duì)大數(shù)據(jù)進(jìn)行預(yù)言,稱 大數(shù)據(jù)未來(lái)將與石油、礦產(chǎn)、土地和資本一樣,具有無(wú)限 的財(cái)富價(jià)值和競(jìng)爭(zhēng)價(jià)值。電子商務(wù)作為當(dāng)今時(shí)代的新型商 務(wù)模式,與大數(shù)據(jù)處理有非常緊密的聯(lián)系,且在今后二者 之間的聯(lián)系將更為密切,可以說(shuō)大數(shù)據(jù)的處理能力之優(yōu)劣 直接與市場(chǎng)占有率成正比關(guān)系。醫(yī)院信息化系統(tǒng)的建設(shè),突破以往的醫(yī)院信息化過(guò)程中各個(gè) 先建立一個(gè)整合的基礎(chǔ)架構(gòu)平臺(tái),然后在其上建立一個(gè)統(tǒng)醫(yī)院各自為政形成信息孤島的弊端,使其與在社區(qū)建立的以 一的醫(yī)院信息集成平臺(tái),實(shí)現(xiàn)各應(yīng)用系統(tǒng)的互聯(lián)互通,最居民電子健康檔案為核心的社區(qū)居民電子健康檔案系統(tǒng)實(shí)行 終實(shí)現(xiàn)統(tǒng)一、集成的資源管理的發(fā)展路徑。有效對(duì)接。同時(shí)不同機(jī)構(gòu)的診斷和治療也可以通過(guò)統(tǒng)一的平 3.4 業(yè)務(wù)平臺(tái)虛擬化。虛擬化、云是未來(lái)的趨勢(shì)。如果臺(tái)查看,這樣可以提高疾病醫(yī)治的效率和準(zhǔn)確度,并節(jié)省費(fèi) 醫(yī)院所有設(shè)備(包括核心交換機(jī)、服務(wù)器、存儲(chǔ)等)都進(jìn)行用。著力與各級(jí)醫(yī)療機(jī)構(gòu)建立遠(yuǎn)程數(shù)據(jù)通道,將不同醫(yī)療機(jī) 虛擬化,醫(yī)院機(jī)房耗電量、機(jī)房空間、維護(hù)成本等均會(huì)大幅構(gòu),不同醫(yī)療機(jī)構(gòu)的所有醫(yī)生,為一個(gè)患者提供全生命周期 度降低,而系統(tǒng)整體穩(wěn)定性卻會(huì)大幅提升。同時(shí)區(qū)域衛(wèi)生信
健康與疾病的所有相關(guān)服務(wù)。從而實(shí)現(xiàn)醫(yī)療衛(wèi)生信息化從醫(yī) 息化的實(shí)現(xiàn)在很大程度上還要依賴云計(jì)算技術(shù),醫(yī)院信息系
院信息化走向區(qū)域衛(wèi)生信息化的過(guò)度。 統(tǒng)大數(shù)據(jù)的深入挖掘和分析可以對(duì)醫(yī)學(xué)科研產(chǎn)生重大影響。
3.3 一體化和集成化。以后醫(yī)院信息化的建設(shè)重點(diǎn)逐 4 結(jié)束語(yǔ)
漸轉(zhuǎn)移到電子病例的建立和普及上,而構(gòu)建電子病例系統(tǒng) 以上是我們從事醫(yī)院信息化工作中獲得的一些經(jīng)驗(yàn)及
的前提是實(shí)現(xiàn)RIS、PACS及HIS等系統(tǒng)的無(wú)縫連接和信息 設(shè)想,我們一直關(guān)注我國(guó)醫(yī)院信息化的進(jìn)程和發(fā)展,并研
共享,同時(shí)實(shí)現(xiàn)一體化的訪問(wèn)和控制,IT基礎(chǔ)架構(gòu)的整合 究和分析了國(guó)內(nèi)醫(yī)院信息化的現(xiàn)狀,希望我們的文章能拋
是關(guān)鍵,同時(shí)也是實(shí)現(xiàn)數(shù)據(jù)管理和利用的基礎(chǔ)??梢圆捎?/span> 磚引玉,啟發(fā)人們進(jìn)一步做好醫(yī)院的信息化工作。