伴隨互聯(lián)網(wǎng)技術(shù)的風(fēng)生水起,龐大而復(fù)雜的網(wǎng)絡(luò)技術(shù)將地球濃縮為一個(gè)小小的村落,�,;ヂ�(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,不同角色間所輸入與輸出的海量信息衍生出來(lái)的巨大數(shù)據(jù)量再一次顛覆云時(shí)代,,堂而皇之的迎來(lái)了信息量暴增的嶄新時(shí)代——大數(shù)據(jù)時(shí)代,。
“大數(shù)據(jù)”則變成了時(shí)下最火熱詞匯之一。從擁有數(shù)據(jù)到預(yù)判需求,,這就是大數(shù)據(jù)的“威力”,,近幾年各軟件巨頭公司紛紛涉足該領(lǐng)域,8月16日,在北京京儀酒店舉辦的“風(fēng)起潮涌,、撥云見(jiàn)數(shù)——東方飛揚(yáng)開(kāi)啟大數(shù)據(jù)之門(mén)發(fā)布會(huì)”更是將檔案大數(shù)據(jù)推向了新的高潮,。一場(chǎng)以“大數(shù)據(jù)”為核心驅(qū)動(dòng)的檔案信息革命,風(fēng)生水起,,席卷而來(lái),。
大數(shù)據(jù)時(shí)代的來(lái)臨成就檔案領(lǐng)域發(fā)展契機(jī)
據(jù)IDC預(yù)測(cè),未來(lái)10年全球數(shù)據(jù)量將以超過(guò)40%的速度增長(zhǎng),,2020年全球數(shù)據(jù)量將達(dá)到35ZB,,為2009年(0.8ZB)的44倍,且其中80%以上為非結(jié)構(gòu)化數(shù)據(jù)(如圖片,、音頻,、視頻等)。這組數(shù)據(jù),,充分說(shuō)明了世界已經(jīng)步入了大數(shù)據(jù)時(shí)代,。那么,這些數(shù)據(jù)到底是從何來(lái)呢,?總的說(shuō)來(lái),,正是傳統(tǒng)互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng),、物聯(lián)網(wǎng),、云計(jì)算的快速發(fā)展推動(dòng)了數(shù)據(jù)的爆發(fā)式增長(zhǎng)。
究竟何為“大數(shù)據(jù)”,?所謂大數(shù)據(jù),,簡(jiǎn)而言之就是巨量資料、海量資料,,指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,,在合理時(shí)間內(nèi)達(dá)到擷取、管理,、處理,、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。由數(shù)量巨大,、結(jié)構(gòu)復(fù)雜,、類型眾多數(shù)據(jù)構(gòu)成的大數(shù)據(jù),是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,,通過(guò)數(shù)據(jù)的整合共享,、交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。同時(shí)炙手可熱的大數(shù)據(jù)還具備了4V特點(diǎn):Volume(數(shù)據(jù)體量巨大),、Velocity(數(shù)據(jù)類型多),、Variety(速度要求高),、Veracity(價(jià)值大、密度低),。
那么何為“大數(shù)據(jù)時(shí)代”,?通過(guò)對(duì)大數(shù)據(jù)概念的了解,能夠更加深切的體悟到:所謂的大數(shù)據(jù)時(shí)代,,是一個(gè)數(shù)據(jù)更加全面的時(shí)代,,通過(guò)對(duì)于大數(shù)據(jù)應(yīng)用技術(shù)的掌握,便可輕而易舉的攻克更多之前由于數(shù)據(jù)缺乏而無(wú)法涉足的領(lǐng)域,,比如檔案領(lǐng)域。
眾所周知,,檔案信息化在過(guò)去的二十年中見(jiàn)證了三次模式的變遷,,從最初的主機(jī)計(jì)算時(shí)代,到后來(lái)的局域網(wǎng)應(yīng)用時(shí)代,,再到如今的互聯(lián)互通時(shí)代,,數(shù)字檔案管理的演變。具體呈現(xiàn)了以下幾個(gè)主要特點(diǎn):一是產(chǎn)生了數(shù)量巨大的,、異構(gòu)的文檔信息,;二是人們的信息需求呈現(xiàn)出多樣化、高效化,、個(gè)性化,、專深化等特點(diǎn);三是原有的傳統(tǒng)檔案信息服務(wù)系統(tǒng),,僅依靠數(shù)據(jù)庫(kù)的查詢檢索機(jī)制和統(tǒng)計(jì)學(xué)方法已經(jīng)不能滿足現(xiàn)實(shí)的需要,。這些是檔案領(lǐng)域發(fā)展大數(shù)據(jù)應(yīng)用的重要基礎(chǔ)。同時(shí),,也覺(jué)察到在檔案領(lǐng)域發(fā)展大數(shù)據(jù)的契機(jī)——政策支持,、現(xiàn)實(shí)需要、技術(shù)支撐,。
伴隨國(guó)家信息化建設(shè)的不斷深入,,由云計(jì)算、云存儲(chǔ)等新型的IT服務(wù)模式所直接催生的數(shù)字信息正在爆炸式增長(zhǎng),,面對(duì)數(shù)量巨大,、異構(gòu)的文檔信息,同時(shí)還要與時(shí)俱進(jìn)的滿足現(xiàn)代人類對(duì)于信息多樣化,、高效化,、個(gè)性化、專深化的需求,,傳統(tǒng)的檔案信息服務(wù)顯然已經(jīng)不能滿足時(shí)代的需求,,檔案管理工作將面臨更大的挑戰(zhàn)。
大數(shù)據(jù)時(shí)代下,要如何抓住契機(jī)實(shí)現(xiàn)檔案管理及內(nèi)容的價(jià)值全面提升,?
在“風(fēng)起潮涌,、撥云見(jiàn)數(shù)——東方飛揚(yáng)開(kāi)啟大數(shù)據(jù)之門(mén)發(fā)布會(huì)”上,東方飛揚(yáng)指出檔案管理正在步入大數(shù)據(jù)時(shí)代,,如何從海量數(shù)據(jù)中發(fā)掘出有價(jià)值的信息,,滿足不同檔案客戶的信息需求,將檔案資源轉(zhuǎn)化為知識(shí)資源,,尤其是覆蓋人民群眾的知識(shí)資源,,這已成為檔案人的使命,基于大數(shù)據(jù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)將會(huì)起到巨大的推動(dòng)作用,。
基于大數(shù)據(jù)來(lái)臨的契機(jī)和趨勢(shì),,東方飛揚(yáng)順勢(shì)而行,及時(shí)推出“ES-Bigdata飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”,。該大數(shù)據(jù)平臺(tái)即可依托“政務(wù)網(wǎng)”,、“行業(yè)專網(wǎng)”,構(gòu)建海量存儲(chǔ),、分布計(jì)算,、集中管理、自動(dòng)調(diào)度的大型數(shù)據(jù)智能平臺(tái),,服務(wù)于各級(jí)政府,、國(guó)家部委、綜合性檔案館,、中央企業(yè)等總部級(jí)單位,;又能依托“公網(wǎng)”,構(gòu)建多樣性,、可定制,、可擴(kuò)展、經(jīng)濟(jì)性配置的基于公有云的數(shù)據(jù)智能平臺(tái),,服務(wù)于中小微企業(yè)檔案管理工作,;還可依托“公網(wǎng)”,構(gòu)建靈活,、方便,、大容量的個(gè)人數(shù)據(jù)智能平臺(tái),服務(wù)于個(gè)人,、家庭,。
其核心內(nèi)容主要有兩個(gè)方面:一是依托ES-iCloud數(shù)字檔案云,基于結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)字信息,,構(gòu)建集數(shù)據(jù)獲取,、組織,、分析及決策支持于一體的大數(shù)據(jù)平臺(tái)解決方案。二是通過(guò)飛揚(yáng)大數(shù)據(jù)平臺(tái),,支持各級(jí)各類檔案館決策管理,,優(yōu)化資源調(diào)度,拓展檔案館的信息服務(wù)方式,,提高服務(wù)質(zhì)量,,實(shí)現(xiàn)檔案管理及內(nèi)容的價(jià)值全面提升。
如何真正做到以上兩個(gè)核心內(nèi)容,?據(jù)東方飛揚(yáng)介紹可以從下三方面助力檔案管理及內(nèi)容的價(jià)值全面提升,。一是支持各級(jí)各類檔案館的決策管理;二是優(yōu)化各級(jí)各類檔案館的檔案信息資源,;三是拓展檔案館的信息服務(wù)方式,,提高服務(wù)質(zhì)量。
據(jù)透露,,“ES-BigData飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”還具有高可用機(jī)制、安全機(jī)制,、終端應(yīng)用,、數(shù)據(jù)采集、云前端,、私有云/公有云等特點(diǎn),。東方飛揚(yáng)還表示,對(duì)于“ES-BigData飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”的技術(shù)愿景是構(gòu)建基于檔案內(nèi)容的數(shù)據(jù)倉(cāng)庫(kù),;實(shí)現(xiàn)標(biāo)準(zhǔn)化,、開(kāi)放化的技術(shù)架構(gòu);支持應(yīng)用快速,、靈活部署,;實(shí)現(xiàn)系統(tǒng)高效、低成本運(yùn)營(yíng),。
結(jié)合大數(shù)據(jù)時(shí)代的特點(diǎn)借力發(fā)展檔案領(lǐng)域
除了“ES-BigData飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”的推出,,在會(huì)議中還介紹了東方飛揚(yáng)典型大數(shù)據(jù)平臺(tái)技術(shù)方案。方案中指出面臨大數(shù)據(jù)時(shí)代的海量數(shù)據(jù),,從中獲取,、利用、收錄正確有用的信息需要四個(gè)步驟:獲取,、組織,、分析和決策。
首先獲取信息方面可面向企業(yè)應(yīng)用,,如:數(shù)字檔案館系統(tǒng),,采用HDFS,、NOSQL快速捕獲和存儲(chǔ)結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)信息,。獲取到信息后,,采用Hadoop的MapReduce技術(shù),在原始數(shù)據(jù)存儲(chǔ)集群中組織和處理大量數(shù)據(jù),,將最終的聚合結(jié)果,,通過(guò)數(shù)據(jù)轉(zhuǎn)換器,加載到關(guān)系DBMS系統(tǒng)中,。最后,,根據(jù)數(shù)據(jù)分析模型,自動(dòng)進(jìn)行數(shù)據(jù)關(guān)聯(lián),、多維度分析,,發(fā)現(xiàn)規(guī)律,自動(dòng)作出決策,。
由此可見(jiàn),,檔案領(lǐng)域的信息繁榮、價(jià)值提升必將由大數(shù)據(jù)來(lái)推動(dòng),。據(jù)了解,,在大數(shù)據(jù)啟迪下,東方飛揚(yáng)結(jié)合“ES-Bigdata飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”的特點(diǎn)自主研發(fā)了ES-OAIS
4.0產(chǎn)品,。該產(chǎn)品具有以“穩(wěn)定性”為基礎(chǔ),,以“易實(shí)施、易使用”為指導(dǎo)思想,,同時(shí)兼顧“高性能”等特點(diǎn),。目前,該產(chǎn)品已正式發(fā)布,。
通過(guò)東方飛揚(yáng)對(duì)于大數(shù)據(jù)優(yōu)勢(shì)的深入解讀,,我們能夠更加明白大數(shù)據(jù)對(duì)于現(xiàn)代社會(huì)進(jìn)步的意義。無(wú)論如何,,大數(shù)據(jù)時(shí)代已然是信息社會(huì)發(fā)展的必然結(jié)果,,反過(guò)來(lái),這一人類文明也必將加快推動(dòng)社會(huì)的發(fā)展,。讓我們拭目以待吧,,大數(shù)據(jù)時(shí)代在未來(lái)社會(huì)進(jìn)步中的大手筆。同時(shí),,我們也更加期待東方飛揚(yáng)這支行業(yè)內(nèi)的旗艦,,讓大數(shù)據(jù)在檔案管理事業(yè)中大放異彩。