專家談大數據:先規劃設計后存儲應用是未來趨勢
時間:2013-11-17 18:41來源:中國規劃網 作者:IT頻道 吳濤
|
|
|
|
|

清華同方數據資源工程事業部副總經理 郭子龍
中國規劃網北京11月1日電(IT頻道 吳濤)不管你接受不接受,大數據時代還是來臨了。清華同方數據資源工程事業部副總經理郭子龍接受采訪時稱,大數據蘊含價值已經毋庸置疑,但在急于獲取其價值時,往往對整體規劃認識不到位,導致數據越大,麻煩越大,這種現象尤其表現在企業級應用方面。原來先堆砌后整理的方法已不可取,如何把海量數據有條理的存儲起來是目前企業首先需要考慮的問題。
郭子龍認為,有的數據組織、裝載的比較好,很容易去找到,但是有的只是單純把數據堆砌、集中到一起,每次用的時候,都需要重新的尋找,這無形中增加了運維成本和服務器壓力。
郭子龍說,從存儲方面來說,存儲空間不用考慮,現在這一塊都很廉價,不會有太大的壓力,主要是存儲方法。
談及存儲方法,郭子龍說,重要的一點是要根據組織的核心需求及其分解建立起標準框架——大數據容器。數據海量,先規劃出組織應該具備什么數據,在此基礎上分析已有什么數據,欠缺什么數據。
“我們需要把流轉過程中的每一份數據描述清楚,可以從多個角度去描述,有技術角度,有業務角度,還有數據自身角度,這就是我們談到的用元數據去描述我們的數據,將每一筆數據都變成可讀。”郭子龍說。
建立起框架后,還需要數據集成。郭子龍認為,數據集成更優于系統集成或業務集成,因為數據它是在一個根本層面,更為符合第一性原理,重事實、輕假設;數據集成還有一些好處,就是把數據集成后,可以存儲到數據庫中,可以被無限次的重復利用。
郭子龍說:“在大數據環境中,數據之間的輕度相關性要遠遠多于直接因果關系,將這些輕度相關性累加起來就變得舉足輕重,這是大數據應用的一個根本特征。”
“同方數據資源體系是以指標體系為標準,在注重自上而下逐級關聯的同時,還強調平行數據之間的關聯。”郭子龍說。
郭子龍說:“同方數據資源體系做的不僅僅是數據整合、數據分析,它的最大價值是:告訴用戶該有什么東西,然后提供方案規劃布局,而不是說怎樣把你現有的數據組織起來。”郭子龍認為,先規劃后存儲是未來大數據發展的一個趨勢。
人們在應用大數據,享受大數據帶來的便捷同時,安全風險也伴隨其中。當問到數據安全問題時,郭子龍說:“我認為在大數據環境下,數據安全是一個相對的概念,過于注重數據安全,數據的價值就難以體現出來,我們不能因噎廢食。”
郭子龍提出優化方案,他說可以對大數據做簡項處理,數據分權限,把用戶姓名、聯系方式等涉及隱私問題設立高權限屏蔽掉,其余數據仍可以公開供行業分析、利用。
同方數據資源體系的五大特征
1、將數據從業務中分離出來,使其獨立存在自成體系
2、基于遠景藍圖規劃,同時兼顧現實情況
3、強調數據相關性,非簡單因果關系
4、明確目標導向,優先解決主要矛盾和確定性問題
5、從宏觀數據、關鍵指標數據、異常波動數據入手洞悉數據
(責任編輯:瑋鋒)
|
------分隔線----------------------------