大資料的結構
大資料包括結構化、半結構化和非結構化資料,非結構化資料越來越成為資料的主要部分。據IDC的調查報告顯示:企業中80%的資料都是非結構化資料,這些資料每年都按指數增長60%。大資料就是網際網路發展到現今階段的一種表象或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲計算為代表的技術創新大幕的襯托下,這些原本看起來很難收集和使用的資料開始容易被利用起來了,透過各行各業的不斷創新,大資料會逐步為人類創造更多的價值。
特徵
容量(Volume):資料的大小決定所考慮的資料的`價值和潛在的資訊;
種類(Variety):資料型別的多樣性;
速度(Velocity):指獲得資料的速度;
可變性(Variability):妨礙了處理和有效地管理資料的過程。
真實性(Veracity):資料的質量
複雜性(Complexity):資料量巨大,來源多渠道
價值(value):合理運用大資料,以低成本創造高價值