我們每天建立 2.5 百萬兆位元組的資料 — 數量之多,光是過去兩年所建立的資料就佔當今世界總量的 90%。 這些資料來源廣泛, 像是用於搜集氣候資訊的感應器、社交媒體網站的貼文、數位圖片與影像、採購交易記錄以及行動電話 GPS 訊號等,不一而足, 這類的資料就是 海量資料。 海量資料含括三種層面: 巨量、即時性及多樣性。 巨量 – 海量資料的特色就在於: 龐大。 企業資料包羅萬端,很容易便達到數兆位元組,甚至千兆位元組之譜。 即時性 – 海量資料通常具有時效性,一旦串流至企業便須立即使用,方能發揮其最大價值。 多樣性 – 海量資料的範疇不僅止於結構化資料,還包含各類非結構化的資料: 諸如文字、音訊、視訊、點擊串流 (click stream)、日誌檔等等。 挑戰還是機會? 海量資料不只是一項挑戰, 更是絕佳的機會,讓您能夠洞悉新興的資料類型、使企業運作更加靈敏並為過往所無法企及的問題提供解答。 但在此之前,這種機會並無實際方法可以掌握。