大數據計劃驅動因素是種類而不是數量
對各大行業調查報告顯示結果表明,當被問及關於大數據成功的驅動因素時,69%的企業高管稱數據品種是最重要的因素,其次是數量(25%),速度(6%)落後。在企業界,整合更多資源可以找到巨大的數據,而不是更大的數額。可見處理和管理大數據量並不是決定大數據投資驅動的關鍵因素。相反,它是整合更多數據源的能力,例如新數據、舊數據、大數據、小數據、結構化數據、非結構化數據、社交媒體數據、行為數據和遺留數據等多樣化數據類型。
大數據的實踐是整合多樣化數據源
對於大型企業來說,當許多高管想到大數據時,通常會想到大量的數據,這導致了一個普遍存在的觀點,在數據和分析方面,數據量越大越好,而往往忽略了數據結構的多樣化。這就促成了大數據的神話,大數據等同於大量的數據。一個企業大數據應該是是彙集了各種數據所有的信息來源:
· 客戶群體信息來源
· 客戶地域信息來源
· 客戶年齡信息來源
· 競爭對手信息來源
· 客戶性別信息來源
我們以電商購物平台為例,客戶在線購買一件商品,我們可以追蹤到客戶的在線的任何數據。並且可以生成大量的結構化和非結構化數據。 例如人口統計:年齡,性別,地理區域,收入。心理數據:偏好,價值觀,推動購買的動機等多種類型的數據源。
對這些多樣化的數據源進行分析和匯總我們可以得出一些結論,對於用戶來說我們可以完善用戶的購物體驗,吸引更多潛在客戶。對於企業來說可以分析市場競爭情況,優化產品類別,了解競爭對手動態,提升企業在市場上的競爭力。
多樣化的數據幫助各行業實現精準數據分析
我們用探碼科技智能選址平台為例,如果是創業開店,要實現精準選址分析模型,那麼數據所覆蓋的範圍主要包括住宅數據、商圈數據、客流數據以及商業體數據等多樣化的數據體系,這樣才能夠實現智能選址,快速準確的分析出什麼類型的店開店在什麼地方可以挖掘最大的用戶群體。
智能選址應用於各大行業所體系的數據結果也不同:
· 信息發布類:房產中介、廣告服務商、業主,創業服務類公司
· 戶外廣告:廣告牌出租、購買分析
· 實體開店:餐飲、服裝、美容、建材、酒店等
· 超市便利:店鋪選址、銷售、競品分析、經營分析
· 教育:創業指導、學生網路行為分析
· 商業地產:商鋪招租、招商指引、主題規劃、廣告投放
多樣化的數據源增強各行業人工智慧化的大數據行為分析能力
從企業的角度出發,企業通過多樣化的數據源將數據管理工作集中在開發更強大的數據和分析上。
捕獲舊數據源
以電商平台為例,利用大數據技術捕獲企業傳統的遺留數據源,包含客戶信息、客戶購買產品、客戶地域分布、年齡段等等數據,採集分析挖掘現有數據源,然後再在轉向新的數據源,並把傳統的數據源和現有數據源相結合最終融合成為企業新的數據源,增強電商購物在行業當中的競爭力,贏取更高的市場份額。
集成非結構化數據
從企業角度出發我們把結構化數據被假定為時間序列的形式,該時間序列對特定時期內的企業績效的某些方面進行編碼,如每月或每周的銷售數據或股票價格等。非結構化數據可以從消息源,消費者的內部儲存庫反饋,博客和討論論壇,也可以從微博,微信等社交媒體獲得。
越來越多的公司(29%)現在專註於整合這些非結構化數據,用於從客戶情緒分析到監管文件分析到保險索賠裁決。整合非結構化數據的能力正在擴大傳統分析,將定量指標與定性內容相結合。其目的是生成新的數據形式,可用於未來推導預測模型或執行因果分析,或幫助企業進行風險評估。
添加社交媒體和行為數據源
雖然大數據早期的大部分興趣來自於eBay和Facebook等公司捕捉社交媒體和行為活動,但這些應用程序在「財富」1,000強中相對較早,僅有14%的人將此列為優先事項。隨著公司在大數據方面的努力取得進展,他們很可能會將注意力轉向關注社交數據在諸如患者堅持和基於消費者購買行為和偏好的移動設備建議等領域提供的未開發機會。及時的建議可以立即產生結果。
要符合納入社交媒體分析類別的資格,產品必須有多樣化的數據源組合:
· 創建可用數據指標衡量的業務目標
· 提供跟蹤和共享數據
· 評估受眾規模,參與度和受眾特徵
· 提供情緒分析
· 綜合社交媒體統計
· 比較來自單個廣告系列,帖子或網頁的數據
無論是從電商平台在線購物體驗、還是到智能選址、再到企業數據的抓取、及社交媒體行業行為分析等,從這當不難看出企業執行大數據策略並不是通過數量,而是多樣化的數據源的一個集合體。
正如探碼科技自主研發的DYSON智能分析系統,是在歷經8年的技術沉澱,遵循大數據的技術生命周期,把機器學習系統充分融入到大數據體系中去,實現用戶多樣化的數據信息抓取及分析,讓大小數據可視化,並且可以實時導出數據分析報告,讓企業的數據與業務可實時追蹤。
如何用智能分析系統抓取我們需要的數據可以參考:
Dyson大數據系統 | 探碼科技【官網】推薦閱讀:
※給妹子講python-S02E11Series數據選取方法
※如何做好競品分析?
※SAS編程:第五章 通過DATA步讀取SAS數據集
※雨沐田:Excel數據分析-移動平均法預測分析