模型推薦:「追加數據」—讓增加數據操作更簡單

用戶在使用極海平台的時候可能會遇到這樣的情況:

數據我已經上傳到平台上了,但是這份數據更新的頻率很高,一旦有了新增數據,就要及時補充進來,需要更新的內容也要及時修改。

想要解決這個問題,按照常規的方法,只能重新做一份數據。線下把新增數據和原有的數據合併起來,替換需要更新的內容,然後上傳到平台上,將以前的數據刪掉,然後假裝數據是被更新了。恩……簡單粗暴,似乎沒什麼問題了。但是,如果在數據上圖、數據探索等應用中,已經使用過該數據的話,那事情就沒那麼簡單了。因為每份數據在平台上都是有唯一標記來加以區分的,並不是取個一模一樣的名字就代表它是同一份數據了。所以,你還需要在應用中把使用的數據替換成新的,然後把之前配圖的工作重新再做一遍。

有沒有優雅一點的方法呢?當然有。

模型計算」中的「追加數據模型」就可以解決這個問題。


接下來,舉個例子。使用模型計算中的追加數據模型,通過簡單幾步,實現更新平台上的數據。

-THE FIRST-

選擇一份房價數據作為示例數據,因為房價數據通常具備區域、價格等特徵,而且時效性強,往往需要持續更新。下圖是一份已經上傳到平台,並在「數據上圖」應用中使用的數據,包含海淀區內部分的學區房價格。現在要實現的目標是:將另一份數據中朝陽區的數據追加到該數據中,並且要更新海淀區房價數據的幾個錯誤值。

-THE SECOND-

將朝陽區的數據上傳到平台上,命名為「朝陽區數據」。使用模型計算中的追加數據模型,指定原始數據和追加數據內容。

由於我們的目標中包含更新海淀區房價數據的錯誤值,所以需要勾選「更新已存在的數據」選項,並且選擇匹配欄位。在這裡,指定name欄位為匹配欄位,這樣就可以自動匹配到原始數據與追加數據中name欄位相同的值,並替換為新的值。

-THE THIRD-

運行結束之後,刷新數據列表。可以看到,朝陽區的部分已經被添加到了海淀數據內,數據條數、更改時間等信息也隨之改變。

回到數據上圖中,刷新頁面後會發現數據內容已經包含了追加的數據,不再需要重複配圖。

通過以上例子可以看到,通過簡單地幾步,就可以實現數據的追加操作。在後續的更新中,我們將通過更多實用而有趣的例子來介紹模型計算的功能應用。

(模型計算使用地址)

文/suncl

對我們感興趣?GeoHey最近在招募對大數據感興趣的專業人才,實習和正職都想兼得,詳情請戳GeoHey-招賢納士~


推薦閱讀:

TAG:大数据 | 数据更新 | 数据模型 |