BI(商業智能)真的智能嗎?
來自專欄 Business Code Design6 人贊了文章
這篇我會從數據約束 數據結構 數據操作三個層面來說說這個話題,BI(商業智能)智能嗎?在此之前牆裂推薦大家看下我專欄的這篇文章,相信我,看完你會秒懂上面那三個名詞的(手動斜眼笑)
XING.XIAOYU:來,上車,告訴你什麼叫數據模型或者再換個比喻來說,如果把數據當作是貨幣,
- 數據約束就是統一貨幣,統一度量衡,集中化 規範化管理,管轄區域內都用一個同一種貨幣,不隨意增發貨幣;
- 數據結構就是貨幣轉換,我拿著人民幣可以換成美元,也可以換英鎊、歐元......
- 數據操作就是交易買賣,在不同的地方使用不同的貨幣去買東西,而不是指著用一種貨幣就能跑遍全世界...
那麼,回到數據上來說,現實的工作中,想必能做好這三點的公司一定都是體量很大公司了,而且通常只有技術部門和業務一線部門做得到,財務部和其他偏智能類型的部門就做的很差了。
為什麼呢?還接著上面的比喻往下深入,為什麼全球沒有統一貨幣或者語言呢,是因為政治原因?還是文化原因?還是因為別的?但不管怎麼樣,至少有布雷頓森林體系的存在,有一個國際貨幣美元的存在,也有換匯這種橋樑性質的「工具」的存在,只有這樣「全球化」才能講得通,否則都是無稽之談。
再回到數據上來說,有哪幾家公司把公司內部所有部門的數據口徑都給統一了?把業務和財務之間的數據口徑轉換的橋樑搭好了?我了解到的,很多公司的產品線名稱,組織架構名稱,業務類型名稱,指標名稱......全都不統一,先不說複雜的計算分析,即使是簡單的聚類,兩個肉眼看似一樣的名稱之間其中有一個多了一個空格,計算機都是無法聚類到一起的,更別提其他明顯的不一致了,對於計算機來說,北京、北京市、BJ,Beijing 這是四個不同的地方,是不是有點苛刻了啊?沒關係,底層數據沒約束,那就建立一個匹配表來把 北京、北京市、BJ,Beijing 都自動聚類到北京也可以,要想底層數據容錯率越高,那就建更多的匹配表就好。怕的就是底層數據沒有約束,還沒有橋樑性質的匹配表,每次都需要手動靠人眼把 北京、北京市、BJ,Beijing 這樣的臟數據歸類成一個,簡單的數據還好,數據量稍微大點、程度稍微複雜點,那錯誤率馬上就會上升,而且很不容易檢查。
也正是因為沒有數據約束,沒有跨組協作的數據口徑轉化橋樑,所以才會催生一個新的技術工種叫「數據清洗」,所以每次跨組跨部門溝通成本都很高,整合多個部門之間的信息給領導看的時候,都需要花80%以上的時間去清洗數據,去把數據的口徑統一起來,業務越複雜,這種情況就越明顯。
那為什麼是這樣,為什麼部門與部門之間,組與組之間的數據口徑如此混亂呢?因為大多數人用不著頻繁的跨部門協作,數據亂加個班兒整整也就過去了,反正又不是老闆,也不用整合全公司所有的信息去做分析決策啥的,可是職位越往上升,這個問題一定是越明顯的,有時候一層一層的信息口徑不一致傳到老闆那兒可能就已經完全扭曲掉了,當然這個解釋可能還是高估了現狀。更真實的原因恐怕是:財務金融等非技術專業的童鞋都普遍缺乏數據意識,壓根意識不到這個問題,只是日復一日的機械的 不假思索的工作著,加班著,以為自己幹了很多活兒,以為領導會覺得自己辛苦並自我感動著,其實.....(人艱不拆)
正如,沒有統一的當地貨幣,沒有統一的國際貨幣,沒有貨幣轉換就談不上「全球化」,沒有數據約束,沒有數據結構,也根本談不上「智能化」。
其實這篇文章寫到這裡已經可以結束了,主旨大概都表達清楚了,接下來會說點細節的內容,畢竟上面只說了不好,沒有說怎麼不好,也沒有說怎麼辦......
1. 數據約束
其實這裡我最想吐槽的就是三張財務報表的格式,因為太多人分不清楚 數據源和數據報表 這兩個詞背後的含義了,就照著三張財務報表的格式去做表,結果弄巧成拙,簡單概括下:
數據源是原料,是半成品,這玩意兒你還要給別人繼續加工呢,所以數據源的格式必須得方便 Excel 或 其他軟體再加工,數據報表是成品,可以自己各種定製成方便人看的樣子,好比說合併下單元格,多行表頭,多列信息規整在一列,但是如果數據源長成數據報表的樣子,那絕對是一場無與倫比的大災難。
簡而言之,數據源的格式規範要方便軟體處理,數據報表的格式要方便人看。
可事實是什麼呢,80% 的人做出來的東西其實都不是最終的數據報表,都只是信息加工鏈條上的一個環節,但是大家都因為不懂,通通把數據源弄成了數據報表的格式,同時還自我感動著,覺得自己真是細心,弄出來的表這麼好一定方便了別人,其實:並沒有!!!並沒有!!!並沒有!!!重要的事情說三遍 !!!
熟悉吧,這就是我們最常用的財務報表,對,看清楚,這是數據報表,而不是數據源,所以有合併單元格的情況,也有多行表頭的情況,也有多個維度的信息擠在一列的情況,但是你自己想一下,你平時工作中的大部分工作表是不是都有這樣的情況?是不是很多需要下一個人處理的數據源也有這種情況?
即使沒有,即使你就是信息鏈條上的最後一環,不會有人再加工了,你的數據源格式跟數據報表格式就長得一樣,就是都有合併單元格啥的,行,那我問你,你弄這個報表是不是一次性的,還是說經常得弄啊?我的理解應該是日常的工作都會需要到的吧,那就還是得把做報表的數據源給規範起來吧?要不然每次都是靠公式和鏈接處理,下回領導要求變換報表格式,或者新增別的需求,刪減現有的東西的時候,修公式和鏈接一定痛不欲生吧?
那規範成啥樣呢?——可以透視的樣子
如圖,左邊的錯誤示範圖 一列里包含了(一級科目,二級科目,產品)三個維度的信息,並且包含了匯總行,展示成這樣當然沒問題,但如果數據源是這樣那就是災難,數據源的正確的格式應該是右圖,因為如果有一百張一千張圖左那樣的表,要匯總起來非常麻煩,涉及的公式多,而且需要跨表引用,出錯率高,並且萬一破壞了現有的結構很可能導致匯總結果的錯誤,並且萬一哪天領導要求把產品提到一級維度去看,或者行列信息轉換,或者刪除行列新增行列,要調整的公式量和工作量都是非常巨大的,這樣的表幾乎就是一張廢表了,因為後續的多維度層級調整、行列轉換、新增刪減行列都會特別痛苦,耗時長,出錯率還很高。而右圖因為可以透視,也可以合併起來透視所以完全不存在這種問題,任由領導怎麼要求展示格式,我底層數據格式是規範的,都很 Easy。
別跟我說是領導把報告的格式都固定好了,格式永遠都不會變,只用公式索引就可以,看到這篇文章的領導們,你們是真的不想各種維度交叉組合著看數據嗎?還是「心疼」你的員工,怕他累,不忍心太讓對方操勞啊?
作為一個財務狗整天淹沒在「表海」里早已成為這份工作的常態,很多時候,同事發給你一個 Excel,然後 這個 Excel 裡面放了200多張 Sheet,然後每張 Sheet 里還放著不止一張表,有的有表頭,有的沒表頭,有的有合併單元格,還有的表像俄羅斯套娃一樣互相影響(A表取自B表,B表取自C表,C表取自D表,D表取自E表,E表取自FGH...表然後每個鏈條上還有很多為了湊數兒而進行的手動加加減減)然後,每個表的最左邊那一列裡面還包含了太多的維度,摺疊好幾層,牽一髮而動全身......作為一個懂技術和數據的財務,每每看到這樣的表的時候真的都只想速死,真的是,心累,不說了,求求各位看到的體會一下:「少即是多」 這四個字。畢竟在學校的時候,你也討厭老師考試前劃重點劃滿全書不是么?
2. 數據結構——沒有錯誤的數據,只有口徑不一致的數據
其實數據本身沒什麼,數據與數據直接的聯繫和勾稽關係才重要,就好比單個的人跟人也沒什麼,重要的是這一堆人怎麼合作起來干成個事兒,怎麼把這一性格各異的人聯繫起來形成個團隊形成個整體,其實數據分析 財務分析都是這樣,沒有 聯接人和匹配表 就沒辦法把兩個部門的數據整合起來,就沒辦法合力發揮大數據的作用。業務系統口徑、預算口徑、風控口徑、對內口徑、對外口徑......部門內部各組,或部門與部門之間的數據口徑不一致?都可以的,沒有明確的口徑匹配表就不行。
未經聯繫,一個人即使有再多的經歷也不會發展。
未經聯繫,一個企業即使有再多的海量信息也發揮不出其真正的巨大價值。
就像是,沒有和聲去把音符和諧的連接起來,再多的樂器放在一起 漫無章法的彈奏 也不會悅耳,而是刺耳......
3. 數據操作——只要有清晰邏輯的東西,都可以實現
其實沒有數據約束和數據結構已經足夠導致跨組跨部門溝通成本高,效率低下了,但是在工作中慢慢發現其實很多人都不願意梳理清晰的業務邏輯和計算分析邏輯,很多前人的經驗 業務邏輯 沒有被落在紙面上,「代代相傳」 全靠口頭交流,"一代"比"一代"的吸收率低,最終導致貌似誰都不理解,都是雲里霧裡的感覺,從而,進一步加深了業務、財務、技術 三方人員互不理解與巨大溝通成本。
什麼?交給機器去做?系統化?系統化的第一步就是有清晰的書面的邏輯。否則,自己都想不明白的,捋不清邏輯的事兒,憑什麼交給機器去想明白? 之前文章里也說過,機器是舉三反一的,別指望機器像人類一樣可以舉一反三。
說了這麼多,其實之前的 →這篇文章← 中已經說到過,不僅僅是財務領域是這樣,其他領域也都類似,只要前期數據準備的規範化了,數據記錄,流轉和簡單的分析機器都完全辦得到的,但是如果不規範,本來就輸入了一堆垃圾信息,就別指望機器能有啥作為了。
開發是如此,前期需求整理和可行性分析階段做的足夠充分,真正開發起來其實是很輕鬆愉快高效的;
審計也是如此,只要內控系統足夠完善,流程足夠規範,實質性程序的工作量也可以減少;
財務分析也一樣,只要花點時間在前期的數據源格式規範上,後期出各種花式報告的時間就短,並且也會很靈活很主動。
可現狀是,開發加班加成狗,審計加班加成狗,分析人員累成狗。很明顯,我們的大多數精力的確可能是後置了,沒有前置到需求整理、邏輯梳理、數據規範、流程規範這些看似簡單的事情上,其實這些是真正重要的東西。
我也知道領導們更多的時間花在了數據解讀、商務洽談、與決策判斷這些更重要的事情上,但底層數據操作的問題無疑會影響上層判斷的準確性與時效性。
不多說了,總之現階段的"人工智慧"和"商業智能"確實都不那麼"智能",都受限於底層的數據質量,就像是廚師能燒出來多好的菜也會受限於食材質量一樣。
最後,真心希望這篇文章可以被更多的人看到,尤其是財務金融等非技術專業的童鞋看到,也希望可以吸引更多的小夥伴加入進來,一起來推動 不那麼智能的「商業智能」變得稍微智能一點,哪怕只有一點....
最後,硬廣下專欄其他相關文章:
AI(人工智慧)真的智能嗎?
BI(商業智能)真的智能嗎?前言 - 關於我的這兩年
財務狗的短期未來?大數據、人工智慧篇
推薦閱讀:
※現金流量表竟然能分析的這麼全面!
※註冊公司 財務代理 工商財務類服務
※中級財務管理視頻教程全集
※資產負債表日後事項之一