財務狗的短期未來?大數據、人工智慧篇

人工智慧?機器學習?深度學習?神經網路?大數據?商業智能?區塊鏈?財務機器人?......

這幾年這些概念似乎都說被爛了,可是講真,即便是 2018 年的現在,還是有種 「只見打雷不見下雨」 的感覺。這些前沿科技的出現真有說的那麼厲害?真能取代我這麼個活潑可愛的財務狗金融狗么?(手動賣個萌)去年的我確實有點草木皆兵了,生怕自己會落後一步,現在經過轉型和嘗試之後覺得,其實短時間內(三五年?)我們還有足夠的時間去準備,短時間內這些技術對財務金融領域的影響一定不會是顛覆性的,為什麼呢?因為大多數企業現在都還在漫長的準備階段,像竹子生長一樣,前 4 年總共也只不過長 3cm,但是從第 5 年開始,它就以每天 30cm 的速度瘋狂生長著,這樣只用 6 周就可以長到 15 米。但現在處於前 4 年,實際企業數字化轉型遠不止需要 4 年,所以表面上看起來,大家似乎都一樣,風平浪靜,掀不起啥大波瀾,可準備階段完成後,恐怕就挺殘酷了,我希望在這個時間點再記錄下我對這些概念的理解和自以為的未來可能性,留著以後崇拜自己或者笑話自己,哈哈。

提前預警:本文內容一點也不深,只是結合個人經驗的一些思考罷了,真の大神 輕噴,感謝~ 先丟一個目錄出來(前面會說太多的基礎概念,不想看的直接跳到 Part 3 吧)

Part 1:大數據

Part 2:人工智慧-機器學習-深度學習-神經網路

Part 3:大數據&人工智慧 在財務金融領域的應用(以財務機器人為例)

Part 4:區塊鏈


Part 1:大數據

大數據,怎麼個大法兒呢?不廢話,就是全量數據代替樣本數據,因為隨著科技的發展我們現在已經不再受限于海量數據難以存儲、全量數據難以運算的瓶頸,那全量 全在哪裡呢?大概可以用這 4個V (Volume、Variety、Value、Velocity) 來概括:

  • Volume-數據量大:就字面理解意思就行,畢竟現在農村也都通網了嘛,全世界的老鐵們都無時不刻在產生著各種交易數據、行為數據、內容數據......(稍微皮一下)
  • Variety-數據種類多:在過去,所有的類型的數據(傳統企業數據、機器和感測器數據、社交數據)大多都是以便於存儲的以文本形式為主,結構化為主,而隨著現在互聯網、移動互聯網的繁榮,流媒體也越來越豐富,數據結構可能既不規則也不完整,不方便用資料庫二維邏輯表來表現的非結構化數據就越來越多,例如所有格式的辦公文檔、各類報表、XML、HTML、網路日誌、音頻、視頻、圖片、地理位置信息等,而這些多類型的數據對數據的處理能力提出了更高要求。
  • Value-價值密度低:首先要清楚的概念是:[數據] 本身不代表 [知識],[大數據] 不代表 [大知識],數據到知識再到價值的轉化是需要層層挖掘的,而如何通過強大的機器演算法更迅速地完成數據的 價值提純 就成為了目前大數據背景下最亟待解決的難題。
  • Velocity-處理速度快:同樣字面理解就行,天下武功唯快不破,哪家企業能更快搞定上面的三個問題,哪家就更牛逼。

多插一句,下面內容較多出現 [非結構化數據] 和 [結構化數據] 這兩個名詞,為了方便大家理解,大家就把 [非結構化數據] 理解成 Word, [結構化數據] 理解成 Excel 吧,[非結構化數據] 轉 [結構化數據] 就是讓你從 Word 文檔中提取出關鍵信息形成 Excel 表格,方便資料庫存儲,這樣理解雖然不太準確,但是夠直觀,夠簡單粗暴。

好了,大致就說這麼點兒基礎概念吧,更專業的 Hadoop Spark Hive 啥的我也不說,我也不懂。如果還有想繼續深入了解的可以看下這篇文章,我上面的內容也提取自這兒:

大數據最核心的價值是什麼??

www.zhihu.com圖標

接下來先說下大數據和人工智慧的關係吧,這個很重要:如果說一個公司一個產品是一艘船,那數據就是船上所承載的貨物,這是最核心的東西,是一個企業賴以生存的最重要的資產,人工智慧機器學習的核心演算法就是這艘船的動力引擎。

作為 「貨物」,肯定是種類越多越好,數量越大越好,價值越高越好,最好流轉速度也快。貨物要流轉,就需要物流系統,智慧物流系統,要不然你網上買個東西怎麼可能隔天就送到你手裡,物流界的 「最後一公里」 難題,換到企業也同樣,數據傳遞的 「最後一公里」 也一直沒有得到規範化,系統化。

作為 「引擎」,蒸汽機一定也比不上內燃機,驅動數據的引擎也同樣,普通的 ERP 自然比不上人工智慧。

可理想很豐滿,現實......滿足大數據所需要的 4V 標準的企業並不多,尤其是數據結構化方面,我覺得大多數企業做的還遠遠不夠,企業內部太多太多的數據還處於 「髒亂差」 的狀態,人去處理提取出價值都特別費勁,就更別提讓機器自己學習了,人工智慧這個引擎工作的前提是貨物足夠多足夠整齊規範。貨物少而且亂,換再牛逼的引擎也只能搗搗糨糊,總之,任重而道遠。

Part 2:人工智慧-機器學習-深度學習-神經網路

同樣,先不廢話,先直接上一張圖,簡單來理解的話就是:

機器學習是實現人工智慧的方法之一,

深度學習是實現機器學習的方法之一,

大多數情況下深度學習指的就是多層神經網路。

我知道這麼說不準確,但行外人士大致這麼理解差不多也足夠了,準確的圖大概應該是這樣的,有興趣的可以自己去深入去了解~

人工智慧

先來說最宏大的人工智慧,就拿大家上網的時候不可避免要填的驗證碼來舉例子吧,嗯,你是不是覺得很簡單啊?可是這對於電腦來說簡直難爆了。

的確一些我們覺得困難的事情——微積分、金融市場策略、翻譯,對於電腦來說都太簡單了,

我們覺得容易的事情——視覺、動態、移動、直覺,對電腦來說太 TM 的難了。

好比說當你舉手拿一件東西的時候,你肩膀、手肘、手腕里的肌肉、肌腱和骨頭,瞬間就進行了一組複雜的物理運作,這一切還配合著你的眼睛的運作,使得你的手能都在三維空間中進行直線運作。對你來說這一切輕而易舉,因為在你腦中負責處理這些的 「軟體」 已經很完美了。可你要知道機器人可是近幾年才能做到直立行走 遇到障礙也不跌倒的,這個可是在我們人類從猿猴進化過來的那一刻就徹底學會了。同樣的,當你看到一個東西的時候,感覺到一個東西的時候,你的大腦都是秒處理的,這些對我們來說很簡單的事情,其實是很複雜的,因為它們已經在動物進化的過程中經歷了幾億年的優化了。

用計算機科學家 Donald Knuth 的說法,「人工智慧已經在幾乎所有需要思考的領域超過了人類,但是在那些人類和其它動物不需要思考就能完成的事情上,還差得很遠」。

總之,人類的大腦是我們所知宇宙中最複雜的東西,看看 Siri 這些 「人工智障」 就能感受到,不是機器不努力,是人腦太牛逼。

上述內容引自 @謝熊貓君 大神的文章,附上原文鏈接,寫的超級好,牆裂推薦大家有空詳細了解下。

謝熊貓君:為什麼最近有很多名人,比如比爾蓋茨,馬斯克、霍金等,讓人們警惕人工智慧??

zhuanlan.zhihu.com圖標

機器學習

大概說了下人工智慧是什麼,那人工智慧怎麼實現呢?——機器學習,顧名思義,就是讓機器像人一樣去學習,那怎麼學習呢?人可是很聰明的,你告訴一個小孩那是一隻站著的貓,小孩就可以認得躺著的貓,趴著的貓,跑著的貓......是的,人可以舉一反三,可機器不行,你得提前告訴機器各種狀態的貓,你下回問它的時候才能認得這隻動物是貓,機器是舉三反一,甚至舉三都不一定反的出來一,機器需要大量的有效數據去喂它,訓練它,所以才需要上面所說的大數據。

雖然機器學習是在阿爾法狗之後才大火了一把吧,但這東西其實早就滲透在我們的生活中了,語音識別,圖片識別,翻譯軟體,垃圾郵件簡訊過濾,淘寶京東買東西的興趣推薦,頭條新聞的推薦,這些全都是機器學習。

那麼這東西究竟本質是什麼呢,就是讓機器在沒有被 [完全編程] 的情況下,具備學習的能力,傳統的編程都是要窮盡每一種可能性的,例如出去買個蘋果啥的,然後跟售貨員砍價,所有的可能性你都要列出來寫到程序里,讓程序判斷每一步的 Yes or No 對應的不同的結果,附上一張圖和原文鏈接大家感受下:

大誤 · 你們編程的買蘋果好複雜哦?

daily.zhihu.com圖標

可是如果遇到極其複雜的東西,好比說人的興趣是不可能窮舉的,並且興趣這種東西可能天天變,所以就必須搭框架,告訴它一個基本的規則,後面就讓機器自己去學習,讓機器像人一樣去總結規律,先讓它自己去猜這是個什麼東西,自己去總結規律,提取出一些關鍵信息,好比說還是看到一隻貓,讓機器自己總結貓有什麼特徵,尖尖的耳朵?還是圓圓的頭?還是別的什麼特徵?還有沒有什麼例外情況?然後人再告訴他正確答案,像教小孩兒一樣去教機器自己學習,看得多了學得多了不就會了嘛?可是問題來了,怎麼才能讓計算機像人一樣去發現隱藏的特徵呢?那麼我們就先得知道人是怎麼看東西的,怎麼提取特徵的。

神經網路

層層深入說到這裡,我先坦白,上面只涉及到概念的內容,我作為外行人士還能看看別人的文章自己消化消化,轉述轉述裝裝逼,其實上面的機器學習還分 監督學習 和 非監督學習,我已經恬不知恥地略過去了,更加深入的機器學習的實現方法——深度學習(多層神經網路),就更是在講上面內容的具體技術實現了,沒有技術底子的我恐怕也真說不清 各位也看不懂了。什麼?不信看不懂?

怎麼樣?還要繼續看嘛?我還是丟上個鏈接給有興趣深入了解的童鞋吧,我是編不下去了。

神經網路淺講:從神經元到深度學習 - 計算機的潛意識 - 博客園?

www.cnblogs.com圖標

最後,其實這些概念這麼火都不是最近才有的,上世紀 60 年代那會兒就有了,只不過受制於當時計算機的處理性能很難設計出深層的神經網路結構,層級一多電腦就掛了,而且也沒有大數據支持,沒有那麼多樣本去支撐機器學習,所以都一直沒得到重視,資本看不到商業前景也不願意投錢進來,發展也一直磕磕碰碰,沒有見到足夠震撼的科學技術的進步。而現在我們大概有足夠的技術去慢慢挑戰人類所能想像的科技界最突破性的發明(AI)了,我還是蠻期待未來的,期待超人工智慧出現後的吸引態究竟會是滅亡還是永生,哈哈扯遠了,說回正題。

Part 3:大數據&人工智慧 在財務金融領域的應用(以財務機器人為例)

相繼去年德勤財務機器人刷爆朋友圈之後,前陣子我老東家天職也推出了自己的財務機器人,想必其他事務所也都有所行動,原諒我沒有感受到那麼大動靜就不提了,附上兩個鏈接

德勤財務機器人正式上崗,工作視頻首次曝光!效率相當驚人,財務人看完都慌了···?

mp.weixin.qq.com圖標【天職財務機器人上線】財務工作還可以這樣做……?

mp.weixin.qq.com圖標

首先,大家都知道財務的很重要一個職能就是記賬,記錄就需要原始憑證來證明這件事兒的真實性準確性。那麼憑證這種紙質文件,是一家企業的 Output,而很多時候,不管是部門內部,還是外部審計,都是依賴你的 Output 作為他們工作的 Input 的,例如大家可以想想企業內部的 AR AP 審付款單、報銷單、審預算單、審計狗抽憑、函證......投入了多少人力在裡面。先不說純粹的 「無紙化」 什麼時候可以實現,即使有紙,在當下和短期的未來來說,理應也可以通過圖像識別技術自動把這些紙質文件和圖像這些 非結構化數據 直接轉化成 結構化數據,一來可以方便他人,二來可以形成企業自身真正意義的 「大數據」。

可能不太恰當,我把財務工作劃分為四個屬性:信息記錄、流轉、分析、決策。那財務機器人能解決什麼問題?簡單說就是記錄流轉以及少量分析,上面也說到了,財務工作中有太多高度重複且又必要的一些信息錄入的操作了,手工操作出錯率高先不說,錄入之後的數據結構通常又得不到控制,源頭上的數據可能就不夠規範,在跨部門的信息流轉中可能就更加不規範,進而導致跨崗位或跨部門協同作業或者數據核對 溝通成本高,效率低。所以財務機器人才應運而生。

財務行業自從誕生之日起就不斷進行著以下漸進式的創新:

手工記賬——計算機簡單記賬——ERP系統記賬——財務共享中心------財務機器人

其實企業的財務共享中心或者事務所的全球交付中心(Global Delivery Center)的思路已經把數據錄入和整理核對這種重複性高的工作給流程化,系統化了,只保留相對高級的職能在企業內部。這也正是財務共享中心和全球交付中心的職位薪資待遇都相對低一些的原因。

而財務機器人也只是漸進式創新中的一環、上述四個歷史進程上的下一進程,並不會帶來巨大的顛覆性效果,它其實就是把當下最前沿的 AI 技術(圖像識別、語音識別等)應用在感測器等硬體上實現數據錄入和流通的進一步規範化,實現對財務中心的進一步濃縮或者取代,為機器學習所需要的真正的 「大數據」 做準備。

我所能預見的短期未來會是這樣的:財務狗拿到了一沓合同文件、發票、各種報銷單據或者其他文件票據,打開一台智能掃描儀,掃描儀迅速掃描完成後,傳遞到後台的圖片和文字識別系統(OCR、 PaddlePaddle 深度學習框架等),印刷字體形成的圖片轉換文字識別成功率現在應該還比較可觀,手寫字體的話 大概也就只需要用在簽名的地方了吧,用電子簽章也可以辦得到。或者索性不用掃描文件本身,未來的紙質文件內容同時也存放在隨文件附帶的二維碼甚至更尖端一點的 RFID 碼上,掃碼即可自動精準提取出合同、發票等文件的關鍵信息,例如合同號、發票號、產品名稱、甲方乙方、時間、數量、單價、金額、電子簽章......然後把這些信息自動傳入指定 ERP 系統的指定資料庫中的結構化的數據表,然後直接自動生成會計憑證結轉分錄、自動分類預算科目、自動匹配銷售訂單、應收應付單據截止日自動提醒、甚至自動收付款、自動完成固定資產無形資產的折舊與攤銷處理、月末年末自動配平三張財務報表......從此信息的錄入、整合與流通 高度系統化,結構化,規範化,對此人只需要修改系統邏輯與異常處理,以及 [記錄] 之後的 [分析] 與 [決策] 這種非流程性、不可預見的工作。

其實,現在 [分析] 的職能也正在被機器所侵蝕了,一些簡單的求和、平均、同比環比預實對比分析、差異分析或者其他簡單的描述性統計分析,只要數據輸入階段是規範的,產出簡單的分析結果 就是張張嘴說句話的事兒,從數據輸入到結果產出 中間的所有自然語言處理(NLP)、數據計算、分析都可以系統化、傻瓜化。具體怎麼玩兒大家可以看下這篇文章

JackRacer:從商務智能到人工智慧還有多遠,BI+AI =??

zhuanlan.zhihu.com圖標

等稍微長期一點的未來,機器自己在海量結構化的數據中學會了學習形成了經驗,像阿爾法狗一樣,像正在被攻克的暴雪遊戲《星際爭霸》一樣,如果非完全信息博弈的遊戲都被攻克了,機器有更強大的能力自己做 [決策] 了,那麼其他領域,想必很多管理層的座位都會不穩吧。

說完願景,那財務機器人又有哪些潛在的風險和推動難度呢?第一點:政策環境、市場環境瞬息萬變,政策可能就一句話的事兒,落實到企業經營層面可能就是徹頭徹尾的邏輯重構或巨大調整,新興行業尤其如此,而系統邏輯的設置,短期的未來,這種業務邏輯的搭建和系統設置無疑都需要紮實的財務知識,這是機器人所無法替代的,也是很難完成自我學習的部分。第二點:高度集成化的系統某種程度上又降低了造假的難度,之前要串通好幾個部門的人才能實現造假,現在可能只需要改改系統邏輯就好了,如果沒有完善的核查機制和內控流程,這個機器人就很可能成為某些利益群體粉飾報表的工具。

上述內容部分整理自 @蔡千年 的新書《財務思維:如何成為一個財務高手》,有興趣的童鞋也可以自己去京東上找下看看。

好了,就先說這麼多吧,其實不僅僅是財務領域是這樣,其他領域也都類似,只要前期數據準備的規範化了,數據記錄,流轉和簡單的分析機器都完全辦得到的,但是如果不規範,本來就輸入了一堆垃圾信息,就別指望機器能有啥作為了。開發是如此,前期需求整理和可行性分析階段做的足夠充分,真正開發起來其實是很輕鬆愉快高效的;審計也是如此,只要內控系統足夠完善,流程足夠規範,實質性程序是可以做很少的。可現狀是,開發加班加成狗,審計加班加成狗,很明顯,我們的大多數精力的確可能是後置了,沒有前置到準備階段,至於現狀為什麼是這樣,我不是管理層,我也不太了解,可能是因為企業發展初期迫於生存的需要不會考慮很多結構化,規範化的事情吧,畢竟那麼弄會影響到效率,會有個投入產出比的問題,這可能也是現代管理學的一大難題,我解釋不了。

最後,希望這篇文章對大家能有所啟發,也希望大家在真正的人工智慧到來之前可以像竹子一樣,先穩穩的紮根,去主動學一些東西迎接隨時可能到來的巨變。

噢,還有 Part 4 區塊鏈,放在下篇再說吧,不過千贊不更,哈哈,傲嬌臉~


推薦閱讀:

財務總監辭職前給老總的一封信,盡然讓他潸然淚下......
找代辦公司註銷常見的問題
為你詳解科技項目經費預算編製具體要求
2017年年報速遞,向千億俱樂部挺進的紫金礦業
教你如何看懂三大財務報表

TAG:財務 | 人工智慧 | 大數據 |