新聞自動生成——人工智慧正在逐步走進金融領域(其二)

發佈於 2016 年 3 月 2 日

文/王叢

上期,我們講述了人工智慧與量化交易的結合——主要利用機器學習,自然語言處理,以及最近火熱的知識圖譜技術,將海量異構信息分析,為投資者建立交易投資的預測模型。

本期,我們來關注成本問題,思考下人工智慧如何輔助金融新聞、研報、投資意向書的生成。儘管交易才是金融領域的核心,但如果降低了工作的時間成本,減少數字羅列、整理、反覆Copy-Paste的繁瑣工作,分析員們便有更多的時間進行深入分析,早先一步準備材料並上會,便早一步握住了商機。此外,對於我國的上億股民來說,信息傳達的快速與準確是核心需求,機器自動生成的新聞便可提供客觀實時的市場資訊。

從技術上講,機器新聞寫作包括了自然語言處理(NLP)的兩方面技術,自然語言理解(NLU—Natural Language Understanding)和自然語言生成(NLG—Natural Language Generation)。NLU將我們日常所見的話語消化理解,並轉化為機器可後續處理的結構;而NLG可以看作NLU的反面,它將由機器分析好的結構化數據再以平常人們能看懂的自然語句表達出來。

機器新聞寫作需要如下幾個步驟:

處理海量異構數據

需要將生產新聞所需的各種資料與數據消化,即包括自然文本的新聞報告,也包括資料庫,第三方平台,API等等來源的結構化數據,遇到文本中的圖片與表格,還需要利用OCR[1]等技術解析。

註:[1] Optical Character Recognition,光學字元識別

分析數據

這裡涉及到對各種數據的分析,運用知識圖譜中常用的實體提取與實體關聯等技術將關鍵邏輯主幹抽出,結合時間地點等因素,將關鍵信息嵌入預先設計好的模板。

文章生成

事實上,經過上述步驟不僅僅可以生產新聞,券商分析研報,上市招股書,企業年報,定增公告,基金研究員上會所需的投資建議書也都可以用類似方式生成,用戶只需選擇符合其需求的模板(哪個主題,哪些關鍵信息)與形式(PPT還是PDF),便可生成基本內容;而對於準確率有嚴格要求的內容,再進行多次校對,人工二次編輯。

目前國外做新聞自動生成的公司有:

1、Automated Insights是由美聯社等其他投資者投資的美國科技公司,他們的主要產品Wordsmith已自動創造出10多億篇文章與報告,主要客戶是美聯社,雅虎和Comcast,在去年2月份PE公司Vista Equity Partners將其收購。[1]

2、法國公司Yseop可以每秒生產3000頁內容,支持多種語言(英語,法語,德語等),產品適合於銀行、電信公司的客戶服務部門以及財經新聞網站。再生成一篇包含基本數據和精確數據的初稿後,交由編輯記者進行進行後續的潤色排版,以及深入的價值判斷。[1]

3、美國公司Narrative Science總共已經融資了3200萬美元,該公司的著名數據分析平台Quill可以分析結構化數據,將人工智慧與大數據進行技術融合,理解這些數據的重要性,從而產生簡短的文字表述或結構化的報告內容。[1]

此外類似的公司還有,Arria NLG,Linguastat。

國內產品有:

1、騰訊的DreamWriter,它根據演算法在第一時間自動生成稿件,瞬時輸出分析和研判,一分鐘內將重要資訊和解讀送達用戶,騰訊稱,寫稿機器人不會搶走記者的飯碗,希望Dreamwriter能夠解放記者,讓記者從事更具挑戰和智慧的工作。[2]

2、搜狐的智能報盤,它由機器人自動跟蹤、捕捉股票市場動態,並實時發布資訊的智能系統,通過搜狐新聞客戶端「財經頻道」同步推送到用戶面前,讓用戶準確、快速獲取股市即時變動情況,以及感興趣的股票信息。[3]

註:

[1] wikipeida相應頁面

[2] CPI數據出爐 機器人Dreamwriter1分鐘寫新聞稿

[3] 搜狐加速布局智能資訊 推出國內首個「智能股市播報系統」(圖)-搜狐財經

就新三板市場講,公開轉讓說明書,各類需披露報告,報都可以用機器來輔助工作。目前企業掛牌大約需要6個月的時間,需要支付給券商,會計師事務所,律師事務所等機構至少200萬人民幣,轉讓說明書中有大量的內容是可以用模板生成的,比如歷次股份變更,可以通過工商數據集成自動化,財務報表也可以與會計統計的數據自動化。自動化不僅可以提高效率,還可以檢驗數據的一致性。股轉系統官方的反饋意見提到過很多次會計數據與轉讓說明書數據不一致的情況,一次反饋與反饋意見回復往往要花費半個月以上,機器的輔助校驗非常必要。

作者簡介

王叢 文因互聯CKOWright State Univ計算機科學博士生,專攻知識表現與推理。曾參與歐盟LarKC項目,前後在DERI,IBM,西門子實習,TU Dresden訪問。JAIR,TKDE,ISWC等頂級刊物、會議審稿人。
推薦閱讀:

vivo重金髮布首部人工智慧產品,vivo X20全面屏手機值得買嗎?
小雅音箱音樂功能設計、語音助手及知識圖譜 | AI產品經理閉門會第2期乾貨分享
矽谷鋼鐵俠搞事情:Neuralink——大腦與人工智慧的結合
大腦是如何工作的?兼談如何做出類人智能。

TAG:人工智能 | 金融 | 新闻 |