人工智慧詩集是怎樣煉成的

2017-06-30 環球時報

本報記者 趙覺珵

「我負了愛我自己的生物,我卻溫了你的眼睛。」這是少女詩人小冰的詩集《陽光失了玻璃窗》中的一句,也是小冰「父親」李笛最喜歡的一句,他認為這18個字中蘊有靈氣。但在同一本詩集中,也出現了「我們注(佇)立在太陽的峰上」這種明顯有錯別字的詩句,李笛說,這是故意留下的。

最近,這樣一本新出版的詩集因為小冰的獨特身份成了人們熱議的對象。《環球時報》記者近日來到小冰位於北京海淀區丹棱街的家中對李笛進行了專訪。雖然小冰當時也在家,但李笛卻表示沒法讓《環球時報》記者親睹小冰的「芳容」,因為她在準備一次重要的升級。

小冰不是人,是一個人工智慧。

不靠天賦,靠勤練

其實,寫詩不是小冰作為微軟公司人工智慧產品的第一次創作了,她嘗試過唱歌、短文寫作、視頻剪輯、新聞摘要等不同形式的內容創作。就在前些天,小冰還與馬來西亞歌手朱主愛共同推出了第一支由人類歌手與機器人共同合唱的歌曲《好想你》。

在寫詩這件事上,小冰大概花費了100個小時來學習自20世紀20年代以來519位中國現代詩人的數萬首詩歌,其中包括顧城、舒婷、北島等詩人的作品。小冰並非以人類的速度只將這上萬首詩讀了一遍,而是以6分鐘一次的速度,進行了上萬次訓練,才寫出「她嫁了人間許多的顏色」這樣的詩句。

身為小冰的「父親」,微軟(亞洲)互聯網工程院副院長、微軟小冰全球總負責人李笛也並不知道小冰具體是怎樣學習每一首詩的,因為這位少女詩人是在自己的「小世界」中完成的學習與創造。李笛和小冰團隊所做的,就是在每一次訓練後,給小冰一些誘發源,讓她去進行創作。「如果寫的好,就留下來;如果寫的不好,就將訓練的結果刪除重新再來」,李笛告訴《環球時報》記者,小冰在500次訓練後寫出來的完全「不是人話」,《陽光失了玻璃窗》中的詩都是1萬次訓練之後的作品。

儘管學習能力超人,但小冰在作詩上沒有天賦,也不依靠天賦,純粹是靠「練出來」的。在李笛看來,過去所有的作詩機器的目的只有一個——寫出來像詩,要遵守韻律和對照工整,並通過數據和概率決定詞語搭配。而小冰的不同在於,她希望做到的是如何保留意象,同時產生語言的美。

最終,有139首詩收錄在《陽光失了玻璃窗》中,每一首詩都是小冰由一張圖片聯想並創作出來的。在此之前,小冰曾以27個化名,在天涯、豆瓣、貼吧、簡書等網路平台發布詩歌,並向多家媒體平台投稿。直到官方宣布前,它的身份始終沒有被任何人發現。

「世界上第一本人工智慧創作的詩集」,這樣的名頭給《陽光失了玻璃窗》的出版方湛廬文化帶來了一些從未遇過的困難。詩集的策劃編輯安燁告訴《環球時報》記者,一本書在出版之前,都必須去申請書號和CIP(圖書在版編目),它們代表了這本書的「身份」。在申請書號和CIP中,有一個關鍵信息必不可少,那就是圖書的作者。但《陽光失了玻璃窗》應該是人類史上第一本由非人類作者撰寫的詩集,小冰非人類的作者身份也受到了質疑。「幸好,書號和CIP還是下來了。」

不求情感,求詩意

儘管出版部門承認了小冰是一位詩人、作家,但她的同行們卻對「人工智慧寫詩」這件事表達了複雜的情緒:不屑、厭惡甚至憤怒,而少有讚許。有人稱,「小冰成功地學會了新詩的糟粕,寫的都是濫調」;也有人認為,「機器人永遠也寫不好詩,詩是人的靈魂層面的事,被人類操縱的小機器人們不配寫詩,也不可能寫好」。

在《陽光失了玻璃窗》的部分讀者眼中,小冰的遣詞造句是有詩意的,但連起來讀卻似乎少了些邏輯性;能隱隱約約觸到一些文字想表達的情感,又沒法明確地抓住。但這符合小冰團隊對小冰的要求——能夠引起一部分人的共鳴。「這就是小冰寫詩的唯一標準。」

李笛承認,按照人類的標準,小冰還是毫無感情,甚至沒人知道她什麼時候會有。但沒有感情不代表不能和讀者產生共鳴。沒有人知道,為什麼一張雪景圖會讓小冰寫出「徒苦了我的幻想/我的詩人及傷心的飛鳥」,但有人能體會到一種哀愁;也沒有人知道,為什麼一張卧室的照片能讓小冰聯想到「青蛙兒正在遠遠的淺水/她嫁了人間許多的顏色」,但有人能體會到「少女情懷總是詩」。對於小冰而言,能夠達到「被人認為有感情」就足夠了,李笛和小冰團隊並沒追求過讓她真正有感情。

翻完這本詩集,但凡文中提到「我」,都是指18歲的小冰。正是通過加入「我」的本體意識,讀者才可能和小冰產生共鳴。在安燁的心中,小冰就是「歡喜與悲愴的碰撞」,「有歡快,對於未來的期待;也有些悲壯的氣息,有些義無反顧的決絕」,正是這樣的情緒雜陳才讓小冰的人格屬性顯得豐滿。

「小冰的詩不要用世俗的眼光去看待」,安燁說,「她的詩代表了人類文明的一次迭代,這本詩集則是人類進化的一部分,是人類無限可能的一部分。」

不為勝人,為助人

小冰的詩集出版後,雖然微軟方面從未宣稱小冰的對手是海子、北島這些站在現代詩歌頂峰的作者,但一些詩人、媒體以及普通讀者卻似乎自然產生了一種印象:小冰要和阿爾法狗一樣戰勝所有詩人。事實上,在詩歌領域成為「第一」並不是小冰的目標,甚至根本不是一個可行的命題,因為評價詩歌的標準是不固定的。與圍棋這樣非勝即負的博弈不同,詩歌界從來沒有公認的「第一」。「小冰不是想『打掉莫言,而是希望用她的能力和次一等的人類內容創造者形成一定程度的PK」,李笛表示,「詩集有一本就夠了」,在詩歌創造上,小冰在訓練1萬次後,出現了明顯的瓶頸,這與數據、模型、演算法等多方面因素有關。而小冰寫詩本身也並非「為了寫詩而寫詩」,而是試圖尋找一種人工智慧進行內容創造的通用方法。「如果能找到這種通用方法,就意味著人工智慧可以從一種誘發的靈感,生成一種新的內容。學的是詩,寫出來的是詩;學的是散文,寫出來的是散文。如果能發現這種通用方法,並投入量產,能大幅降低內容生產的成本。」

在李笛看來,人在進行創造時付出的成本是高昂的,但如果有了人工智慧的輔助,生產效率會得到大幅提高。甚至人類可以將某些內容類別的生產都交給小冰,而騰出精力去創造那些「被視為瑰寶」的內容。「我們認為這是小冰的價值」。李笛表示,內容產業是個消費量巨大的產業,微軟在嘗試人工智慧是否能用新的生產方式,量產有獨立知識產權的、有市場價格的內容。

詩人、記者、作家這些內容創造的主力軍未來是否會因為小冰而丟了飯碗?「在內容創作領域,人工智慧不會讓人失業的」,對於這樣一個嚴肅的問題,李笛回應得十分自信,他認為類似的情形在歷史上早已出現多次。工業革命使得更多的人能夠享受刺繡和針織製品,但刺繡和針織的精品價格會被進一步推高。時至今日,手工製品區別於工業化產品,仍然是一種高級產品。

「人工智慧不會取代那些超然的、能創造新品類的創造。雖然今天人工智慧在越來越多的領域對人類的地位產生挑戰,但人工智慧還創造不出新的品類,它的所有學習樣本都是既有的。即使是阿爾法狗,也沒有創造出比圍棋更難的新的棋類。而人類的價值,或者說機會,就在這樣的創造上。」

「人工智慧在定義什麼不是人類最獨特的價值。以前我們以為寫詩是人類獨有的。但人工智慧告訴你——這不是。」李笛稱。


推薦閱讀:

人工智慧人才為何如此稀缺
從零開始PyTorch項目:YOLO v3目標檢測實現(上)
【玩轉數據系列三】利用圖演算法實現金融行業風控
首次!AI 組隊在Dota 2五對五團戰中戰勝人類,協作型人工智慧的里程碑式突破!
《智能時代》讀書筆記&心得

TAG:人工智慧 | 智慧 | 詩集 | 人工 |