NaNoGenMo:人工智慧寫作與達達主義2.0

在今年六月份波士頓舉辦的@party上,來自MIT的程序寫作專家Nick Montfort向參與者介紹了電腦生成書籍的現狀,程序寫作(Program Writing)和電腦生成文學(Computer-Generated Literary Art)並不完全等同於大眾所理解的人工智慧寫作,作為結合了生成藝術(Generated Art)和文學的交叉學科,它收到了網路文學、烏力波、信息主義等文學現象的影響,而人工智慧,也正在成為這一領域中極其重要的研究工具。

講座中展示的這些圖書都是由電腦程序寫作完成的

there is no answer to this order of reasoning, except to advise a little wider perception, and extension of the too narrow horizon of habitual ideas. (or there is an answer to this order of reasoning.)

「這種推理沒有答案,除了建議更廣泛的感知,和拓寬狹隘的既有觀念的視野」(或許這種推理會得到解答)

——某演算法

原文:NaNoGenMo: Dada 2.0

標題圖片:flickr.com/photos/nonst

今年早些時候,《華爾街日報》發表了一篇文章,這篇文章帶有一個互動側邊欄,包括了一系列金融投資研究報告的片段。網站會提醒讀者那一段摘錄是由機器人完成的,而又有哪些是由人類完成的。誠然,《華爾街日報》對簡練文風的偏愛讓這種挑戰更加可行。其中的一句話這樣說到:「第二季度的現金結餘8.3億美元,這意味著在第一季度減少1.4億美元之後,第二季度又消耗了8000萬美元」。(Q2 cash balance expectation of $830m implies ~$80m of cash burn in Q2 after a $140m reduction in cash balance in Q1),這句話實際上只包含了三個數據點,並使用特定的語法合併在一起,而且不包含任何巧合的成分。像記者這樣的白領工作者可能還未必需要擔心他們的飯碗(至少現在是這樣……),因為雖然新的自然語言生成(NLG)演算法已經可以很好的在敘事文體中表達結構數據,但目前而言仍然不夠完善。這實際上是一種相當強大的能力,因為對於我們來說,從數據中獲得觀點的本領往往依賴於數據的表現形式(比如說以圖表展現的數據可能會讓我們漏掉某些特定的數據行或列)。而這與無中生有地創造一個世界所需地膽量相差甚遠。

自然語言生成演算法通常會被歸類於「人工智慧」或「機器智能」地某種形式,因為它們所做地事情——比如編寫體育新聞或天氣預報稿件,亦或是編寫房地產廣告,就像我在快進實驗室(Fast Forward Labs)的同事們所做的原型那樣——而之前這些事情只有人類能做到。(在另外的文章里我會探討人工智慧的歷史,以及Nancy Fulda等人所支持的相對概念)。

正如《華爾街日報》的文中所述,大多數人對自然語言生成演算法的評價都類似於André Bazin的評價:以現實主義作品的角度來看它缺乏技巧,而以演算法藝術的角度來看它又不夠自動化。而商業化會將自然語言生成演算法向著更寫實的方向推進,因為投行和福布斯這樣的通訊社不會花錢購買機器智能來生成文風怪異的稿件。反之,因為我們以人類的視角去評判機器智能,因此會將開發者向著更接近人類文風的方向推進。

但是如果我們將機器生成文本的目標設定為另外一種風格呢?或者,我們不是以人類的標準去評判(機器生成的文本),而是以其差異化去評判呢?其實機器或許生成我們人類無法創造的東西——或者會自行創造——以至於擺脫演算法的幫助呢?自動寫作是否有可能顛覆我們對自動化的理解,就像什克洛夫斯基(Shklovsky,俄國形式主義學派的創始人)在《作為技巧的藝術》(Art as Device)所描述的詩歌那樣,為我們的創造力提供新的載體呢?

2014年NaNoGenMo參賽作品《Seraphs》,作者Liza Daly

Github鏈接:github.com/lizadaly/nan

這種利用自動化工具尋找新奇體驗的過程正是全國小說生成月NaNoGenMo(National Novel Generation Month)的魅力所在,網路藝術家Darius Kazemi在2013年11月靈光乍現似的創辦了NaNoGenMo這一一年一度的寫作機器人峰會。出於對文學形式的思考,Kazemi開玩笑似的沿用了國家小說寫作月NaNoWriMo(National Novel Writing Month)中僅有的兩條規則:作品必須在30天內完成(11月份)而且至少要寫夠五萬字。這種不拘一格的創作要求啟發了新的創作試驗:既然你可以編寫某種可以創作小說的演算法,那麼為什麼還要自己寫小說呢?他將這一想法發表在推特上,並創建了一個新的GitHub(一個基於網路的軟體開發協作工具)社區。

NaNoGenMo的官方Github:National Novel Generation Month

與NaNoWriMo類似,NaNoGenMo對所有人開放,而唯一的限制條件就是五萬字的字數要求,也正因如此,NaNoGenMo逐漸成為一種使用演算法試驗文學形式的複合藝術運動。而這一團體的身份認同的形成一部分來自於對外界批評的反抗,許多批評者稱他們的作品為「入不了出版商法眼」的「混亂的機器人腳本」。去年,一位參與者自嘲道「向普通人解釋我們做所的事情是徒勞的。」而積極的一面則是他們正在通過共享優質的關鍵資源來構建群體的認同感。John Ohno(別名enkiv2)發布了可以生成六節詩、俳句和同義詞的代碼。而Allison Parrish(別名aparrish)則共享了其針對卡耐基梅隆大學發音詞典(Carnegie Mellon Pronouncing Dictionary)開發的介面,這一介面可以為針對特定單詞生成押韻詞字典。最終Isaac Karth(別名ikarth)向成員們揭示了這種利用既有文本重新組合成的詩歌背後的理性根源——達達主義、威廉·巴勒斯(William Burroughs)的剪切技巧、以及烏力波(Oulipo)面向約束(constraint-oriented)的作品。當我與Kazemi討論這一項目的時候,他表示肯尼思·戈德史密斯(Kenneth Goldsmith)的《不創意寫作》激發了他針對如何讓NaNoGenMo挑戰人們對創作和創意的傳統認知的思考。

技術限制解釋了為什麼NaNoGenMo需要將自己和意境重構(recontextualization)和重組的詩學相結合。實際上真正的自然語言生成演算法,就是那些可以構建單詞和語法、並切能夠隨著時間的推移變得更加智能的演算法仍然處於非常早期的階段,2014年大多數的作品都是使用創造性的規則轉換已有的文本,這也導致了作品的相似性。

《搜索者》的部分文本,Github鏈接:thricedotted/theseeker

在2014年至少有兩個作品使用了夢幻般的方式去探索機器智能的奇特美感。Thricedotted的《搜索者》(The Seeker)是一本試圖「通過閱讀WikiHow來了解人類行為」的機器的自傳。這一作品充滿著視覺美感,每一次演算法操作的循環都會被抽象的雨點和類似「想像沒有一件事情是沒有方向的。」(imagine not one thing could be undirected.)這樣的格言所標註。就像科塔薩爾的《跳房子》中跳房子遊戲的暗喻一樣,這些格言鼓勵讀者去感知隨機數據中有意義的部分(Thricedotted的網路賬號常常提到要「腦補」(apophenia))。電腦演算法周而復始的重複著「工作、掃描、想像」的循環,不斷地抓取WikiHow的內容,並針對工作中遇到的概念去搜索完全由文本構成的記憶,由此構建一個夢境的序列——或「抽象概念」(univision)——來理解它所不知道的概念。這些概念包含了最令人驚訝的詩歌作品,其美感源於閱讀者不自主的從中獲取的片段式的意境。

univision: change

(required evolutions suddenly concentrating favourable structures. a chemical behind conclusions. determining the opinion in the event. looking while happening. reciting the literature on the water. the position, existing. the amount around the resource. the task in the example. the selection near attempts. undergoing the layer and observing the object. the timeliness around the availability. Beginning memories…)

概念:改變

(需要進化突然集中有利的結構,結論背後的化學反應。 確定事件中的意見。 在發生時觀看。 背誦有關水的文獻。 存在的位置。 資源周圍的金額。 在這個例子中的任務。 接近嘗試的選擇。 正在經歷的層和觀察對象。 與可用性相關的及時性。 開始回憶...)

Allison Parrish的《我在清水中淌過》(I Waded in Clear Water)則使用了情緒分析演算法,它根據文本的情緒特徵對其進行分級,並據此規則解釋並改寫古斯塔夫斯?H?米勒(Gustavus Hindman Miller)的《10000個夢的解釋》(Ten Thousand Dreams)。Parrish依靠米勒書中公式化的「行為」+「含義」(action + denotation)結構(如 行為:「看到橡樹結滿橡果」,含義:「意味著升職加薪」)。她首先將行為部分轉換為第一人稱,簡單的將句子重新處理(如「我看到橡樹結滿橡果」)然後根據情緒分析演算法所得出的結果,將「含義」部分按照從夢中最壞到最好的順序重新排列。情緒分數創建了短的章節比如:「我將車開到渾水中。我看到別人在除草」,和由一系列不相干的行動組成的長章節:「我走下一層樓梯。我看到一個瘸子。我看到我的愛人喝鴉片酒解愁。我聽見嘲笑聲。我停在窗檯。我身上有虱子。我看到。我丟掉了它。無論如何我都感到憂鬱。我發出一條信息……」根據情感演算法,在清水中淌過是最好的夢。

Moniker的推特機器人:@alltheminutes twitter.com/alltheminut

另外一些作品則是對推特信息的重組,阿姆斯特丹的Moniker設計工作室編寫了一個針對推特信息的簡單查詢,它搜索類似「這是 + 點 + 分 + 上午/下午 + 和 + 」這類結構的句子,構成一份包含全球日常活動的日記。這種「這是幾點和我是」的結構傾向於提取可預測的陳述或牢騷,而展示出程序是如何自動化的獲得我們的想法的:「這是12:29而我需要點飲料」「這是1:00pm而我還沒有離開我的床」「這是11:00pm我終於得到了一杯咖啡。」《推傲慢與推偏見》(Twide and Twejudice)將奧斯汀原文中的對話以推特中相似內容的用詞來替換,讓對話看起來「更接地氣」:(貝內特先生向貝內特太太打聽賓利先生的事情)「他擺脫單身了嗎?(Is he/she overrun 0r single?)」(貝內特太太對賓利先生的到來感嘆道):「對我家傻妮們來說這真是太TMD好了(What _a fineee thingi 4my rageaholics girls!)」雖然這些作品不像《搜索者》那麼複雜,但它通過將推特中的用詞摻雜進奧斯汀的作品這種方式,展現了當代媒體是如何改變傳播規範的。

這讓我們回到了我們對電腦生成文本進行評判的依據的那個假設:以文章是否讀起來像人類作品作為評判電腦作品的依據是迂腐的,因為什麼樣的語言能夠被稱作「自然語言」的標準是相對的,而不是絕對的。我們自身的語言習慣是通過與其他人的互動而建立的,這其中可能包括了特定的社會階層,同事和同學,乃至在我們的推特時間線上亂髮垃圾信息的機器人。在Medium網站近期的一篇文章中,Katie Rose Pipkin 有力的解釋了機器是如何改變、並且已經改變了我們對自然語言的思考。無論我們承認與否,我們面對搜索工具和虛擬助手所使用的語言已經與其他情形下有所不同,因為我們已經潛移默化的開始理解它們的工作方式,並調整我們請求的方式以提高溝通效率。

機器學習領域的最新進展已經可以讓機器發展出與我們類似的學習模型,不斷地個更新它們所表達的信息和表達的方式來適應我們的輸入。Kazemi正計劃在2015年的NaNoGenMo作品中加入這種新的人機交流形式,讓人和演算法一起「合作」小說,演算法會起草十個句子,然後他作為人類從中選擇他認為最好的那句。「那麼究竟是誰寫成了這本書呢?」他回答道:「(電腦演算法)寫作了文章中的每一個字,而(我)則決定了正本小說的形式。」這種互動與基於IBM Watson構建的,面向律師和醫生的新研究工具非常類似:ROSS是一款基於Watson API的法律工具,它可以展示特定問題的若干答案,而律師所要做的則是選擇他們最喜歡的答案。如果NaNoGenMo可以幫助我們更加深刻的思考這種人機互動,可能會為未來的人工智慧研究帶來新的視野。


推薦閱讀:

《強化》
文字Geek和普通人類的交戰
《封神》-序章:蓮心

TAG:人工智能 | 写作 | GitHub |