突圍機器寫詩紅海,360這款黑科技讓全民皆「詩人」
7、8月份,中文互聯網領域進入了年度財報月,其中最值得關注的阿里、騰訊、百度三大巨頭在最新一季財報中不約而同的提到了對人工智慧領域的布局和預期。在這樣的背景下,人工智慧已悄然迎來了新時代。但相較這些大開大闔的戰略規劃,那些已經落地實用且更加小而美、具有我國文化底蘊的產品功能其實更值得我們細細回味,最新上線的360搜索App 5.0版本中主打的國內首款「拍圖寫詩」人工智慧應用就是一個典型的例子。
會創作古詩的360搜索,更智能的觸景生「詩」
據了解,用戶只需觸碰360搜索App搜索框右側拍照圖標(如下圖),即可使用「拍圖寫詩」功能,無論是在旅遊,出行、約會等任意生活場景、每當邂逅美好情景時、想要表達此刻心情,只需拍攝一張照片,就能觸發寫詩功能,通過360搜索人工智慧引擎可以智能理解和識別圖片內容,自動感知圖片風格與情景,最終為用戶生成一首觸景生情的七言古詩,留存美好記憶。
拍照作詩功能背後, 360搜索所做的並不是將圖像理解和文本生成兩種技術簡單整合在一起。事實上,機器寫詩這一功能需要在自然語言處理和計算機視覺都具有著深厚的技術儲備,其工作原理簡單描述如下:
在用戶上傳圖片後,圖片將進入到360搜索人工智慧引擎,通過先進的深度學習圖片理解技術將原始圖片內容進行深度理解和解析,並將其映射到一個隱語義空間;在此基礎上,結合隱語義以及注意力機制(Attention Mechanism),採用深度學習自然語言文本生成技術輸出文本詩句,這是一種圖像和文本之間跨模態統一深度學習建模的技術,具有較高的技術壁壘。
簡單的說,機器寫詩就是在機器深度學習海量詩歌相關數據之外,對當前場景中所見景色景物進行意象化處理,提取關鍵信息,最終結合詩歌語料完成創作。如果說微軟小冰、谷歌AI這類在相應領域發展超過多年的產品實現機器寫詩並不令人意外,那麼切入AI領域不到兩年時間的360搜索同樣做出「拍圖寫詩」,而且具有更好的用戶體驗,無疑體現了360在人工智慧領域迅捷的開拓推進,尤其是在產品功能落地方面對多項AI功能整合應用的獨到之處,可以說,360正在低調中完成相應人工智慧技術領域的彎道超車。
同樣是寫詩,為什麼說360搜索存在更多突破?
事實上,正如上文所說,機器人寫詩並不是什麼新鮮事物,微軟小冰在今年5月就推出首部現代詩集《陽光失了玻璃窗》,谷歌旗下AI同樣也有現代詩產出。國內也有部分廠商基於用戶輸入主體文本關鍵字進行機器作詩。但相較於前者們,360搜索實現的「拍圖寫詩」功能所突破的技術壁壘相對更高。
這其中的決定性因素在於,360搜索產出的詩歌是古體詩(嚴格意義上講是更偏向於唐代以後的近體詩)。現代體詩歌的形式非常自由,內涵也更加開放,不拘泥於修辭,只需要表達出對意境意向的理解和展示即可。相比之下,近體詩對於格律、結構甚至韻腳都有嚴格的限制和要求,這就意味著機器創作近體詩不能只有和現代詩一樣的華麗辭藻,還要兼顧韻律、平仄、內涵,所能展現的文體形式相較現代詩也更局限一些。所以,「拍圖寫詩」產出的近體詩意味著360搜索的人工智慧具有著更強的自然語言理解和計算機視覺技術。
我們舉幾個簡單的例子,唐代詩人王維的詩歌一向被譽為是「詩中有畫,畫中有詩」,現如今智能機器人或許可以輕易的用一段話來描繪長河與落日的壯觀景象,卻寫不出「大漠孤煙直,長河落日圓」這樣令人拍案叫絕的詩句,同樣是簡簡單單的十個字的組合,經由人類寫出自己的感受,正是當前的機器智能所欠缺的。
再比如,一些寫詩機器人可以寫出:微明的燈影里/我知道她的可愛的土壤/是我的心靈成為俘虜了,這樣自成一派的現代體詩歌,但是諸如 「飛流直下三千尺,疑是銀河落九天」、「但使龍城飛將在,不教胡馬度陰山」這類激昂壯麗同時注入了作者想像力的詩句,就不是當前絕大部分智能機器人所能企及的。
這其中的道理也並不難理解,大部分會寫詩的機器人產出的都是現代詩、打油詩,其實寫詩作為一種技藝,無非就是技術+藝術。所謂技術,就是對文字的使用和處理,基於遠超人類大腦的統計學習演算法和數據信息儲備,機器可以在文字堆砌使用方面「炫技」,比如嚴格執行音節聲調和韻律的要求等,甚至可以做的比人類更好。但在古體詩和近體詩真正表達作者情感的藝術體現上,現階段由於技術的局限性,智能機器人很難在包括思想感情、聯想以及比擬誇張在內的詩歌表現力方面傳遞出古體或近體詩的藝術性。簡單地說,就是機器無法像人類一樣擁有感情和情緒。
相比之下,360搜索的「拍圖寫詩」功能通過生成古詩展示了更加出彩的藝術造詣,這可以視為是人工智慧在學習乃至表達類人情緒方面的更進一步,讓機器人能夠表達出喜怒哀樂甚至擁有喜怒哀樂,無疑是在整合數據與處理文字基礎上的進步,所需要突破的技術難度更大也在情理之中。
必須指出的是,儘管360搜索寫出的更具藝術造詣的古詩或許只是人工智慧在理解人類感情方面的更近一步,但這已經給包括語音助理、智能機器人等更多涉及人機交互的人工智慧硬體產品帶來了新的驅動力和想像空間。
不能為人工智慧而做人工智慧,初心即落點
如今看來,正如周鴻禕在多次談及人工智慧的講話中所說的那樣,不能為了人工智慧而去做人工智慧,不能落地應用的純粹AI技術與空談無異,更沒有商業模式。這並不難理解,早在微軟小冰能夠完成對話、寫詩的時候,就有人提出了這樣的疑問:我們究竟需要的是一個有趣的智能機器人,還是一個有用的智能機器人?
換言之,寫詩本來就是人類表達自己審美、感情、思辨的一種方式,機器為什麼要寫詩?機器寫詩的意義何在?
或許正是基於這樣的思考,360「拍圖寫詩」並沒有成為一個獵奇方向的噱頭產品,而是架構在了360搜索引擎下的一個滿足用戶搜索需求的高附加值服務。在我看來,這一功能服務通過深刻理解人們創作詩歌具體場景及背後隱藏的心理訴求,一方面通過文學創作超出預期的滿足了用戶自我娛樂的需求,另一方面增強了搜索引擎的社交性,美圖+古詩的結合正可以成為用戶之間互相贈送進而達成良好社交關係的一個重要媒介。
事實上,縱觀360在人工智慧領域的產出,如應用人臉識別技術和人機交互技術的360兒童手錶;結合了AI高級輔助駕駛和語音助理功能的360行車記錄儀;以及本次包含了「拍圖寫詩」、「掃碼識葯」等功能的360搜索App5.0版本,都印證了360在人工智慧領域同步推進技術開發和垂直落地的布局思路,稱得上是兩手抓兩手都要硬。
而這種始終將技術與產品緊密結合,讓每一次技術推進都能切實的服務到用戶的人工智慧,相較於那些鼓吹概念的人工智慧泡沫、大而無當的紙上談兵布局,或許才是如今的消費者群體更需要的,這也更加值得人工智慧行業中其他企業的思考和借鑒。
推薦閱讀:
※人類的智能未來:廣義哥德爾定理
※極市分享|藍胖子機器人CTO張浩:機器人操控中的計算機視覺
※《邀請函是假,代言人李連杰也是假的吧!》--《鐵甲雄心》機器人格鬥賽,請不要先格了受邀參賽者的心
※厲害了!浙大研發出踹不倒四足機器人「絕影」,中國版波士頓動力來了