標籤:

人工智慧看圖譜曲:下個莫扎特會是一台機器嗎?

最近《中國新歌聲》開播,然而整個節目幾乎沒有什麼亮點,使得觀看過程無聊大於愉悅。作為一個曾經追過《中國好聲音》的人,不得不說,即使拋開版權之爭導致的問題,這屆《中國新歌聲》似乎很難抓住觀眾的耳朵和眼球了。

尤其參選的選手選唱曲目簡直毫無新意,總是拿著四位導師的作品和一些老歌翻來覆去的唱,觀眾的耳朵早就聽出了繭子。而作為一個科技控,我想,如果在這個時候,有一位選手上來跟大家說,演唱的歌曲作者不是人,而是人工智慧的話,一定會讓所有人眼前一亮,甚至讓這個節目瞬間火爆。

這可不僅僅是一個設想。作為人工智慧的技術開拓者,百度的人工智慧技術正在逐漸實現這個設想:在聯手尤倫斯當代藝術中心舉辦的「AI科技與藝術之夜」的活動中,百度利用人工智慧技術,完成了機器讀圖和音樂再創作,將美國藝術大師羅伯特·勞森伯格的傳奇式巨作《四分之一英里畫作》的其中兩聯分別譜成了20餘秒的鋼琴曲,實現了視覺呈現向聽覺表達的轉化。

人工智慧是如何做到看圖譜曲的

事實上,在目前來說,全球範圍內能夠實現人工智慧自動譜曲的僅有百度和谷歌,而本次百度嘗試將圖像所體現的情感「移情」轉變為帶有聲音信息的技術則更為複雜。在給我們帶來極大的想像空間的同時,也說明了百度在人工智慧技術方面的領先優勢。在百度的努力下,也許,下一個莫扎特將會是一台擁有人工智慧的機器。

據悉,百度用上千台PC伺服器和近1000台GPU伺服器構建了世界上規模最大的深度神經網路,支持萬億參數、千億樣本、千億特徵訓練;在演算法上百度應用了深度神經網路等分散式演算法,支持的功能包括語音識別、圖像識別、自然語言處理等等。此次的人工智慧看圖譜曲,正是通過其全球最大規模的深度神經網路和深度學習演算法由機器自主學習實現的。

百度神經網路在「看到」圖像後,首先會對圖像進行分析解讀,為圖像打上若干具象化的標籤,然後通過搜索挖掘相關的音樂信息,對音樂拆分重組,再合成與圖片內容相匹配的音樂旋律,最終拼接成完整的曲子。僅僅從過程來說,看圖譜曲和這比常規意義上的我們理解的譜曲更加困難,正如同命題作文和自由作文的區別。

創作是人類作為高級生物的優勢之一,寫詩畫畫譜曲對於藝術家來說並不是件難事,但如何讓機器像人類一樣自主創作,卻是人工智慧領域的難題之一。而作為國內最具技術基因的互聯網巨頭,看圖譜曲已不是百度第一次嘗試讓人工智慧自主創作。早在2013年,百度就曾使用人工智慧技術對用戶上傳的圖片進行深度學習,為用戶創作詩歌。把人工智慧即使從作詩延伸到看圖譜曲,體現了百度在人工智慧等前沿技術領域中的領先性和創新精神,也展示出百度在人工智慧方面的技術實力。

百度在人工智慧領域的到底有多強

人工智慧將會是推動產業革新發展的重要力量,這是所有人的共識。而在國際上,谷歌、微軟、Facebook等國際巨頭一直都把未來賭在人工智慧上。伴隨著中外科技巨頭爭相加大在人工智慧領域的投資布局,人工智慧技術的大規模商業應用開始初露端倪。如今人工智慧技術已被越來越廣泛地應用在了互聯網服務、智能家居、智能汽車、機器人等眾多前沿領域。

在百度首席科學家吳恩達看來,百度最核心的人工智慧技術包括圖像、語音、自然語音理解、機器學習平台和大數據等幾個部分。目前百度在這些領域已經擁有較多技術專利,並處於世界領先水平。之所以能夠取得這個成果,是因為百度一直以來,都把人工智慧當做一個大力投入的方向。

全球發達國家都在人工智慧領域加快行動,尤其是許多先進的技術公司紛紛布局深度學習、人機交互和圖像語言識別等技術。在這一領域,百度早早的就開始謀劃布局。例如在2013年就成立了全球首家深度學習研究院,後擴充為百度研究院,下設人工智慧實驗室、深度學習實驗室以及大數據實驗室,招募吳恩達等人工智慧頂級專家,建成了全球最大的深度神經網路「百度大腦」,同谷歌、微軟等企業爭奪人工智慧技術制高點。

近日,《麻省理工科技評論》評選出2016全球了「50家最聰明公司」,百度名列第二。《麻省理工科技評論》如此評價百度:「百度在核心的搜索業務之外,語音識別、人工智慧技術領域的積累已經讓百度在語音識別上可與真人相媲美,並且百度在矽谷成立自動駕駛研發部門,也是視覺識別、感測器等領域的領先企業。」這證明了百度在人工智慧方面的布局成功。

在人工智慧領域,百度不止想製造下個莫扎特

看圖譜曲只是百度技術體現的一個例子。實際上,過去的五年是人工智慧突飛猛進的階段,而百度在圖像識別技術上已做到了全球領先。目前,百度的Deep Image計算機視覺系統已經能夠對圖片內容進行識別,在模式識別上取得了重大突破,其中LWF人臉識別精度高達99.86%。而百度自主研發的人工智慧機器人「度秘」已經在肯德基的智能點餐、高考的智能信息服務等多種場景中實現了運用。

可以這麼說,百度的人工智慧幾乎已經滲透到百度所有的產品線當中,之所以如此,是因為長期以來,百度一直在研發人工智慧技術在家居、汽車、無人系統、安防等領域的推廣應用,並豐富移動智能終端、可穿戴、虛擬現實等產品的服務及形態,推動人工智慧與機器人技術的深度融合。相信在未來,百度人工智慧技術將會進行更多領域的嘗試,將情感分析和理解的成果應用於產品中,為用戶提供個性化和精準化的智能服務,全面提升用戶體驗。

百度總裁張亞勤上月曾表示,去年百度在研發方面投入超過100億元,而「百度大腦」作為百度在人工智慧領域的核心,已孵化出如無人駕駛、智能搜索等創新技術。目前「百度大腦」已具備視、聽、說和預測、規劃決策以及行動控制的能力,並將被應用到金融、汽車、醫療等領域。他同時表示,「智能交通」將是中國企業彎道超車的好機會。

自計算機誕生之日起,人類便不斷追尋賦予機器以「生命」。百度人工智慧技術正試圖讓看似天方夜譚的事情,變成現實。而當不用手便可以操作手機的語音識別等技術慢慢便利了人類生活後,人工智慧便被賦予在工業、生活等領域的發展厚望。而如何將這些人工智慧應用到各個領域撬動剛需,將會決定人工智慧擴展的邊界。

總之,隨著人工智慧看圖譜曲的技術日趨成熟後,下一個莫扎特真的會是台機器的日子不遠了。但即使如此,人工智慧的爆發卻還遠未結束,相信在未來,會有更多的不可思議讓我們體驗到技術的魅力。

作者:歪道道,互聯網與科技圈深度觀察者。微信公眾號:歪思妙想


推薦閱讀:

華為榮耀V10背後的人工智慧,iPhone X都著急了
有自我意識和自由意志的強AI能否實現
Python學習路線分享 零基礎學Python看什麼書好?
【願景學城】24小時AI熱點新聞的匯總(2018/03/01)
如何讓「機器眼」和人類一樣擁有一雙慧眼? | 機器視覺漫談系列二

TAG:人工智慧 |