AI 能破解600年前的神秘字元嗎?

伏尼契手稿共有240頁,被發現於100多年前,一個名叫威爾弗雷德·伏尼契的波蘭裔美國人書商,1912年在義大利買下了這本書。

2005年,這本手稿收入耶魯大學的貝內克珍本與手稿圖書館,書中的字母和語言與現代語言完全搭不上邊。

耶魯大學的貝內克珍本與手稿圖書館

經過檢測,這本手稿成於十五世紀初,估計在1404-1438年間。經歷了600多年,手稿已經非常脆弱,有些內容缺失,文本內容是從左到右書寫。手稿內配有很多插圖,包括植物、天文、生物學、醫藥等,但是對揭露書中的內容並沒有太大幫助。

這份手稿被發現以來,專業的、業餘的譯解密碼員都試圖研究破譯出隻字片語,但都只留下一連串失敗。

第二次世界大戰期間,也有破譯者分析過,依舊無解。有關代碼的各種理論多年來一直在被拋出,比如,它是使用半隨機加密方案創建的;字謎遊戲;刪除母音的書寫系統。

甚至有人認為這份手稿只不過是惡作劇,書中的符號排列全無意義可言。

顯然,加拿大的研究人員不這麼認為,利用人工智慧,他們甚至在揭秘這份手稿上邁出了一大步。

Greg Kondrak, PhD

阿爾伯塔大學自然語言處理專家格雷格·康德拉克(Greg Kondrak)認為,這對於人工智慧來說,似乎是一個完美挑戰。在他的研究生布拉德利·豪爾(Bradley Hauer)的幫助下,他們離破解代碼又進了一步。

兩位計算機科學家發現,文本內容是以希伯來語寫的,並且字母按照固定的模式排列。坦白說,研究人員還是不知道伏尼契手稿的含義,但現在已經為其他專家準備了參與調查的平台。

研究人員的第一步是確認加密文本的語言。為此,AI 研究了有380種不同語言版本的《世界人權宣言》,來尋找模式。

經此訓練,AI 分析了伏尼契手稿的亂碼,得出的結論是這些文本在很大程度上可以確認是用希伯來文編譯的。

康德拉克和豪爾對這一結果很震驚,他們在研究該項目的最初推測這些文本是用阿拉伯語寫的。

康德拉克在聲明中說:「這真令人驚訝。第一步我們證實了希伯來語,下一步是我們如何破譯它。」

對於第二步,研究人員採用了以前的研究人員提出的假設,即腳本是用alphagram創建的,就是說,每個單詞按照字母表順序重新排列組成一個新詞(alphagram 的該形式會寫成:aaaghlmpr)。

在這一前提下,研究人員設計了一種演算法,利用這些字謎,還原了真正的希伯來語單詞。

結果是,有80%以上的單詞都能在希伯來語字典中找到。但是還不能確定這些單詞是否能連成有意義的句子。

最後一步,研究人員摘取伏尼契手稿的第一行,交給另外一位計算機科學家,同時還是以希伯來語為母語的同事莫什·科佩爾(Moshe Koppel)。科佩爾說,這些內容並沒有在希伯來語中形成連貫的句子。

但是,在糾正了拼寫錯誤以後,谷歌翻譯給了他們一個答案:She made recommendations to the priest, man of the house and me andpeople.

大意是:她向牧師、家人、人民提出建議。

目前他們認為一些字元是可以對應的,包括狹窄、農民、光、空氣、火等名詞,使二人認為手稿確實是中世紀的煉金筆記書。

就如其他破譯者面臨的質疑一樣,康德拉克和豪爾的研究也受到懷疑,他們也承認,伏尼契手稿中的文本太雜,重複的字元太多,不像流暢的作文,這意味著可能最終只能破解手稿上的名詞。

但至少,他們已經確定了這本手稿的語言來自希伯來語。

此外,團隊正計劃繼續改進演演算法,並希望可以應用於其他古代未解手稿。

WTT資訊-最新科技資訊,實時網安信息www.wttech.org圖標WTT資訊-最新科技資訊,實時網安信息WTT資訊-最新科技資訊,實時網安信息www.wttech.org圖標

【推薦閱讀】

2017十大深網搜索引擎

Facebook 發明新時間單位

黑客會使用惡意軟體來偷你的汽油.

在DNA中存儲比特幣,要致富先解碼

宜家創始人英格瓦·坎普拉德留下的遺產

健身APP泄露軍事機密,包括中國南海

芭比娃娃的「黑歷史」

歡迎關注我們:

@W-Pwn

推薦閱讀:

考古真的有意義嗎?如果把投入考古的人力財力用於科研和慈善,不是更好嗎?
[考古日報Vol.57]海昏侯墓紅外掃描竹簡 發現疑似棋譜的古籍
中國有哪些陵墓可以下到地宮裡面的?
「馬踏飛燕」與「飛馬踏燕」兩個名稱,哪個好?
現在發掘得到的古代國庫金塊是作為黃金儲備還是文物,若是文物那它有什麼價值?

TAG:人工智能 | 考古 | 文字 |