隨機敲鍵盤能敲出一部小說嗎?

,有人嘗試過證明這種可能性的存在嗎?


詩云。。


純隨機概率很低,但經過學習之後可以產生大量有意義的語句和文章。上周剛寫了一個小程序,它模仿的雪萊詩可好看了。

It were

A cruel punishment

By which the loveliness;

Of star-deserted heaven,

Pinnacled dim in the faintest thoughts which covered and cold.

dares not look on me?

None answer? Can one tyrant overbear this load

Even to a nook of unblown violets

And lilies-of-the-valley yet unborn,

Under a pine with ivy pale did grow,

Of love divine in woman

Grows cruel, courteous, smooth, serene, and blind.

其實你在雪萊全集里搜一搜就會發現,都尼瑪是拆了東牆補西牆,因為基於馬爾科夫模型。每個固定長度的string下面接續的char的頻率統計。


用混亂度來討論,小說是經過編排的文字,熵值小於隨機敲打鍵盤得到的文本的熵,從任藝起點算起,其後的任意部分的熵增速度大於小說任意點其後的熵增速度,因此,隨機敲鍵盤得到小說是不可能的。

以上是通常情況,但是現在隨機敲鍵盤會有智能修復和智能填詞功能,一定程度上降低了熵值增速,限制的越多,得到小說的概率也就越大,就好比你在百度搜一部小說前幾個字就得到一部小說的索引一樣,如果可以通過判斷前面所有的文字智能的填寫後面的詞,敲出一部小說是有很大可能的。

現在我們來給小說下定義

世界上最短的小說

http://www.douban.com/group/topic/6293348/#!/i!/ckDefault

其中最短的一個只一個字加一符號

不!

他們肯定是來搞笑的~~~

回到問題,

我這樣的鍵盤,隨機哪些位置什麼能出現這部小說呢?

統計一下

(abc)的第三個字

(abc)(tuv)第一個字

(abc)1第三個字

假設我的小手指每次都敲到鍵盤,那我不小心碰到他們的概率大概是~~~~是~~

估計不出來啊~~

數學沒學好~~

用面積算吧~

1/20*1/42+

1/20*1/20*(1/42+1/12)+

1/20*1/42*1/42

大概就是這樣了,空格我也算進去了

在只敲3次鍵盤的情況下出現不字的概率再乘上感嘆號的概率!1/42這樣一部小說就這樣出世了!世界真美好~

對了

還有滑動打字的功能,從(abc)(jkl)(tuv)滑下來也能出打出不來

(abc)(1)(jkl)(tuv)也可以

這個怎麼算~~~不玩了我~~

倘若不加敲鍵盤次數的限制,在長長的一堆亂碼裡面還找不出個不字么!~~

正式回答題主

可以~

是人都可以~~


算算數量級:假設用五筆四個字母確定一個字,隨機打對一個字的概率大概是10的-5次方。如果按高考作文800字算,一次隨機打對所有字的概率是10的-4000次方。那如果按幾何分布考慮(重試直到有一次成功為止),平均(期望)需要嘗試的次數是10的4000次方次。這個數字的概念是,如果一秒鐘能試十億次,發動地球上所有人來試,那等一隻蝸牛在地球和現在已知宇宙邊界往返1後面三千多個零這麼多次,我們有機會試出一篇能看的高考作文。(edited. 果然不能睡前寫數學。)

---update---

很多同學在評論里糾結:800字的文章不只一種啊!所以我又來算了。如果假設800字文章有十億種中心思想;按照每種中心思想寫出來,每8個字為一句,每句話都有10種不同的表達方式的話,我們的800字文章里有10的(800/8)+10次方種能看得過去。所以隨機打出文章的概率「驟增」到10的-3890次方。算下來——蝸牛君還是得在地球和宇宙邊緣往返1後面三千多個零左右的次數,我們才能打出一篇能看的高考作文。


我是一個搬運工。

無限猴子定理:

讓一隻猴子在打字機上隨機地按鍵,當按鍵時間達到無窮時,幾乎必然能夠打出任何給定的文字,比如莎士比亞的全套著作。

來自維基百科:

http://zh.m.wikipedia.org/wiki/%E7%84%A1%E9%99%90%E7%8C%B4%E5%AD%90%E5%AE%9A%E7%90%86


這個問題通常是基督徒用來反對演化論關於生命起源和演化的說法的。

這個問題的答案大概至少受3個因素影響:

1,有多少人(或者猴子也行)來敲鍵盤?

2,他們可以敲多久?

3,已經形成有序文字的部分可以累積嗎?


無限猴子定理


讓我來回答你吧

大會的快遞是南水北調很稀鬆代表大家都覺得開發年發布的花攢錦簇開發難道你不睡覺都餓哦餓就複發 奧情況能否把部分農村急需罪惡客人女人彼此彼此句 哦是看清你客氣哦啊 u 都會讓別人能逆襲成人本科 都會堵死佛法木地板死死的黑絲奧蘇的白色寬鬆的經典男盜女娼經常保持大覺寺宿舍巴登巴登就此產生那看似附加費把人家帝都出發北京似的解放碑色即是空傳經送寶是寬鬆的絕對不是靠此後的博斯科夫 iu 地板送細胞

嗯 剛剛我只是講了個故事


有可能,多嘗試幾次就好了。比如最短片的小說:《生活》 因為它就內容就一個字「網」。但是要打出一部《紅樓夢》,那理論上嘗試無數次是可能的,無數次是多少次?就是正無窮。可是只是在理論上可能。實際生活中是不可能。中文涉及到空格選字更為複雜。鍵盤只計算26個字母,其他按鍵忽略,打出「good」這個單詞的概率應該是26的4次方分之一。為456976分之一。(數學只學到高中的學渣斗膽計算了一下,如有錯誤望指正並輕虐(づ ̄3 ̄)づ╭?~)。


題主一定是沒有看過《異天途》這本曠世奇書!!

去了解下吧!233


百度了一下異天途,跪著回來了,話說,題主對「一部小說」的定義是什麼呢?這一點也是很重要的


答案是能,隨機敲打鍵盤可以敲出一切,可以敲出人類自從能夠寫字以來所寫出的一 切句子:每一句散文,每一行詩歌,每一篇社論,每一則廣告,每 一卷厚厚的學術論文,每一封書信,你能想到和想不到的文字,只是...

來,我們還是進行一下數學上的分析吧。首先做幾個假定。

First,敲出來的文字是英文(中文也一樣,題主有興趣可以自己推導)

Second,敲擊過程完全隨機(不討論密碼學中的隨機數是否真正存在,這都快變成哲學問題,就假設存在真正的隨機數)。

Third,我們的鍵盤比較特殊。在英語中有 26 個字母、十個數碼(0,1,2,…,9)、還有 14個常用符號(空白、句號、逗號、冒號、分號、問號、驚嘆號、破折號、連字元、引號、省略號、小括弧、中括弧、大括弧),共50 個字元。所以那個鍵盤上有50個按鍵。

然後敲擊鍵盤吧.

在得到的一行行字母組合當中,大多數根本沒有什麼意 思,如: aaaaaaaaaaaa… 或者 boobooboobooboo… 或者 zawkpopkossscilm… 但是,既然能敲出印出所有可能的字母及符號的組合,我們就 能從這堆字母中找出有意義的句子。

例如

I like apples.

Awesoooooome.

繼續找下去,你能找到莎士比亞的所有著作,包括他扔到廢紙簍中句子。

不僅如此,還能敲出今後各個世紀所要印出的東西。 我們可以讀到 30 世紀的詩章,未來的科學發現,2344 年星際交通事故的統計,還有一篇篇尚未被作家們創作 出來的長、短篇小說。所以圖書出版商們只要雇一群人,隨機敲打鍵盤,然後從印出的紙卷里尋找好句子來出版就是了。

但是呢,下面我們做個數學題吧...

打出的每一行中,第一個字元可以是 50 個字元當中的任何一個,因此有 50 種可能性。對這 50 種可能性當中的每一種,第二個字元又有 50 種可能性,因此共有 50×50=2 500 種。對於這前兩個字元的每一種可能性,第三個字元仍有 50 種選擇。假設每行有65個字元,第一行的內容共有50^65(50的65次方)種可能性。

這個數,很大。

假設想宇宙內的每個原子都變成一台獨立的印刷機,這樣就有 3×10^74 部機器同時工作。

再假定所有這些機器從地球誕生以來就一直在工作,即它們已經工作了 30 億年或 10^17 秒。你還可以假定這些機器都以原子振動的

頻率進行工作,也就是說,一秒鐘可以敲擊鍵盤10^15(假設有很多幽靈在地球誕生的時候就開始敲擊鍵盤...)。

那麼,到目前為止,這些機器印出的總行數大約是3×10^74×10^17×10^15=3×10^106,

這大概是第一行總內容的三千分之一。宇宙間的幽靈們連第一行所有可能的組合都沒有打出來呢,更別說第二行所有的可能了。

所以在這些自動印出的東西裡面挑選點什麼,那確實得花費非常非常長的時間了!

Reference

1.從一到無窮大.G.伽莫夫。


是時候告訴你們真相了,那些網上的小學生穿越文黑道演義瑪麗蘇都是隨機敲鍵盤敲出來


那要看你的讀者有沒有強大的腦補功能


有個經典概率問題叫猴子隨機打字 第一次打出莎士比亞羅密歐與朱麗葉中一句話「o"romeo romeo」所需期望時長 答案是26^11+26^6+26^1,用martingale可以很容易解


這個可能性是有的。

伽莫夫的《從一到無窮大》這本書里提到過相類似的情況。


分頁阅读: 1 2