英語單詞26個首字母出現概率各是多少?

我發現C和S為首字母的英文單詞比較多,而X Z就相對較少 這有沒有特殊的原因?有沒有人為首字母出現概率做過統計?


我來統計一下吧,剛統計了個字母在單詞和文本中出來的概況,又看到你這問題,我統計的樣本為92518個單詞,統計工具是Mathematica,版本號如下:

In[32]:= $Version
Out[32]= 10.2.0 for Microsoft Windows (64-bit) (August 30, 2015)

統計的單詞個和數量:

words = DictionaryLookup[{"English", "*"}];
In[66]:= words//Length
Out[66]= 92518

計數代碼為

sort=CountsBy[word, Characters[#][[1]] ] //
KeySelect[#, MemberQ[Alphabet[], #] ] // Sort

結果如下:

&<|"x" -&> 19, "z" -&> 137, "y" -&> 248, "q" -&> 412, "k" -&> 577,
"j" -&> 711, "v" -&> 1206, "n" -&> 1698, "o" -&> 2104, "w" -&> 2205,
"l" -&> 2392, "u" -&> 2561, "g" -&> 2626, "h" -&> 2954, "e" -&> 3244,
"i" -&> 3357, "f" -&> 3446, "t" -&> 4160, "m" -&> 4196, "a" -&> 4500,
"b" -&> 4724, "r" -&> 5143, "d" -&> 5198, "p" -&> 6559, "c" -&> 7831,
"s" -&> 9599|&>

為了看得比較明顯,下面對結果進行可視化,代碼為:

BarChart[sort,
ChartLabels -&>
Placed[Keys[sort] // Style[#, 20, Red] /@ # , Above],
ChartElementFunction -&> "GlassRectangle", ChartStyle -&> "Pastel"]

我們可以看到s、c、p開頭的單詞還是挺多的


推薦閱讀:

「猥瑣」一詞用哪個英文才能地道表達?
非英語專業,想要跨專業考英語專業,翻譯,需要做什麼準備?比如學習資料,教材,可不可以給推薦一下?
男神/女神用英文怎麼講?
英語 26 個字母排序的來源/依據是什麼?
為什麼不幹脆以英語為母語?

TAG:英語 | 數學 | 概率 | 字母頻率 | 英文字母 |