英語單詞26個首字母出現概率各是多少?
我發現C和S為首字母的英文單詞比較多,而X Z就相對較少 這有沒有特殊的原因?有沒有人為首字母出現概率做過統計?
我來統計一下吧,剛統計了個字母在單詞和文本中出來的概況,又看到你這問題,我統計的樣本為92518個單詞,統計工具是Mathematica,版本號如下:
In[32]:= $Version
Out[32]= 10.2.0 for Microsoft Windows (64-bit) (August 30, 2015)
統計的單詞個和數量:
words = DictionaryLookup[{"English", "*"}];
In[66]:= words//Length
Out[66]= 92518
計數代碼為
sort=CountsBy[word, Characters[#][[1]] ] //
KeySelect[#, MemberQ[Alphabet[], #] ] // Sort
&<|"x" -&> 19, "z" -&> 137, "y" -&> 248, "q" -&> 412, "k" -&> 577,
"j" -&> 711, "v" -&> 1206, "n" -&> 1698, "o" -&> 2104, "w" -&> 2205,
"l" -&> 2392, "u" -&> 2561, "g" -&> 2626, "h" -&> 2954, "e" -&> 3244,
"i" -&> 3357, "f" -&> 3446, "t" -&> 4160, "m" -&> 4196, "a" -&> 4500,
"b" -&> 4724, "r" -&> 5143, "d" -&> 5198, "p" -&> 6559, "c" -&> 7831,
"s" -&> 9599|&>
為了看得比較明顯,下面對結果進行可視化,代碼為:
BarChart[sort,
ChartLabels -&>
Placed[Keys[sort] // Style[#, 20, Red] /@ # , Above],
ChartElementFunction -&> "GlassRectangle", ChartStyle -&> "Pastel"]
推薦閱讀:
※「猥瑣」一詞用哪個英文才能地道表達?
※非英語專業,想要跨專業考英語專業,翻譯,需要做什麼準備?比如學習資料,教材,可不可以給推薦一下?
※男神/女神用英文怎麼講?
※英語 26 個字母排序的來源/依據是什麼?
※為什麼不幹脆以英語為母語?