Chrome 瀏覽器是怎麼辨別除網頁上字與詞之間的間隔的?

當我們在網頁上看到一段文字,當我在文字上雙擊的時候,如果是前後能夠組成一個詞則會直接選中該詞,如果是單個字,就只會選中該字。比如:「很奇怪」,在「奇」上雙擊的時候會選中「奇怪」,而在「很」上雙擊的時候,只會選中「很」,系統是怎麼知道的呢?

ps:實例:當前網頁標題,「是怎麼」你點擊「是」的時候是先選中「是」,在點擊則選中整個句子;而點擊「怎」的時候是先選中「怎麼」,後選中整個句子的。這個貌似觸屏板比較好試哦……


Chrome是自己加了中文的分詞識別, 這個就是分詞表

http://src.chromium.org/viewvc/chrome/trunk/deps/third_party/icu38/source/data/brkitr/cc_cedict.txt

貼下注釋

This file contains the list of words derived from CC-CEDICT

http://www.mdbg.net/chindict/chindict.php?page=cedict


深入研究了一下這個有趣的功能,發現是IBM的ICU庫提供的,每個Chrome安裝文件夾下面都有一個icudt38.dll,這裡面包含了一份中文詞語表。基於CC-CEDICT那個版本

http://initiative.yo2.cn/archives/640309


你說的這個功能只有Chrome有吧,chrome是內置詞典和分詞的,雙擊的時候會自動選擇dict裡面的詞語,下一步你可以右鍵使用google搜索。這是chrome在細節上的創新


這個是用的ibm的icu庫,看看程序包裡面那個10多m的dll就是

chrome大量使用了第三方的源碼,很多是重量級的,比如icu這種

就是一個站在巨人肩膀上的巨人


我也發現了這個問題了,不過我第一反應是搜 google瀏覽器 中文分詞。結果就發現為什麼了。以前發現了,沒在意,後來自己做中文分詞的時候,就在想這特么沒道理啊。。。。。然後百度一下原來也是有分詞詞庫的


使用了內置詞表


這個功能應該是從word裡面學來的


很多詞測試的效果都不是很理想. 所以說它只是把非常常用的詞記錄了下來. 當你雙擊那些詞的時候, 自動選中.


那個網址?這個地址肯定有JS控制,瀏覽器只能做到標點符號之間的選中。或者有標籤之間的選中,例如 &< p &> &< /p &> 段選中, &< dd &> &< /dd &> 行選中 &< H &> &< /H &> 之類的。


推薦閱讀:

為什麼 Chrome 瀏覽器沒有「恢復上次關閉前瀏覽的頁面」的按鈕?
Chrome 怎麼才能直接拖拽鏈接後台打開新標籤?
google搜索用不了怎麼辦?
谷歌瀏覽器為什麼叫chrome?
為什麼我在 Chrome 瀏覽器里已經設置了通過打開新標籤頁來打開鏈接,可有的網站(如豆瓣和知乎)還是在原標籤頁上打開?

TAG:GoogleChrome | 分詞 |