怎樣導出搜狗詞庫到文本?不要加密的
現在高版本的搜狗輸入法不支持導出文本了。只能導出加密的bin文件,如果把這個bin文件導入到低版本的搜狗輸入法也不成功,版本不同,不支持導入。
2015-03-27更新:據知友反映以下方法已經失效,不知道具體原因,不知是否個例。如果嘗試後有成功或失敗的朋友還請在評論中留言告知。我自己重試了一遍以下步驟仍是可行的(環境:Win8.1 x64,安裝過最新版搜狗輸入法,卸載後安裝的7.1版)。
2015-03-25更新:補一下深藍詞庫轉換工具2.0版的下載地址。作者把軟體託管到了Google Project Hosting,這是官方的下載地址:imewlconverter - IME Words Library Converter/深藍詞庫轉換
但是鑒於牆的存在,我將其轉到了牆內百度雲,這是下載地址:imewlconverter.rar_免費高速下載在此感謝一下作者「深藍studyzy」(http://weibo.com/studyzy ) 作者博客:深藍 - 博客園以下是原帖:
========================
剛才自己Google了一下,找到一種方法,在這裡詳細說一下。由於前段時間換了新系統,自己裝的當時的最新版搜狗輸入法,安裝後就把更新設置為不更新,版本號7.4。(之前的系統一直禁止更新,使用的6.x的版本,我發現7.4跟之前的舊版本相比,不僅沒有多少「好」的更新,反而加了一堆沒用甚至噁心的功能,比如什麼用戶徽章之類,還有這個建議用戶安裝搜狗瀏覽器的彈窗。之前對搜狗輸入法在彈窗設置方面的感覺還是不錯的,它都支持禁止彈窗再次出現,但是現在這個彈窗不僅沒法禁止還頻繁彈出。由於已刪且之前沒有刻意截圖,所以沒法給圖。由於沒法禁用、工作或思維總是被彈窗打斷,我感到非常氣憤,這是我被迫換輸入法的主要原因。 @徐揚 )================================1. 我打算換至谷歌輸入法,選擇原因在此不表,接下來要導出導入詞庫。首先搜到了一個叫「深藍詞庫轉換」的軟體,版本2.0,能支持很多種輸入法的詞庫轉換,還聲稱支持搜狗bin詞庫轉換,軟體界面如下圖: 2. 但是不幸的是,轉換失敗,說演算法溢出,再查網上,查到了軟體作者為這個軟體開的微博 (@深藍詞庫轉換_輸入法詞庫轉換 http://weibo.com/imewlconverter),微博給出如下說法:3. 於是按照作者的建議,網上搜7.1版搜狗輸入法,在新浪找到下載:
【Sogou搜狗拼音輸入法 7.1.0.1433/智慧版 2.0.3 下載】4. 下載後,先卸載現在的搜狗輸入法,然後按照7.1版,然後進入設置把用戶詞庫再同步一次。用戶詞庫在卸載的時候被刪除,需要同步一次才能保證完整導出。同步完成後導出詞庫。
5. 用深藍詞庫轉換工具轉換,這次就會很順利了。完。或許想避免彈窗,換回舊版也不失為一種選擇,但是換到哪個版本的舊版更好一些我不清楚,我也不知道7.1版會不會彈窗,即便不會彈了,也不想再用搜狗輸入法了,誰知道這個裡面藏了多少幺蛾子呢,只有開發者自己清楚。……目測sogou已經堵掉了高票回答這條路。
可惡,對於一個寫作者而言,詞庫的影響實在太大了……而搜狗的彈窗、卡頓實在是越來越叔叔可以忍嬸嬸不可以忍。但已經自斷臂卸載搜狗,用了全新輸入法,準備重新調教。最討厭被要挾。就如樓上各位說的,棄坑的理由千千萬,我也沒必要繼續吐槽,讓我逮到一次棄坑的機會,絕不回來。
上周五剛發現的辦法,已經導出,估計搜狗很快會封,樓主趕緊。
缺點是需要Mac一台,Mac版的搜狗輸入法還沒封堵。
準備工具
- Mac一台(對,這個沒有封堵的介面是Mac版的搜狗)
- 任意抓包工具,如Surge或Charles
- 還有牛比的深藍詞庫轉換工具
導出
打開搜狗輸入法,偏好設置,切換到同步頁面,如果已經登錄,先退出登陸。打開抓包工具(我這用Surge示例),清空當前記錄。
登陸後會觸發同步,看一下Surge里的連接。
找到這一條大小比較大的文件,sgim_usr.zip正是下載用戶詞庫,點擊Save As,保存為zip並解壓,得到sgim_usr_v1.bin,對,這就是未加密的用戶詞庫bin檔,跟windows版7.2之前一樣一樣的
轉換
打開上面提到的深藍詞庫轉換,導出之後就能隨便玩啦。
後話
話說就在六一兒童節當天,我下載下來的zip解壓還能直接得到明文的txt詞庫文件,待我寫好詞庫腳本轉換腳本,導入到rime之後,今天寫教程時就發現改成bin了,搜狗封的還是相當快啊。抱著試一試的心態,bin是未加密的,Mac端估計是還沒來得及寫加密bin的庫?看來程序員又要加班了,呵呵呵呵。
還是教你們閹割搜狗的辦法吧。打開搜狗安裝目錄。每個exe都打開一遍像什麼update啊,發現彈窗之類的exe直接刪掉。不會影響功能的。輸入法還是能正常使用。
鑒於搜狗太拽了。對不起,已棄坑。
1樓的 google code 不能用了。
輸入法詞庫轉換軟體,
作者轉移到 github 上去了。地址是:studyzy/imewlconverter
沒有了。
搜狗它加密自己的詞庫沒問題,但關鍵問題是把用戶的自定義詞庫也捆綁加密了。
用戶平時碼字少的不會有困惑,但越是有長期累積的自定義詞庫的用戶就越會遭受綁架。
方法一是繼續用搜狗跟它一起好下去或者爛下去,二是早早卸了換其他的。
用戶的自定義詞庫應該是屬於用戶自己的。
我剛剛測試了一下,原來安裝的是7.5的,卸載重裝的7.1的,可以導出來TXT版本,然後導入到其它的輸入法中就可以了,剛剛做完,沒問題
我想說樓上的方法好像不能用啊,換成7.1的版本,雲端的詞庫同步到本地以後也不被識別。。
最近被搜狗輸入法7.5彈窗搞的不勝其煩,看來只好用樓上這個方法了。
掛掉了,用老版本的搜狗輸入法,我推薦百度和QQ輸入法都可以導出不加密的詞庫
推薦閱讀:
※為什麼某些輸入法,總是要彈出各種廣告?而某些輸入法卻願意安安靜靜做一個小而美的工具?
※為什麼輸入法知道我長什麼樣?
※搜狗輸入法是如何盈利的?
※自 OS X Lion 起,你都在用什麼輸入法?
※如何在mac 中將第三方輸入法設為默認?