如何將文字【無重複】【按筆劃】重排?

其實重點在於【無重複】,筆劃為附加項,不按筆劃也可。WORD文檔中有一定文字,如

「我的鋼筆是紅色的,是我弟弟送給我的AAB112233。。。,。;」

排列後為

「,。;123AB我的鋼筆是紅色弟送給」

WORD如何實現?實現不了的話,LaTeX?或者其他方法?


下載Unihan.txt,用C#寫個程序讀懂裡面的內容,然後做成word插件。


設你會寫程序。

1 無重複輸出。

1.1 能按編碼讀漢字文本的技術

1.2 選擇隨便一種數據結構,能保證元素唯一就行。

1.3 將文本讀取到數據結構。

1.4 輸出容器元素。

2 按筆畫輸出。

2.1 上網找資源,知道字和筆畫之間的映射關係。

2.2 將文本讀取到容器中。該容器支持元素唯一及排序,

2.3 將容器中元素按筆畫排序。

2.4 排序。

3 編輯word

這個需要查詢你選擇的語言是否有類庫支持

2.1 未知,其他估計大部分語言都很容易實現。


看文字量

對於電腦而言,小量(幾千字)和微量(幾十字)是無差別的,

但是幾千萬字,就要考慮效率問題了。

給你個不考慮效率的解答,並且是易於實現的,因為我居然都會。

不幫助完整實現。

vba提取到A列,一單元格一個字,B列放對應筆畫(應該有現成vba)

A列刪除重複項,B列排序,

導出完成。

最大容量看office版本,10-13-16支持一百萬行,按以上方法,也就是可以處理一百萬字(含符號)

03-07建議卸載,wps建議重裝系統。


我來歪個樓。

有很多字的筆畫順序各地不一樣的你造嗎 #(滑稽) 有些你還不一定會正確的筆畫組成喲 #(滑稽)

你想採用哪一種標準呢~

心 必 忄 左 右 凹 凸 戈 車 軋 毌 田 北 兆 非

參見維基百科 筆順

歪回來

只是字元不重複的話……就是基礎的渣渣程序吧……

開一個數組表示某字元出現過沒有(Unicode基礎65536個,包括擴展也就65536*17個位置),有就設置為1,再出現還是設置為1,最後從前往後看哪些是1就完了……


給個python的參考吧

http://www.pythonclub.org/python-basic/chinese-sort


推薦閱讀:

怎樣學會使用Word頁碼、樣式、目錄?
新建office文檔的默認文件名可以被設置成其它名稱嗎?
為什麼 word2016 改不了默認的「等線」字體?
word2013種如何插入代碼著色的代碼塊?
Word章節附註參考文獻里分隔符不能用,怎麼回事?

TAG:排版 | MicrosoftWord | 中文排版 |