為什麼word文檔會比txt文檔大?

同樣的內容,又沒有什麼排版,word文檔比txt文檔大的這些容量都用來儲存什麼了呢?


你可以吧擴展名從docx改為zip,然後解壓出來看看,就明白了。

程序員的話可以轉:https://msdn.microsoft.com/zh-cn/openspecifications/gg482163

這是微軟所有協議的spec,巨詳細,再也不用逆向docx文件了。


doc 格式不了解,貌似沒有公開技術規範

docx 格式的規範公開了,它就是一個zip文件,解壓後會得到一串串 xml 文件,有文件專門設定風格,其中 document.xml 是文件的正文(描述)。

比如,一段 txt 可能是:

這是一段txt文本。

在 docx 里,它是這樣的:

&
&
&&&
&

&
&&&
&這是一段txt文本。&
&

&

可以看到 docx 里除正文之外,還包括很多描述信息,可能比正文本身(純文本形式)還要大,甚至即使經過zip壓縮也沒法變得更小。


就是用zip做了個壓縮包,你把後綴名改成zip就能看見了,都是XML。

具體可以上微軟的網站下載說明文檔,不過都是英文。


用txt打開word可以比較么?


word是有格式的,比txt多出來的就是格式部分,比如字體,字的顏色,版式


推薦閱讀:

在github上弄一個vscode說明文檔的翻譯項目,集大家的力量完成,這麼做是否有意義?
有沒有可以內置tex公式編輯且能將文本轉成pdf的markdown編輯器?
Adobe Photoshop 里文字編輯時能否自動換行?
如何編輯PDF格式文檔?
如何寫一個美觀漂亮的 Word 文檔?

TAG:計算機 | MicrosoftWord | 文檔 |