C++解析Word、Excel、PPT、PDF等格式的文件用什麼庫?

另外如果只需要文字的話,可以跟我聯繫,我正在寫解析文字的代碼。


在裝有Office的電腦上,都有現成的COM給你用來操作word、excel和ppt。2013版本的word可以操作PDF。


我也想找,有office的可以用com, 沒裝的比較麻煩,有一個叫all2txt的工具,可以抓取其中的文字


裝一個office,然後有COM介面去掉用,讓office給你去處理。


推薦閱讀:

自然語言處理方向值得讀博士么?
用卷積神經網路做情感分析時(句子級),為什麼輸入向量可以隨機初始化,在訓練的時候調整?
希望推薦一本自然語言處理專業需要精讀的著作?
自然語言處理中的語義到底是個什麼概念?語義分析是要分析出什麼結果?
自然語言處理(NLP)和計算語言學之間的區別和聯繫是什麼?

TAG:文件格式 | 自然語言處理 | 文本挖掘 | C |