把文字從PDF里複製word, 怎麼有效消除每行末尾的換行空格?
01-09
現在需要整理大量的文獻,需要把文字從PDF裡面copy到word里。
有的PDF文件COPY到word裡面會自動換行,那就不存在這個問題。但是還是有大部分PDF文件copy到word里沒法自動換行,之前題主會手動刪除換行空格。偶爾這樣可以,但是如果一天得整理幾百篇pdf文獻就要爆炸了。。。基本的workflow是:1. 選擇PDF中的文字
2.COPY (ctrl+C)3. 選中word中要插入的位置4. PASTE (ctrl+V)Example:a. PDF中的段落b. copy到word中出現的結果,可見每行都沒有連續起來,或者可以說每行都稱為了一個段落:c. 想達到的消除換行空格效果是:問: 除了一行一行手動刪除,有沒有什麼更有效的方法?題主現在暫時找到一個網站: Remove Line Breaks Online Tool
但是得要先把pdf東西複製到網站上,去掉空格再複製到word里,也很麻煩。 而且這個網站會把真正的換行符也當做空格刪掉,甚是頭疼。。。。求更優解謝謝!
方法很多,安裝 2013 以上的 Word,直接打開 PDF,自動識別段落,隨便複製。
裝個 Acrobat 也行,也是自動識別段落,隨便複製。
你什麼都不想裝的話,那就直接複製到 Word 里,然後選中這段支離破碎的內容,然後按 Ctrl + H,打開替換對話框,把 ^p 全部替換成 空格 即可。哈哈 混跡知乎終於找到一個能答上的問題
其實這個問題我已經在博客寫過了,詳細的點進去看吧,就是錄製宏之後進行了代碼調試修改:[源碼]文本從PDF等粘貼到WORD中,智能刪除多餘的空格和回車_Endlesswx_新浪博客博客里有動態效果圖,這裡貌似只能jpg,就不上了以下僅貼出源碼(如果不知道怎麼用請戳上面的網址,懶得再寫了。。)
Sub 粘貼並替換空格和回車()Dim Flag As Integer
"粘貼並選中
startpos = Selection.Start" Selection.Paste "普通粘貼Selection.PasteAndFormat (wdFormatPlainText) "粘貼為文本
Selection.Start = startposWith Selection.Find
.text = "[ ^s]" "括弧里依次:半形空格、全形空格、^s指不間斷空格(注意^w:空白區域不能選擇全形空格) .Replacement.text = "" .MatchWildcards = True "使用通配符 .Execute Replace:=wdReplaceAll End With"先將多個回車並為一個
With Selection.Find.text = "^13{2,}"
.Replacement.text = "^p" .MatchWildcards = True "使用通配符 .Wrap = wdFindStop "把 .Wrap = wdFindAsk 改成 .Wrap = wdFindStop對應於「是否搜索其餘部分」中的「否」 .Execute Replace:=wdReplaceAll End With"主要針對最後是兩個回車的特殊情況這種特殊情況下,替換後少選擇一位字元,影響後續操作
If Selection.text Like "*[!。??!!」:;]" Chr(13) Then Flag = 1 End If"再將前面不是句號的回車刪除
With Selection.Find .text = "([!。??!!」:;])^13" .Replacement.text = "1" .MatchWildcards = True "使用通配符 .Wrap = wdFindStop "把 .Wrap = wdFindAsk 改成 .Wrap = wdFindStop對應於「是否搜索其餘部分」中的「否」 .Execute Replace:=wdReplaceAll End WithIf Flag Then
Selection.MoveLeft unit:=wdCharacter, Count:=-1, Extend:=wdExtend "取消選定最後一個回車符End If
"清除替換的內容 Selection.Find.Replacement.text = ""End Sub最好的方法當然是錄製一段查找替換空格和換行符的宏啦。我一直都這麼做的
推薦閱讀:
※製作網站,如何實現PDF文件在線瀏覽,而又避免下載?
※如何將一個網站完整地下載下來並打包為 pdf 格式?
※只是用來看pdf的大屏安卓平板有什麼推薦?
※有沒有圖片轉文字的免費軟體?
TAG:複製 | PDF | MicrosoftOffice | MicrosoftWord | Word文檔處理 |