網站的整站抓取並存為pdf,chm方法
因為有些時候,我們希望把網頁的上的精彩資料保存下來。在我們不上網的情況下也能使用這些資料手冊。這時,我們想到把它們下載回來,並轉為其它我們可以方便瀏覽的格式。這裡講一下幾個軟體的使用,因為使用它們,你就可以很簡便的實現單個網頁以至整個網站的下載,並將它們存為pdf,chm格式。
此處下載網站http://www.cocos2d-x.org/reference/native-cpp/modules.html作為例子。
一、Adobe Acrobat 8 Professional
這個軟體本來是收費軟體,但是我們都是下載破解版的孩子。。下載回來,找個註冊機註冊一下,就可以了。這個強大工具,它不僅可以抓取網頁還可以實現pdf的編輯,合併,導出為word 格式等。這裡主要說一下它怎麼抓取。
1、你安裝完後,會看到下圖
2、你點擊創建pdf,然後選擇從網站創建pdf
3、從網頁創建pdf,需要輸入URL,即你要下載的網頁或網站地址。這裡獲取第幾層,說的是從這個網頁開始你要下挖掘的深度。當你獲取三層的時候,它已經會下載較多的資源並佔用較多的空間。(註:你設置僅獲取1層代表你要下載的是單個網頁,一般我們下載的是該網頁,及該網頁內所有超鏈接網頁,此時我們獲取2層)
4、創建後,你就可以獲得相應的pdf,你保存即可。因為它並不是下載回來就立即保存在本地的,所以如果中途軟體出現無法響應一類的錯誤時,你辛辛苦苦下載的pdf將要重新下載。所以下載兩層是比較好的選擇。你可以在下載回來以後再決定哪些頁面或者書籤需要追加鏈接到當前文檔里。
對某個書籤追加到下一層(只要單擊右鍵,即可看到選擇):
當然你也可以對某個頁面實行追加當前頁面的所有鏈接到下一層。找到該頁面。選擇菜單欄中的高級->網頁捕捉->追加頁面上的所有鏈接
5、你可以對你的pdf進行注釋,修改,刪除某些頁。這些操作都是比較簡單的,就不多說了。
6、到此,你就可以輕鬆的擁有自己的本地幫助文檔了。有時候它下載回來的頁面會有些變形不太好看,但是主要的東西,還是看的比較清楚的,而且它還會在抓取的時候,自動幫你編輯便簽,方便你的查看。效果圖如下:
二、WebZIP+htm2chm
1、它們兩都很好下載,在華軍軟體園一類就可以下載到了。下載回來,是可以直接使用的exe文件。
2、先用webzip把網站下載回來。打開webzip->文件->創建新工程->
按要求填寫完信息即可完成創建,按立即執行就會開始下載該網站。
當然,你也可以在後繼連接那裡設置跟蹤鏈接級別來決定你要下載的網站的大小,如果你想整站下載,就默認設置就可以了。你在下載的時候可以隨時暫停下載,而你已經下載的頁面和信息不會因為你的軟體出現問題而需要您自己重新下載。因為這個下載回來就是html,所以基本能保持網頁原貌。
現在你已經可以直接查看這個網站而不需要上網了,但是如果你的網站比較龐大,那麼用這個軟體進行查看會比較耗時間,準確來說就是它反應有點慢。
下面,我們把它製作成chm文件。
打開htm2chm.exe
編譯->設置編譯器(找到你要做主頁的頁面,其它信息會自動填寫,輸出處填寫的是你想把編輯好的chm輸出到哪個文件夾里)->開始
稍等一會,你就會得到你想要的chm文檔
你的讚賞是我堅持原創的動力
讚賞共 0 人讚賞推薦閱讀: