如何完整離線保存網頁,包括網頁完整特效?
保存下來的頁面總是有部分特效缺失,可是文件包里已經有好幾個js文件了。
例如想保存易迅的搜索頁面,條件篩選欄的按鈕全部失效了,按鈕-更多、多選等 都沒有反應,搜索結果的滑鼠懸浮顯示完整信息也沒有了。
一般很多圖片是在css里的,部分圖片隱藏在js里,根據網站架構都會不同,要想完全一樣保存下來,還是比較費事的。
如果是含金量高的站,就算給你看到代碼,也不一定能保存下來。不是太複雜的架構的,可以從CSS和JS文件中找切入點。不要直接保存,可能會很亂,最好篩選排除。只建議學習好的css,js,取得重要的部分和文件學習,不建議直接完全複製拷貝。容易出錯。pocket(可離線。要賬號。有時會抓取錯誤)
keep(只有文字沒有圖)evernote(選項多,但閱讀,添加和管理無法離線。要賬號。不能保存豆丁、百度文檔裡面的內容)列印為pdf(格式有變化,圖片可能缺損。不能保存豆丁、百度文檔裡面的內容)另存為html(有些網站,比如豆丁文檔也可以完整保存,列印為pdf則不能。缺點是一個網頁文件一個文件夾,看著難受。)接下來是我的解決方案:
chrome插件SingleFile:Single File和SingleFile Core,兩個都要裝。保存為網頁htm格式,一個文件,可以保存豆丁文檔,可以離線。基本完美。安裝插件後務必重啟瀏覽器。有一點要注意的:如果你查看的豆丁或百度文庫有好多頁,務必要讓所有頁都顯示過一次,再使用single file,才能完全保存。否則離線的時候只能看到你看過的頁面。已測試。缺點:無法雲同步。2016.7更新:
剛剛發現在Chrome地址欄中輸入
chrome://flags
,可以看到一些實驗功能,其中包含了將網頁保存為.mhtml格式開關,開啟後重啟Chrome,ctrl+s開啟的保存窗口中就多出了一種保存為.mhtml的選項,也即將網頁保存為單一文件。在 Chrome 地址欄中鍵入「chrome://flags」,回車,這是一個 Chrome 的功能配置頁面,項目比較多,我們通過 Ctrl+F 來搜索「mhtml」,找到「將網頁另存為 MHTML」這一項,然後點擊下方的「啟用」即可。
此時打開任一網頁,右擊「另存為」,將默認保存為.mhtml文件,即mht文件。
來源:Chrome保存mht網頁文件的方法
文章保存備份工作是非常重要的,萬一哪天平台就給你刪除了呢?(以往的博客,曾經的雲盤,現在的微博,此刻的知乎······哪一個不是一樣)現在的互聯網,誰都不能信,只能信自己。以我自己的專欄文章為例。不要用什麼Pocket和印象筆記來備份,這種方式備份無法解決問題。
今天講一種PDF和網頁備份兩者結合保存備份的方式,這種方式較以上方式或其它方式更加完美,因為PDF的圖片無法完美導出,而網頁保存的方式可以直接將所有圖片導出,兩者結合起來備份幾乎完美。目前來看,我認為網頁列印PDF保存+網頁直接保存是目前最便捷也是最好的方式之一,肯定有更完美的方式,但對大多數人來說,這更便捷。
Ctrl+P就搞定了,如圖所示(已經有人講過了,但貌似講得太長,本就是幾張圖的問題)Ctrl+P網頁列印PDF保存方式網頁直接保存使用chrome插件:FireShot,不僅支持區域截圖,還支持完整的長網頁截圖。
如下圖:
LZ不用問了,不是所有的網頁都能做到的,部分內容是在伺服器上,滑鼠操作才讀取,或者根本就是動畫流
火狐上有個unmht,目前我試過幾款中效果最理想的
推薦用這個工具:TELEPORT PRO 漢化版。可以把整個網頁(HTML ,css js 圖片等)和各層鏈接網頁都抓下來保存,可以離線看。
firefox瀏覽器中可使用以下插件解決離線保存網頁:1. ScrapBook Plus 保存為html文件2. Mozilla Archive Format 保存為maff格式的單一文件當然了,還有各種插件可以在html,maff,chm,pdf等多種格式間相互轉換.
用好一些的存檔格式,例如過去的mht,firefox用的一個插件格式maff,這系列格式相當如把頁面最終實現給保存下來的。
1. 虛擬列印為PDF格式,可以保存靜態內容。
2. 使用Scrapbook等快照軟體,可以重現部分JavaScript功能。
3. 保存為MHTML格式,可以重現部分JavaScript功能。
(還有Firefox專用的MAFF格式)
4. 如果希望100%重現,那麼最好使用錄屏軟體進行錄像。
為什麼網頁保存軟體或插件都需要重新排版? - multiple1902 的回答要實現完整保存全部特效恐怕很困難。要把頁面保存成靜態,較好地還原看到的效果的話,最好的是scrapbook。
知乎專欄似乎不能使用ie保存為mht,儘管保存文件很大
推薦閱讀:
※如何把禁止複製和列印的網頁上的文字存儲下來?
※github 上的 jquery-master 都是用了什麼技術,怎麼裡面這麼多文件呀?
※為什麼zrender如此優秀的類庫,沒有文檔?
※請問echarts-x的基礎配置要怎麼設置,需要在伺服器運行嗎?
※前端規範,HTML的<head>標籤內<meta>、<title>等標籤順序是怎樣的?