如何優雅的生成(SITEMAP)網站地圖

第一次在知乎寫這樣的文字,想想還是挺激動的哎!

現在回到題目《如何優雅的生成(SITEMAP)網站地圖?》,首先關注優雅兩字,要知道如果不是通過網站程序自己生成的網站地圖,要使用三方工具生成網站地圖,不幸的是,遇到哪種經營很長時間的的網站,是非常耗費世間的事。

關鍵點到了,一個頁面老是一直載入,長時間不動的話,真擔心瀏覽器突然掛掉,萬一在等待網站地圖文件的過程中,被拉閘了斷電,真要命,emmmm。所以,生成網站地圖應該要支持斷點恢復這個功能吧。

對於一個鏈接幾百萬的網站,所有的數據也是巨大的,如果用伺服器來處理所有的鏈接,然後返回給頁面,這也不可取,誰知道你在用的時間,還有多少個用戶又在用呢?

HTML 5 的IndexedDB 這API給了運營者一個大大的福音,通過B/S結構的軟體,實現了C/S結構軟體的功能。

使用java、python、php這樣的語言來處理頁面,獲取當前頁面的鏈接,然後數據對比、儲存就交給前台,有效的降低了伺服器壓力,還能實現真正的獲取全站鏈接。

對於用戶來講,生成網站地圖應該要簡單,所以這將所有處理的邏輯交給了開發人員。

我在做sitemap網站地圖免費生成工具 (sitemap.webkk.net)這個網站之前,也是普通用戶,有時有也需要生成網站地圖,使用其他三方工具的過程中發現,使用在線工具,如果不給錢,就只能抓取有限的幾百個鏈接,但是又拒絕下載離線工具。

前面說了那麼多,這就是為什麼我敢開放抓取全站鏈接的原因。

使用方式:

一、選擇網站的HTTP協議;

二、鍵入網址;

三、選擇頁面編碼方式;

然後點擊開始抓取,需要注意的是,生成的過程中,支持暫停,或者關閉瀏覽器,下次繼續從上次暫停的位置抓取。這對於網站鏈接較多,生成過慢有很大的幫助。當然,如果你不小心刪除了生成的網站地圖,那麼第二次抓取就非常快速了,只要你不勾選更新數據。

最後,下載相應格式的網站地圖文件,然後處理。

推薦閱讀:

必須知道的網站地圖製作方法

TAG:網站運營 | Sitemap | 網站建設 |