URL的井號
去年9月,twitter改版。
一個顯著變化,就是URL加入了"#!"符號。比如,改版前的用戶主頁網址為
http://twitter.com/username
改版後,就變成了
http://twitter.com/#!/username
在我印象中,這是主流網站第一次將"#"大規模用於直接與用戶交互的關鍵URL中。這表明井號(Hash)的作用正在被重新認識。本文根據HttpWatch的文章,整理與井號有關的所有重要知識點。
一、#的涵義
#代表網頁中的一個位置。其右面的字元,就是該位置的標識符。比如,
http://www.example.com/index.html#print
就代表網頁index.html的print位置。瀏覽器讀取這個URL後,會自動將print位置滾動至可視區域。
為網頁位置指定標識符,有兩個方法。一是使用錨點,比如<a name="print"></a>,二是使用id屬性,比如<div id="print" >。
二、HTTP請求不包括#
#是用來指導瀏覽器動作的,對伺服器端完全無用。所以,HTTP請求中不包括#。
比如,訪問下面的網址,
http://www.example.com/index.html#print
瀏覽器實際發出的請求是這樣的:
GET /index.html HTTP/1.1
Host: http://www.example.com
可以看到,只是請求index.html,根本沒有"#print"的部分。
三、#後的字元
在第一個#後面出現的任何字元,都會被瀏覽器解讀為位置標識符。這意味著,這些字元都不會被發送到伺服器端。
比如,下面URL的原意是指定一個顏色值:
http://www.example.com/?color=#fff
但是,瀏覽器實際發出的請求是:
GET /?color= HTTP/1.1
Host: http://www.example.com
可以看到,"#fff"被省略了。只有將#轉碼為%23,瀏覽器才會將其作為實義字元處理。也就是說,上面的網址應該被寫成:
http://example.com/?color=%23fff
四、改變#不觸髮網頁重載
單單改變#後的部分,瀏覽器只會滾動到相應位置,不會重新載入網頁。
比如,從
http://www.example.com/index.html#location1
改成
http://www.example.com/index.html#location2
瀏覽器不會重新向伺服器請求index.html。
五、改變#會改變瀏覽器的訪問歷史
每一次改變#後的部分,都會在瀏覽器的訪問歷史中增加一個記錄,使用"後退"按鈕,就可以回到上一個位置。
這對於ajax應用程序特別有用,可以用不同的#值,表示不同的訪問狀態,然後向用戶給出可以訪問某個狀態的鏈接。
值得注意的是,上述規則對IE 6和IE 7不成立,它們不會因為#的改變而增加歷史記錄。
六、window.location.hash讀取#值
window.location.hash這個屬性可讀可寫。讀取時,可以用來判斷網頁狀態是否改變;寫入時,則會在不重載網頁的前提下,創造一條訪問歷史記錄。
七、onhashchange事件
這是一個HTML 5新增的事件,當#值發生變化時,就會觸發這個事件。IE8+、Firefox 3.6+、Chrome 5+、Safari 4.0+支持該事件。
它的使用方法有三種:
window.onhashchange = func;
<body onhashchange="func();">
window.addEventListener("hashchange", func, false);
對於不支持onhashchange的瀏覽器,可以用setInterval監控location.hash的變化。
八、Google抓取#的機制
默認情況下,Google的網路蜘蛛忽視URL的#部分。
但是,Google還規定,如果你希望Ajax生成的內容被瀏覽引擎讀取,那麼URL中可以使用"#!",Google會自動將其後面的內容轉成查詢字元串_escaped_fragment_的值。
比如,Google發現新版twitter的URL如下:
http://twitter.com/#!/username
就會自動抓取另一個URL:
http://twitter.com/?_escaped_fragment_=/username
通過這種機制,Google就可以索引動態的Ajax內容。
(完)
推薦閱讀:
※網頁怎麼加鏈接
※墨子學院講解URL規範到底是怎麼回事
※【SEO大拿分享】網站更換域名務必要注意這六點
※深情一眼摯愛萬年,我們從URL走到頁面
※Scrapy容易忽略嚴重錯誤,start_url 必須是列表