發表于:2009-05-28 00:00:00來源:網絡人氣:4247
什么是網址規范化? 我們可以反過來想,簡單點說就是內容相同但URL不一樣的網址為不規范化網址。
不規范化網址代來的問題是:
1.多個URL存在分散了頁面權重,不利于排名。
2.對搜索引擎來說是浪費資源,浪費帶寬。
3.搜索引擎發現多個網址內容相同時,雖然不會懲罰,但是它根據自己的算法找出自己認為是規范化的網址,但這通常和我們希望的網址不同。
4.如果網站上網址規范化問題非常嚴重,那是會影響收錄,甚至也有被懲罰的可能。
下面有一些常規的處理辦法:
1.用301轉向,把不規范化URL全部轉向到規范化URL
2.在提交給搜索引擎的網站地圖中全部指定規范化網址
3.在Google管理員工具中設置帶wwW和不帶wwW的,哪一個是規范化版本
4.確保使用系統只產生規范化網址
5.確保網站上所有內部鏈接都指向規范化網址
但這些方法都有一些這樣或那樣的問題,要不就是只適合google,或由于權限問題比如像301轉向這些根本無法設置,程序設置大部分站長估計也都頭痛的說,不過現在有個好消息是,Google,雅虎,微軟共同發布了一個新的標簽canonical tag,專門用于解決網址規范化問題:
其實就是在HTML文件的頭部加上這樣一段代碼:
<link rel="canonical" />
意思就是這個網頁的規范化網址應該是:
http://www.example.com/product.php?item=swedish-fish
下面這些URL都可以加上這段代碼:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
這些URL的真正規范化網址就都成為:
http://www.example.com/product.php?item=swedish-fish
這個標簽相當是一個頁面內的301轉向,只是用戶并不被轉向,還是停留在不變網址上,而搜索引擎會把它當作是301轉向處理,也就是說把頁面鏈接的權重都集中到代碼中指明的規范化網址上了,是不是很爽啊,呵呵。
不過,有幾個細節還是需要注意一下:
1.這個標簽只是一種建議或暗示,所以搜索引擎會并不是百分之百的按這個代碼來做
,還是會考慮其他情況來判斷規范化網址。
2.這段代碼既可以使用絕對地址,也可以使用相對地址。
3.指定的規范化網址上的內容,與其他使用這段代碼的非規范化網址內容可以有一些不同,不一定完全一樣。
4.指定的規范化網址可以是不存在頁面,返回404,也可以是還沒有被收錄的頁面。
5.這個標簽適用于同一個域名內,包括二級域名。
6.這個標簽不是救命草,重要的還是得把網站結構做好,避免出現URL規范化問題。
這個標準被3大搜索引擎Google,雅虎,微軟同時支持,至于百度呢?還得在等等吧,希望可以快點也支持了。