行銷知識庫

Canonical URL 標準網址是什麼?避免重複網頁的 SEO 索引優化方法

2023-01-29

canonical seo

你可能經常聽到 SEO 公司建議要在網頁的 head 裡加入 rel=canonical 標記,那麼加入這個 Canoical 的標記對於 SEO 有什麼樣的幫助呢?

什麼是標準網址 Canonical URL?

Canonical URL 的意思為假設你有一個網頁多個網址會呈現相同的網頁內容,那麼 Google 會自動選擇一個「標準網址」來代表這些不同網址並且顯示在搜尋結果頁 (SERP) 上,目的是為了要避免重複的索引相同的網頁,更可以有效的利用檢索資源,因此設定好 Canonical 標記在 Technical SEO 技巧中是一個必要的操作。

舉例來說你的網站可能有網址 https://inboundmarketing.com.tw/seohttps://inboundmarketing.com.tw/?p=2702 兩個不同網址,Google 會自動選擇這兩者之一為標準網址 (Canonical URL),但你可能想指定某一個與 Google 自動選取不同的網址做顯示時,你就得使用 rel=canonical 標記來告訴 Google 你的選擇。

<head>
  <link rel="canonical" href="https://inboundmarketing.com.tw/seo" />
</head>

如此一來 Google 便會認定 https://inboundmarketing.com.tw/seo 這個網址為標準網址,而非 https://inboundmarketing.com.tw/?p=2702 為標準網址。最後你可以透過 Google Search Console 提供的網址檢查工具來判斷 Google 認定哪個網址才是標準網址。

Google 會自動選擇一個標準網址

Google 會根據哪些因素選擇標準網址 Canonical URL 跟搜尋結果網頁?

Google 會根據許多因素選擇標準網址,例如:

  • 網頁是否安裝有效的 SSL 憑證,並且沒有錯誤的 HTTPS 相依性
  • 重複的網頁之間網頁品質內容好壞高低的比較
  • 在 Sitemap 中提供網址會被 Google 優先考量為標準網址
  • 是否有在 head 或是 HTTP 標頭加上 rel=canonical 標記
  • 使用者所使用的裝置、語言…等各種使用者端的偏好

你可以利用這些方式引導 Google 選擇標準網頁,但 Google 仍然可能會因為各種原因選擇其他網頁作為標準網頁。例如說行動版網站與電腦版網頁內容相同但網址不同時,使用者在行動裝置搜尋的情況下,即使電腦版網頁是標準網址,但 Google 可能會提供行動版本作為搜尋結果的連結。

什麼時候該使用標準網址標記 rel=canonical?

優化你的網站索引速度

建議在網頁完成時就加上 Canonical 標記,理由是如果你不設定這個標記,會導致 Google 需要花費更多的索引時間來判斷你的網頁中哪些雖然是不同網址但內容是重複的。當網頁完成時就指定好標準網址,可以讓 Googlebot 在檢索網站時盡量把時間用在檢索有用的內容,而不是去檢索那些重複的內容,這樣一來索引速度便會得到優化。

你的網站依賴於網址參數顯示網頁內容

網站廠商在製作網站時可能會依賴網址參數顯示不同的網頁內容,例如像是透過 /blog.php?id=999 這樣的形式,藉由不同的 id 參數顯示不同的部落格文章內容。要注意的是因為網址的參數理論上是可以無限增加的,而增加這些”非指定”的額外網址參數並不會影響網頁內容的呈現,例如原本的 /blog.php?id=999 再加上 another 參數變為 /blog.php?id=999&another=value 時,如果網站內容並沒有依賴 another 這個參數顯示網站內容的話,這就會導致有 another 跟沒有 another 這個參數的網頁內容一模ㄧ樣。這時你就會需要 rel=canonical 標記來指定一個唯一的標準網址,避免 Google 認定這是兩個不同的網頁。

整合數位行銷追蹤、數位廣告投放網址的參數網址

對於數位行銷人員來說追蹤行銷成效最常見的手法便是在網址後方加上 utm 參數或是在投放 Google 廣告時帶入自動參數 gclid,這樣一來你的網址很有可能會變成 https://inboundmarketing.com.tw/seo?utm_source=google&utm_medium=cpc&utm_term=seo 這樣的網址散佈在網路上的各個角落,因為這些參數都是追蹤用的參數,並不影響網頁的內容呈現,自然 Google 在網路上存取這些連結內容時會判定為重複內容。假如你沒有加上 rel=canonical 標記的話,很有可能 Google 會選擇這些加上參數的追蹤網址做為標準網址呈現在搜尋結果頁上,想當然這會導致追蹤失準,對於數位行銷成效追蹤造成很大的影響。

避免公關媒體稿件搶走你的網站排名

從公關媒體行銷的角度,無可避免的經常會有一稿多發的情形。此時如果稿件刊載的網頁內沒有指定 rel=canonical 指向你的主要網站文章時,很有可能會被 Google 判定為重複內容,此時 Google 可能會將媒體平台的網頁選擇為「標準網址」,那麼你的網頁很有可能就不會出現在搜尋結果中。因此當有一稿多發的情形時,記得要請對方在網頁上設定 rel=canonical 指向你的原始文章出處,這樣才不會發生網站排名被搶走的情形。要注意既使在文內標註原文出處對於 Google 來說這不是選擇標準網址的依據,僅能在法律上作為著作權保護而已。

選用 Canonical URL 標準網址的注意事項有哪些?

由於在服務客戶時我們發現標準網址的使用仍然有些細節是需要另外解釋,因此我們整理了使用標準網址上可能會遇到的常見問題跟常見錯誤。

使用絕對網址指向標準網址而非相對網址

對於 Googlebot 來說,Canonical 標記內容應該要是絕對網址 (即 http 或 https 開頭),不該是相對路徑。

正確示範:<link rel="canonical" href="https://inboundmarketing.com.tw/seo" />
錯誤示範:<link rel="canonical” href="/seo" />

使用 rel=”canonical” HTTP 標頭處理非 HTML 內容

除了將 rel=canonical 標記加入在 HTML 的 head 裡以外,你可能會遭遇到非 HTML 內容的情形 (例如 PDF),那麼你可以將 rel=canonical 加入在 HTTP 標頭中,標頭內容如下面所示:

Link: <https://www.inboundmarketing.com.tw/downloads/white-paper.pdf>; rel="canonical"

網址更換時應使用 301 重新導向

如果你有網址更換的情形,那麼你應該要使用 301 導向告訴 Google 你的標準網址已更換,否則你很有可能會在 Google Search Console 看到「網頁未編入索引:這是重複網頁;Google 選擇的標準網頁和使用者的選擇不同」這樣的錯誤提示。

Google Search Console 會標記出重複內容的網址

Google 比起 HTTP 網址,偏好使用 HTTPS 網址做為標準網址

如果你的網站同時提供 HTTP 與 HTTPS 兩種形式的網址,Google 會偏好選擇 HTTPS 的網址作為標準網址。不過當你的 HTTPS 網頁內容含有無效的 SSL 憑證或是有不安全的相依關係時 Google 則不會選擇 HTTPS 作為標準網址。

Canonical URL 參考文章

上一篇
【成功案例】韓國第一傢俱品牌-分眾行銷策略、扭轉折扣形象!
下一篇
經驗談分享,SEO 關鍵字搜尋引擎優化的幾大地雷