只要在 Google 搜尋框輸入關鍵字,搜尋引擎就會提供我們8-10個相關的搜尋結果。但你知道搜尋引擎是如何決定這些頁面的排序方式嗎?如果想要讓自己的網站在搜尋結果頁有更多的曝光機會進而獲取流量,那就需要讓網站排名在前10名內。幫助網站提升排名就是 SEO 在做的事,不過首先得理解搜尋引擎的運作原理。
Table of Contents
Toggle當我們在 Google 上輸入關鍵字進行搜尋時,你可能會以為我們看到的是整個網際網路的所有頁面,但實際上我們只是在 Google 的資料庫中進行搜尋。網路上還是存在著許多搜尋引擎沒有找到或沒有收進資料庫的網頁,這些頁面我們都沒有辦法透過 Google 搜尋到。
而搜尋引擎的運作方式簡單來說就像是圖書館,圖書館管理員需要先發現書的存在,在檢視內容後決定值不值得放入圖書館,順利將書買回來以後還需要為其分類,當有讀者詢問時圖書館管理員就可以迅速找到對應的書籍並推薦給讀者。
將以上行為套用在搜尋引擎的運作時,也都有對應名的名稱:
又稱作檢索(Crawl),是爬蟲機器人在找到頁面並檢視內容的過程。網際網路中有多達上百億個頁面,每當有新頁面產生時搜尋引擎並不會收到通知,也就不會立刻察覺這些頁面的存在。那搜尋引擎要怎麼找到這些新頁面?答案就是透過「連結」。
整個網際網路是由大量的網站組成,而網站彼此間又透過「連結」互相串聯,就像我們網站中也存在 Facebook 的連結,使用者能夠透過這個連結找到我們的粉絲專頁。
而爬蟲的爬取方式也是同樣道理,會在爬取已知網站時檢視網站上的所有連結,並透過連結發現還沒檢索過的頁面或網站。
Sitemap.xml 用來記載希望被檢索的頁面及相關資訊,能夠幫助搜尋引擎以更有效率的方式檢索網站。通常位在網站根目錄的位置,例如:https://inboundmarketing.com.tw/sitemap_index.xml
Sitemap.xml 的功能是幫忙搜尋引擎檢索,如果有些頁面不希望被搜尋引擎找到的話,就不該放進 Sitemap.xml 中。因為這些頁面可能會對網站 SEO 造成負面影響,或是將搜尋引擎的檢索資源浪費在不重要的地方,例如:
不希望被搜尋引擎找到的內容除了不要放進 Sitemap.xml 以外,還可以使用更具有強制力的 Robots.txt 來禁止搜尋引擎爬取。
Robots.txt 是一份用來告訴搜尋引擎該怎麼爬取我們網站的規範文件。爬蟲在開始爬取我們的頁面前,會先爬取這份檔案瞭解網站限制後才開始爬取頁面,可以在檔案中進行以下設置:
Robots.txt 檔案位於網站根目錄,例如集客的 Robots.txt 就位於:
https://inboundmarketing.com.tw/robots.txt
我們已經瞭解這是用來限制搜尋引擎爬取特定頁面,避免搜尋引擎對網站提出過多檢索需求造成網站超載,但實際上究竟有哪些頁面不用被搜尋引擎爬取?
又稱為「檢索預算」,搜尋引擎對於每個網站投入的時間及資源就稱為「爬取預算」,每次的檢索預算消耗完畢後,就需要等到下一次搜尋引擎才會繼續進行檢索。
透過 Google Search Console 的檢索統計資料可以看到近期網站被檢索的頻率。
因為資源有限,搜尋引擎必須視網站情況合理分配檢索預算才能避免浪費資源,因此每個網站的爬取預算都不相同。爬取預算主要取決於以下因素:
又稱為收錄,搜尋引擎將頁面分類收進資料庫的步驟就稱為索引。搜尋引擎的運作是一個循序漸進的過程,就像前面有提到我們平常在 Google 搜尋時,實際上是在 Google 的資料庫內搜尋。所以如果網頁沒有經過索引,就絕對不會出現在搜尋結果頁。
瞭解搜尋引擎的運作方式後,想要知道哪些頁面已經被索引可以開始競爭排名,或是哪些該被索引的頁面還沒被索引的話,以下幾種方法可以幫助我們快速掌握網站狀況。
「site:」指令可以在沒有 Google Search Console 權限時,簡單的確認索引狀況。以集客的網站為例:
檢視全站的索引狀況:site:網域
檢視特定頁面索引狀況:site:網址
網頁索引狀況:查看網站整體情況
網址審查工具:查看個別頁面狀況
頁面被索引後才可能出現在搜尋結果頁,如果花費大量時間精力完成頁面,卻因為索引問題導致沒有排名及流量其實相當可惜。頁面沒有被索引常常是因為以下造成:
如同前面所說,搜尋引擎會需要一定的時間才能發現新網站,如果發現 Search Console 沒有顯示任何資訊,可能就只是網站還沒被搜尋引擎找到而已。不過可以試著透過以下方式增加被搜尋引擎發現的機會。
網站頁面沒有多達上千個時,搜尋引擎檢索的速度通常不會太慢,因此對於小型網站來說不需要特別控制檢索預算。
不過如果你操作的是大型網站,希望所有重要頁面都能被快速檢索,那就會需要注意檢索的資源分配。雖然我們無法主動控制搜尋引擎如何分配資源,但藉由 Google 針對檢索預算撰寫的說明文件,我們可以透過以下方式盡可能提升檢索預算:
搜尋引擎依靠網站上的連結來發現新頁面,如果網站上有某個頁面沒被任何頁面連結到,搜尋引擎就也難以找到它,通常將此類型頁面稱之為「孤兒頁面」。
雖然 Sitemap.xml 可以幫助搜尋引擎找到希望被檢索的頁面,但良好的網站架構有助於傳遞頁面權重,因此不建議用 Sitemap.xml 取代良好的網站架構。
搜尋引擎檢索網頁的方式其實就像我們人類使用者,都需要實際進到頁面才會知道有哪些內容。如果頁面發生問題,導致搜尋引擎無法順利檢視,自然也就無法索引。我們可以透過 HTTP 狀態碼瞭解目前頁面狀態:
4xx 錯誤指的是客戶端錯誤,又可以理解為瀏覽器端發生的錯誤,通常是因為網址輸入錯誤、頁面已被刪除等問題所產生的錯誤,其中最常見的就是404錯誤。如果頁面的內容被移除或是更換過網址,且頁面已被搜尋引擎索引時,就可以進行301轉址處理。
網站伺服器無法滿足使用者或搜尋引擎瀏覽頁面的請求。例如:電商網站購物節、搶購演唱會門票等,容易瞬間湧入大量流量的時候就可能產生5xx錯誤。如果常常發生伺服器過載,可能就需要考慮更換伺服器,以免影響索引及使用者體驗。
有多個網址都呈現相同的內容時,搜尋引擎只會挑選一個作為標準頁面進行索引。但如果你希望搜尋引擎選擇某個特定網址時,就可以使用 Canonical 標記,告訴搜尋引擎哪個才是我們選擇的標準頁面。
有時你可能會在 Search Console 看到未索引原因寫著「已檢索-目前尚未建立索引」,這代表搜尋引擎已經找到你的頁面,但卻沒有進行索引。
Google 的 John Mueller 曾經在線上研討會討論過這個問題,而 Search Engine Journal 也針對這次的談話內容進行統整。簡單來說,如果是小型網站卻有部分頁面顯示「已檢索-目前尚未建立索引」,可能是因為搜尋引擎認為網站整體的品質不足,不值得為該網站的內容建立索引,這時我們可以做的是優先加強網站的內容品質。
某些網站可能存在不想被收錄、不希望出現在搜尋結果頁的內容,例如:使用者付費觀看內容等。
出現在頁面 HTML 的<head>
中,可以告訴搜尋引擎該如何索引頁面。檢視頁面原始碼時即可檢視
以下是常見的 Robots meta tag 屬性:
Index / Noindex 屬性:設置 Noindex 標記會告訴搜尋引擎不要索引此頁面,當然也不會出現在搜尋結果頁。 不過如果沒有特別設定 Noindex,就是默認搜尋引擎可以索引(Index)。
Follow / Nofollow 屬性:告訴搜尋引擎是否應該要跟隨頁面上的連結,並將權重傳遞給這些連結。同樣的,如果沒有設定 Nofollow 的話就是默認 Follow 的意思。
Noarchive 屬性:一般情況下搜尋引擎會保留之已索引過的頁面版本,使用者也能在搜尋結果頁看到之前的版本。
用在 HTTP 的回應標頭內,適合用來大範圍禁止搜尋引擎索引。例如:禁止搜尋引擎索引特定的文件類型、特定的資料夾等。
當使用者輸入關鍵字按下送出的瞬間,搜尋引擎就會開始計算頁面和關鍵字的相關性,最相關且能提供最佳使用者體驗的頁面就更有機會出現在搜尋結果頁第一名。
Google 為了能夠提供使用者更好的搜尋體驗,不斷開發及更新各種演算法。可以將演算法區分為以下幾種功能,這些功能也將實際影響搜尋排名:
實際上就是「使用者想知道什麼」。不同的關鍵字使用者想知道的資訊類型也會不相同,而搜尋引擎會盡量理解使用者的搜尋意圖,進而提供相對應的內容類型。
而想知道搜尋引擎如何理解關鍵字的搜尋意圖,最直接且準確的方式就是實際搜尋一次,看搜尋引擎給予哪種類型的內容比較好的排名。
舉例一:
我想要購買滑鼠,但還沒有目標品牌及型號,只是想看看目前市面上有哪些滑鼠可以參考,我可能會使用「滑鼠 推薦」這樣的關鍵字。
舉例二:
我已經確定有確切的目標滑鼠,但在購買前想要再看看其他使用者對這隻滑鼠的評價,或是實際使用情況,我就會使用「品牌型號+評價」這樣的關鍵字。
舉例三:
當我已經瞭解完這隻滑鼠的所有資訊,想要在網路上直接購買時,我會直接搜尋「品牌型號」希望能馬上找到購買頁面。
搜尋引擎會根據頁面內容及關鍵字出現的頻率判斷是否具有相關性。舉例來說,我希望排名「SEO」這個關鍵字,那就需要盡量撰寫和 SEO 相關的內容。例如:SEO 是什麼?SEO 怎麼做?SEO 怎麼排名等內容,來設法滿足使用者的疑惑。
不過,不建議為了獲得高排名就故意大量堆疊關鍵字,並撰寫無法提供實際資訊的內容給使用者。目前搜尋引擎已足夠聰明,甚至可能將你的網站判定為低品質內容的網站。
除了單純提供使用者內容外,還要確保提供的資訊是具有經驗、專業、權威、可信(EEAT)的標準。如果不確定自己網站上的內容是否屬於高品質內容,Google 也有提供內容建議供自我檢核。
如果搜尋引擎判斷有多個網站的相關性都相同的情況下,就會給予使用者體驗較佳的網站高排名,主要以下列幾個因素判斷使用者體驗:
搜尋引擎也可能根據使用者當下的座標位置、使用語言或過去搜尋紀錄,提供不同的搜尋結果。
全球的SEOers 都在關注Localized URLs on SEO,而我們也在關注我們自己網站是否也應該將URL更改為中文為主的顯示模式,以便獲取更高的流量、排名,我們可以從下列幾篇國際文章一起探討討論這個問題:...
SEO,全名又稱為搜尋引擎優化, 透過搜尋引擎的運作規則來優化網站環境,以提高網站在搜尋引擎內的關鍵字排名及曝光度。SEO 運用一系列的技術和策略,包含優化網頁文字、關鍵字研究、增加網站權重、新增外部連結....等自然排序(免付費)的方式,讓搜尋引擎了解並認可網站架構,並增加網站在搜尋引擎的排名。...
什麼是SEM搜尋引擎行銷?SEM和SEO一樣嗎?我的企業適用哪個行銷手法呢?告訴你SEM的意思和SEM與SEO的三大不同!...