被跨平台作者忽略的標準連結【一】:為什麼標準連結仍然重要

歷久彌新的 SEO 老調重談,在 2018 我們為什麼不能忽略它?


標準連結(Canonical Link)為什麼重要?

什麼是 SEO?

要講標準連結之前,得先講 SEO,它的全名為 Search Engine Optimization,也因為現在搜尋引擎大部分是指 Google,所以也可以翻譯成:「要怎樣才能讓 Google 搜尋得到我,而且排名越前面越好?」。

為什麼我沒聽過?/為什麼我聽過但從不覺得它重要?

在以前 blog 盛行的年代,人人都會需要略懂略懂 SEO,直到約莫十年前臉書崛起、個人網站(或 blog)式微,個人用戶都將內容交給大企業管理,SEO 這件事情就只剩下企業會接觸了。

所以你不知道 SEO,或是你覺得 SEO 不重要,都是很正常的,因為這十年來我們失去了自己掌握內容的權力,不需要煩惱自己的網站沒人看,自然就不需要 SEO。

但我預測未來,像臉書這樣大平台的影響力可能會變小,個人網誌仍然有機會興起,與這些大社群共存,這時候標準連結的重要性又會展現出來。


那什麼是標準連結(Canonical Link)?

當內容一樣的網頁存在很多個的時候,搜尋引擎並不知道哪個網址才是真正的「原文網址」。
這時候搜尋引擎必須要決定誰是那個唯一的網址,就叫做標準網址,而指向他的連結就是標準連結。

通常有兩種情況會用到標準連結,一是你在自己的網站放了很多頁同樣的內容,這時候必須用標準連結把它們都指向同一個標準網址;但這不是我們今天要討論的主題;另一個就是跨站發佈(Crossposting)。

跨站發佈是很常見的現象:舉例來說,我在 WordPress 發了文章,又複製貼上到 Medium,臉書也貼一份全文,最後匯流媒體再邀稿,放到他們的網站上,這樣對 Google 來說就有四份一樣的內容存在網路上。

這時候問題來了,Google 知道這些內容都一樣,但它希望使用者搜尋的時候,同樣的內容只出現一次就好,而不是一次顯示四篇同樣的文章(甚至其中還有些是農場抄襲的),於是你可能會看到搜尋結果出現這樣的畫面:

以下是 Google 在 整合重複的網址 - Search Console說明 當中對於這種情況的說明:

Google 會將這些網頁視為相同網頁的重複版本,從中選出一個網址做為「標準」版本並檢索該網址,其他網址則會被視為「重複」網址,檢索頻率會比較低。

問題是,Google 怎麼知道該顯示哪一篇?

發文時間

最直覺的就是看誰先發文了(除非我去偷作者的稿)。但技術上判斷發文時間的難度很高,因為爬蟲並不能保證永遠都會先「發現」比較早產生的內容,而網頁自己說自己發佈的時間也能作假。

標準連結

Google 採用了標準連結這個 html 元素,用途是讓你自己註明目前網頁的唯一網址在哪。

假設我發了兩篇內容一樣的文章,A 網址(Medium)與 B 網址(Wordpress),但 A 有註明標準連結是 B,那麼搜尋的時候不管找到 A 或 B,Google 都只會在結果顯示 B,聽起來很棒。

如果是你不能掌控的內容...?

如果您未將標準網址明確告知 Google,Google 會自行選擇標準網址

問題是抄襲文章的農場,或者轉載我文章的網站,未必會放這個標準連結,當沒有標準連結可供判斷的時候,Google 仍然得在每次搜尋時做出它的判決:一次只顯示一筆相同的內容。

Google 會自己去蒐集證據,靠的也是一些常見的 SEO 因素,比如網域權重(這個網域是不是經營很久的大流量網站、有沒有抄襲的紀錄)、進出連結(有沒有別人連結它)、有無 HTTPS、網站內容品質等等,通常也足夠應付大部分情況。

但畢竟 Google 不是完美的,試想當你貼了兩篇一樣的文章在 Medium 與剛架好的 WordPress,又沒給標準連結,那 Google 一定傾向去相信 Medium 的網址,而不是你這個名不見經傳的小網站,於是你的小網站流量被吃 Medium 吃掉了。

同樣的情形也會發生在合法授權轉載的情況,比如匯流媒體的邀稿刊登,沒有將標準連結指向你的原文,即使文章內容有註明「原文出處來自XXX」但 Google 也看不懂,這時候 Google 也有可能會將轉錄的那篇當做原文,而你的原文就不會顯示在搜尋結果了。

這篇只是一個起頭,將 SEO 與標準連結做最基本的介紹。下一篇 被跨平台作者忽略的標準連結【二】:沒有它,原文與抄襲傻傻分不清楚 將會貼出我自己的實驗結果,看看沒有標準連結的嚴重性。


如果對這篇文章的主題有興趣一起討論,或是對寫作有任何想法,都歡迎加入Telegram中文寫作交流群組一起討論喔!

相關文章:  為什麼我不使用 Medium 整理草稿