Nếu là một SEOer, chắc hẳn ai cũng đều biết Canonical là gì? Một canonical hay canonical URL giúp bạn đưa ra tín hiệu cho các công cụ tìm kiếm biết rằng có một số URL tương tự nhau. Khi một trang web trở nên “có tiếng” hơn, việc các trang trở nên trùng lặp hoặc gần như trùng lặp nhau là điều khó có thể tránh khỏi. Điều này có thể gây ra các vấn đề về trùng lặp nội dung. Nếu bạn có hai trang giống nhau và cả hai đều đủ điều kiện để xếp hạng cho một cụm từ khóa nhất định, thì công cụ tìm kiếm sẽ không biết nên gửi lưu lượng truy cập đến URL nào trong số đó. Để giải quyết vấn đề này, bạn có thể chọn một URL ưa thích, đây là những gì chúng ta gọi là canonical URL. Vậy bạn có biết thẻ Canonical là gì? Khi nào nên sử dụng chúng? Đâu là cách ngăn chặn, khắc phục một số lỗi phổ biến?

Ngay bây giờ, hãy cùng CTAGENCY tìm hiểu chi tiết về khái niệm Canonical URL và hướng dẫn sử dụng Canonical URL hiệu quả cho người mới bắt đầu trong bài viết này nhé!

Canonical là gì?

Canonical là URL của trang được cho là chuẩn nhất trong số các trang web có nội dung giống nhau hoặc tương tự trên site của bạn. Tức là, cần có một trang làm chuẩn trong số những trang bị trùng lặp và trang chuẩn đó có chứa canonical URL.

Canonical là gì? Canonical URL là gì? Canonical nghĩa là gì? Vai trò của thẻ canonical đối với trang web. ( Ảnh: Vietnet Group)

Canonical URL là một thành phần HTML nhằm thông báo cho các công cụ tìm kiếm biết cách thu thập dữ liệu trang và xếp hạng mức độ quan trọng của nội dung. Trong trường hợp xuất hiện cùng một nội dung trên các URL khác nhau, việc sử dụng mã này – được gọi là thẻ rel = canonical – sẽ giúp công cụ tìm kiếm hiểu rõ hơn nội dung nào là quan trọng, giải quyết các vấn đề về nội dung trùng lặp, cải thiện xếp hạng của nội dung đó và cuối cùng, có thể dẫn nhiều khách hàng hơn đến trang web của bạn.

Để hiểu rõ hơn, cùng xem xét ví dụ dưới đây:

  • http://www.example.com
  • http://www.example.com/index.html
  • https://example.com
  • https://www.example.com

Đây được coi là những URL bị trùng lặp, đều là trang chủ của trang web có domain là example.com

Để giải quyết vấn đề này, bạn có thể cài đặt thuộc tính rel=”canonical” và trong phần <head> theo cú pháp:

<link rel=”canonical” href=”…” />

Chẳng hạn bạn muốn https://example.com là URL chuẩn có thể thực hiện như sau:

<link rel=”canonical” href=”https://example.com” />

Tại sao nên dùng Canonical trong SEO website?

Sau khi đã hiểu được khái niệm thẻ Canonical là gì, chúng ta cùng đi lý giải những lý do mà bạn nên dùng Canonical trong SEO website nhé.

Nói một cách đơn giản, nội dung trùng lặp gây nhầm lẫn cho các công cụ tìm kiếm. Khi công cụ tìm kiếm xem xét nhiều trang có cùng nội dung và không có tín hiệu tối ưu hóa từ khóa rõ ràng, chúng:

  • Không biết phần nào để gán tín dụng
  • Không biết URL nào nên lập chỉ mục
  • Không biết trang nào nên xếp hạng

Thẻ rel = canonical làm rõ điều này, giúp các công cụ tìm kiếm hiểu nội dung, ngăn chúng bỏ qua trang và cải thiện cơ hội nội dung được xếp hạng.

Nhiều người từng nói rằng nội dung trùng lặp có thể dẫn đến các hình phạt tìm kiếm, làm giảm toàn bộ xếp hạng của trang web hoặc xóa hoàn toàn khỏi SERPs. Tuy nhiên, đến hiện tại nhiều SEO-er tin rằng vốn không có hình phạt thực sự nào cả.

Google không trừng phạt các trang web có nội dung trùng lặp; nó chỉ lọc ra các kết quả trùng lặp để tạo ra trải nghiệm tốt hơn và đáp ứng mục đích tìm kiếm của người dùng mà thôi.

Google biết rằng người dùng không muốn xem cùng một nội dung nhiều lần. Nhưng nếu người dùng không tìm thấy những gì họ muốn trong danh sách đầu tiên, tại sao cùng một nội dung lại có thêm danh sách thứ hai, thứ ba hay thứ tư?

Google đang cố gắng tìm nguồn nội dung tốt nhất để có thể hiển thị trang đó và tạo trải nghiệm tích cực cho người dùng. Điều này hỗ trợ người dùng không phải nhấp qua nhiều URL với cùng một nội dung.

Mặc dù một trang có nội dung trùng lặp sẽ không bị phạt nhưng nó có thể bị lọc ra để thay thế cho những nội dung có ý nghĩa khác. Do đó, sẽ không có nhiều lưu lượng truy cập cho bài đăng đó, nhưng nó cũng sẽ không ảnh hưởng tiêu cực đến toàn bộ trang web.

Mặc dù đã cố gắng hết sức, nhưng khả năng bạn có nội dung trùng lặp trên trang web của mình hoặc các trang web khác có thể đã lấy nội dung của bạn và sao chép nội dung đó trên các trang của họ vẫn rất cao. Các chuyên gia ước tính rằng có tới 29% tất cả nội dung trên web bị trùng lặp.

Nhưng bạn có thể dễ dàng giải quyết những vấn đề này và tạo ra kết quả SEO lâu dài bằng cách sử dụng các phương pháp hay nhất về canonical URL và biết khi nào nên sử dụng thẻ này.

Làm thế nào để tối ưu hoá Canonical URL

Hiểu được bản chất của thẻ Canonical là gì, vậy làm thế nào để tối ưu hóa các canonical URL đạt hiệu quả nhất. Hãy cùng tham khảo ngay qua những chia sẻ dưới đây!

Làm cách nào để tối ưu hóa các canonical URL?

Việc tối ưu hóa canonical URL bao gồm việc xác định nội dung trùng lặp và hiểu nguyên nhân của sự trùng lặp này. Có một số thủ thuật để biết được điều này.

Ví dụ: bạn có thể kiểm tra các trang được gợi ý, vì các công cụ tìm kiếm cũng hiển thị kết quả bằng cách xem xét nội dung của truy vấn đó. Ngoài ra, hãy sử dụng một tìm kiếm nhỏ của Google hoặc Bing để kiểm tra xem các trang được lập chỉ mục trên trang web của bạn có nhiều hơn số lượng bài báo hoặc trang đã xuất bản hay không. Sau đó, hãy xem các danh mục của bạn (nếu có) và đảm bảo rằng không có bài viết nào được tìm thấy trong hai danh mục cùng một lúc. Cuối cùng, hãy xem thử các chuyển hướng trong trang web của bạn để đảm bảo rằng tất cả chúng đều được định cấu hình đúng. Khi bạn đã thực hiện xong các bước kiểm tra này, bây giờ hãy đảm bảo rằng URL chính thức của mỗi trang là tối ưu.

Làm cách nào để tối ưu hóa các canonical URL?

Link canonical là gì? Làm thế nào để tối ưu hóa canonical URL? Ảnh: seothetop

Để tối ưu hóa một URL chuẩn, phải đảm bảo rằng bạn tuân theo các quy tắc cơ bản chi phối URL nói chung. Khi làm như vậy, cũng nên nhớ rằng bạn phải cung cấp URL ưa thích, để liên kết đến một trang nhất định, tất cả những điều này đều được các công cụ tìm kiếm nhìn thấy. Chẳng hạn như bao gồm một từ khóa. Mặc dù nguyên tắc này có vẻ không đáng kể nhưng lại đóng một vai trò quan trọng trong SEO. Ở cấp độ thuật toán của Google, hợp lý hơn nhất là một địa chỉ chứa từ khóa để lập chỉ mục trang. Vì vậy, khi chèn từ khóa, lưu ý không chèn dấu hoặc ký tự mà công cụ tìm kiếm khó diễn giải.

Việc thêm một cụm từ vào canonical URL tất nhiên là không đủ để nó được tối ưu hóa và không thể được coi là giải pháp toàn diện. Cũng cần tránh trường hợp URL quá dài, dễ bị lợi dụng trên mạng xã hội và diễn đàn. Về điểm này, cấu trúc dữ liệu cây là một trong những yếu tố ảnh hưởng đến độ dài của URL. Nếu hai trang trên site của bạn có tiêu đề chính giống hệt nhau và URL của chúng cũng sẽ giống nhau, thì sự hiện diện của cấu trúc dữ liệu cây trong địa chỉ có thể giúp phân biệt chúng. Nhưng bạn không cần phải xem qua toàn bộ chuỗi danh mục; chẳng hạn như giới hạn ở một hoặc hai yếu tố phân biệt hai trang là đủ.

Luôn quan tâm đến việc tối ưu hóa canonical URL của một trang trên site của bạn, hãy đảm bảo rằng nó bao gồm các dấu phân tách từ, nhưng các dấu phân tách này phải dễ dàng cho các công cụ tìm kiếm hiểu được. Theo nguyên tắc chung, dấu gạch ngang (-) được chọn làm dấu phân tách đơn giản nhất. Nên tránh các dấu hiệu như dấu phẩy hoặc dấu chấm phẩy, trong khi dấu và (&) hoặc dấu thăng (#) nên được dành để xác định các khu vực của trang web động.

Ngoài những điều trên, bạn nên truy cập Search Console của Google để tìm hiểu xem Google chọn URL nào làm URL chuẩn.

Cách tối ưu hóa canonical URL và giá trị gia tăng mà nó mang lại là gì?

Sau khi đã lựa chọn được canonical URL mà bạn muốn ưu tiên cho một nội dung nhất định trên trang web của mình, bây giờ bạn cần thiết lập nó bằng cách chọn phương pháp phù hợp dưới đây:

Cách tối ưu hóa canonical URL và giá trị gia tăng mà nó mang lại là gì?

Link rel canonical là gì? Link canonical HTML là gì? Canonical trong WordPress

Phương pháp thứ nhất: chèn thẻ canonical URL vào mã HTML

Việc sử dụng phương pháp này bao gồm việc đặt thẻ, với thuộc tính thích hợp, ở thẻ <head>. Thẻ này phải được thêm trên tất cả các trang có nội dung giống hệt nhau; do đó, tất cả chúng sẽ tham chiếu đến trang được liên kết với canonical URL. Để thực hiện việc này, giữa “head” và “/ head”, hãy chèn mã sau:

<link rel = “canonical” href = “canonical URL” />

Phương pháp thứ 2: Dùng tiêu đề HTTP rel=canonical

Kể từ tháng 6 năm 2011, bạn có thể định cấu hình máy chủ bằng cách thêm một dòng trong tiêu đề HTTP rel= “canonical” để biểu thị canonical URL cho các tài liệu không phải dạng HTML.

Chẳng hạn với file PDF:

<http://www.example.com/dowloads/document.pdf>; rel=“canonaical”

<URL>; rel= “canonical”</URL> format, an <URL>expression that is to be inserted at the header level</URL>.

Phương pháp thứ 3: Giải pháp của sơ đồ trang web

Sơ đồ trang web chứa các canonical URL của tất cả các trang trên trang web của bạn. Tất cả các URL trong sơ đồ trang web đều sẽ được đề xuất là canonical URL. Dựa trên mức độ trùng lặp hay giống nhau về nội dung là Googlebot sẽ quyết định đâu là trang trùng lặp.

Bạn không bắt buộc phải sử dụng bất kỳ phương pháp nào trong số này để xác định canonical URL cho các trang trùng lặp của mình. Tuy nhiên, khi làm như vậy, sẽ giúp bạn đảm bảo việc kiểm soát được URL nào là URL thích hợp nhất để liên kết đến một nội dung nhất định trên trang web của bạn. Trong trường hợp bạn không xác định rõ canonical URL thì Google sẽ tự động tùy chọn URL phù hợp nhất theo tiêu chuẩn của nó. Và những tiêu chí đó chưa chắc sẽ đúng ý bạn.

Các trường hợp trùng lặp nên sử dụng Canonical

Để sử dụng canonical URL hiệu quả ngoài việc hiểu được Canonical là gì thì điều quan trọng là phải nhận biết được đâu là các trang trùng lặp. Dưới đây là một số dạng trùng lặp thường gặp nhất:

Phiên bản “www” và không “www” hoặc phiên bản “http” và “https”

Các phiên bản www hoặc giao thức https thường gây nhầm lẫn cho người dùng và sự trùng lặp khi sử dụng các phiên bản này là rất lớn. Ngoài ra, còn có một số phiên bản dành cho di động hay máy tính của website.

Chẳng hạn 4 URL dưới đây đều được coi là trùng lặp và cùng một nội dung:

http://www.example.com

https://example.com

http:/example.com

https://example.com

Việc lựa chọn URL chuẩn đã được đề cập trong phần trước. Tuy nhiên, trong trường hợp không rõ cách thực hiện, bạn nên tìm kiếm sự trợ giúp từ nhân viên lập trình trang web.

Phiên bản có và không có dấu gạch chéo ở cuối URL

Đây cũng là một trường hợp phổ biến khác, việc có sự khác biệt dấu gạch chéo ở cuối mỗi URL và nếu chúng đều có thể truy cập được thì nghĩa là những trang đó đang bị trùng lặp.

Ví dụ:

News

News

Và trong code sẽ không chỉ rõ cho bạn biết đâu là canonical URL.

Phiên bản máy tính và di động

Phiên bản di động được biểu thị dưới dạng m.example.com.

Chẳng hạn, Kênh 14 có 2 phiên bản máy tính và di động với 2 URL như sau:

https://kenh14.vn

https://m.kenh14.vn

Hai trang này có nội dung gần như trùng khớp hoàn toàn và được coi là trang trùng lặp.

Các trường hợp trùng lặp nên sử dụng Canonical

Thẻ Rel Canonical là gì? Định dạng URL phiên bản máy tính và di động

Bộ lọc và sắp xếp

Việc sử dụng các tác vụ sắp xếp hoặc bộ lọc có thể tạo ra nhiều URL khác nhau với nội dung không thay đổi. Do đó, các công cụ khi được sử dụng sẽ gây nên sự trùng lặp.

Ví dụ, đây là trang mua sắm điện thoại iPhone tại trang web của thegioididong:

https://www.thegioididong.com/dtdd-apple-iphone

Khi sử dụng các bộ lọc khác nhau như giá, dung lượng, màu sắc… thì nhận được nhiều trang khác nhau:

https://www.thegioididong.com/dtdd-apple-iphone?p=tren-20-trieu

https://www.thegioididong.com/dtdd-apple-iphone-pin-3000-den-5000-mah

https://www.thegioididong.com/dtdd-apple-iphone-rom-128-den-256gb

https://www.thegioididong.com/dtdd-apple-iphone-ram-4-den-6gb

Và tất nhiên, cả 4 trang này đều thể hiện cùng một nội dung và chỉ khác nhau về cách sắp xếp. Trường hợp này cũng được coi là trùng lặp nội dung.

Trang tìm kiếm nội bộ

Mỗi trang web đều hỗ trợ công cụ tìm kiếm và với mỗi từ khóa truy vấn khác nhau sẽ cho ra những URL khác nhau. Ví dụ, khi tìm kiếm trên trang https://marketingai.admicro.vn/ ta có nhận được các URL sau:

https://marketingai.admicro.vn/?s=tiktok

https://marketingai.admicro.vn/?s=Facebook

https://marketingai.admicro.vn/?s=youtube

Đây cũng được xem là một dạng trùng lặp nội dung

Trang đích trỏ tới từ 1 trang liên kết (Referral Link)

Biểu thị rõ nhất trong hoạt động tiếp thị liên kết, khi người dùng truy cập vào link mà bạn đặt trên trang của mình để đi đến trang đích có thêm tham số giới thiệu. Về bản chất, đó vẫn là trang ban đầu và chỉ có URL thay đổi. Đây cũng là một lỗi trùng lặp nội dung.

Trên đây là những trường hợp trùng lặp nội dung phổ biến nhất, ngoài ra còn một số trường hợp khác nhưng ít gặp hơn như ID phiên, phiên bản máy in,…

Trùng lặp chéo giữa các tên miền

Có thể là những hệ thống website vệ tinh của bạn mặc dù có tên miền khác nhau nhưng có một số trang lại trùng lặp nội dung. Để không bị Google bắt lỗi bạn nên chỉ rõ đâu là URL trên site là chuẩn sau đó trỏ những trang trùng lặp đó về trang chuẩn.

>> Xem thêm: PBN Là Gì?

Sự khác nhau giữa điều hướng 301 và Canonical Url

Điều hướng 301 là mã trạng thái HTTP được sử dụng để giao tiếp với phần mềm (trình duyệt, trình thu thập thông tin) và công cụ tìm kiếm rằng trang gốc đang cố gắng truy cập đã được chuyển sang một trang web mới, đồng thời báo hiệu cho công cụ tìm kiếm xóa trang khỏi chỉ mục và chuyển mọi thông tin SEO có được sang trang mới. Khi trình duyệt của bạn nhận được mã này, nó sẽ tự động chuyển đến URL mới được đề cập cùng với mã trạng thái 301.

Sự khác nhau giữa điều hướng 301 và Canonical Url

Meta canonical là gì? Canonical Yoast SEO là gì? Điều hướng 301 và canonical URL có gì khác nhau? Ảnh: Golden Arrow Digital

Trong khi đó, thuộc tính canonical URL không chuyển hướng khách truy cập đến URL mới, thay vào đó, nó được sử dụng để làm tín hiệu cho các công cụ tìm kiếm biết rằng trang nào cần lập chỉ mục trong kết quả tìm kiếm khi nội dung tương tự hoặc trùng lặp xuất hiện trong một trang web.

Các lỗi cần tránh khi sử dụng thẻ Canonical Url

Mặc dù bạn hoàn toàn có thể kiểm soát các thẻ canonical, nhưng là một nhánh của kỹ thuật SEO nó khá khó xử lý trong một số tình huống nhất định. Sai lầm về chuẩn hóa có thể dẫn đến lỗi hiển thị trong công cụ tìm kiếm và hiển nhiên là điều này cũng sẽ ảnh hưởng đến xếp hạng của trang. Dưới đây là 5 lỗi mà bạn cần tránh khi sử dụng thẻ canonical URL.

Rel = canonical & phiên bản trên điện thoại di động

Một sai lầm phổ biến mà mọi người thường làm là tự tham chiếu các phiên bản URL di động của họ bằng thẻ canonical. Cách chính xác để thực hiện là thêm một thẻ canonical trỏ từ URL trên thiết bị di động đến URL trên máy tính để bàn và cũng có một thẻ alternate trỏ từ URL máy tính để bàn đến URL di động.

Các thẻ HTML chính xác cho điều này phải là:

<link rel = ”alternate” media = ”only screen và (max-width: 640px)” href = ”http://m.example.com/page-1 ″> (trỏ từ URL máy tính để bàn đến URL di động)

<link rel = ”canonical” href = ”http://www.example.com/page-1 ″> (trỏ từ URL trên thiết bị di động đến URL trên máy tính để bàn)

Google cũng gợi ý rằng bạn nên giữ nguyên thiết lập với rel-alternate từ máy tính để bàn sang thiết bị di động và rel-canonical từ thiết bị di động sang máy tính để bàn.

Chỉ định nội dung không liên quan trong thẻ canonical

Mục đích chính của thẻ canonical là khắc phục các vấn đề về nội dung trùng lặp. Nếu bạn đang cố gắng sử dụng nó chỉ để xếp hạng trang web cụ thể trên các từ khóa khác nhau, nó sẽ không hoạt động tốt.

Nếu bạn nghĩ rằng bạn có hai bài viết hoặc một phần nội dung khá giống nhau, bạn có thể chuẩn hóa một phiên bản, nhưng tốt hơn hết là bạn nên điều hướng 301 từ phiên bản yếu hơn sang phiên bản mạnh hơn. Thậm chí có thể hợp nhất cả hai thành một URL mạnh hơn.

Sử dụng nhiều phiên bản canonical

Thêm nhiều thẻ canonical như bên dưới là tốt:

Meta tag canonical là gì? Sử dụng nhiều thẻ canonical có thể đem lại hiệu quả cao hơn

Meta tag canonical là gì? Sử dụng nhiều thẻ canonical có thể đem lại hiệu quả cao hơn

Tuy nhiên, việc có nhiều phiên bản canonical không hoàn toàn trực quan đối với công cụ tìm kiếm. Nếu cho rằng các thẻ canonical giúp các công cụ tìm kiếm quyết định nhanh hơn, thì việc có nhiều thẻ canonical trên cùng một trang về cơ bản như đang nói với Google rằng “đây là một trang trùng lặp”. Thay vào đó, bạn có thể hiển thị trang này, hoặc trang này, hoặc trang này”.

Tất cả các phiên bản trùng lặp phải có một thẻ canonical duy nhất trỏ đến URL của phiên bản chính. Hãy nhớ rằng: mỗi trang một thẻ canonical

Nhiều thẻ canonical từ một trang trỏ đến các phiên bản chính khác nhau thực sự không tốt cho trang web của bạn và mặc dù chúng có thể bị SE bỏ qua nhưng sẽ tốt hơn nếu bạn tránh chúng.

Vấn đề về HTTP & HTTPS trong canonical URL

Thông thường, khi hợp nhất từ HTTP sang HTTPS, nhiều người thường quên sửa các thẻ canonical. Mặc dù bạn đang chạy trang web của mình trên HTTPS, nhưng thẻ canonical sẽ yêu cầu Google kiểm tra phiên bản HTTP để thay thế. Nếu bạn điều hướng 301s đúng cách, nó sẽ đưa Google trở lại HTTPS, trong một vòng lặp liên tục.

Hợp chuẩn hóa nội dung được phân trang

Mọi người thường mắc sai lầm khi chuẩn hóa cho trang đầu tiên của danh mục sản phẩm. Đây là một ý tưởng tồi, vì tất cả các trang khác có thể chứa nội dung độc đáo và có thể được xếp hạng cao hơn cho các từ khóa khác nhau.

Đối với nội dung được phân trang, tốt hơn nên sử dụng thẻ rel-prev/next thay vì thẻ rel-canonical. Nó khá dễ dàng để thêm. Ví dụ: nếu bạn đang ở trang 2, bạn nên sử dụng:

<link rel = ”prev” href = ”http://example.com/page1.html”>

<link rel = ”next” href = ”http://example.com/3.html”>

Đặt sai vị trí vào thẻ <body>

Canonical URL phải được đặt trong thẻ <head> càn gần phần phía trên càng có lợi. Nếu chẳng may bạn đặt canonical vào trong thẻ <body> thì Google có thể bỏ qua nó.

Lưu ý khi dùng Canonical Url bạn cần biết

Canonical URL do bạn quyết định và canonical URL do các công cụ tìm kiếm (SE) lựa chọn có thể khác nhau tùy thuộc vào thuật toán mà những SE đó sử dụng. Do đó, bạn nên thường xuyên kiểm tra và nếu cần thiết thì nên thay đổi canonical URL của bạn sao cho phù hợp với thuật toán của SE.

Thuộc tính canonical URL chỉ nên được sử dụng khi khối lượng và số lượng trùng lặp nội dung lớn. Nếu mức độ trùng thấp thì không cần thiết phải thông báo để tránh lãng phí nguồn lực.

Trong một số trường hợp, điều hướng 301 nên được ưu tiên sử dụng hơn việc chỉ định canonical URL, chẳng hạn đối với các giao thức http và https, hay phiên bản có www và không có www.

>> Xem thêm: Schema là gì

Lời kết

Không chỉ các công cụ tìm kiếm mà ngay cả người dùng cũng hoàn toàn không thích việc nội dung bị trùng lặp. Điều này vừa ảnh hưởng không tốt đến SEO vừa làm tăng khả năng mất lưu lượng truy cập của website. Canonical URL nổi lên như một thuộc tính hữu ích nhất giúp giải quyết những vấn đề này. Nhưng không phải ai cũng hiểu canonical là gì và cách tối ưu hóa canonical URL để đem lại hiệu quả cao nhất.

Thông qua bài viết trên hy vọng có thể phần nào giúp bạn có cái nhìn tổng quan nhất về canonical là gì. Nếu có bất kỳ khó khăn nào trong việc thực hiện, bình luận ngay bên dưới để được hỗ trợ nhé.