Canonical URL là gì?
Canonical URL (hay còn gọi là Rel Canonical) là một phần của mã HTML được sử dụng để xác định URL gốc của một trang web có nội dung trùng lặp với các công cụ tìm kiếm. Thẻ Canonical URL được sử dụng khi có tình trạng trùng lặp hoặc tương tự nội dung trên nhiều URL khác nhau.
Canonical URL là một URL mà Google coi như phiên bản “chính” của một tập hợp các trang trùng lặp hoặc gần giống nhau. Hãy tưởng tượng nó giống như sự khác biệt giữa một tác phẩm nghệ thuật gốc và các bản sao hoặc bản in của nó. Canonical URL này chính là cái mà Google sẽ lập chỉ mục và có thể trả lại cho người dùng trong kết quả tìm kiếm trên Google.
Canonical URL rất quan trọng bởi vì Google chỉ sẽ lập chỉ mục các Canonical URL . Điều này có nghĩa là nếu bạn có nội dung trùng lặp trên trang web của mình, tức là các trang gần giống hoặc trùng lặp nhau, thì Google chỉ sẽ lập chỉ mục một trong số chúng (Canonical URL ).
Nếu bạn thiết lập Canonical v đúng cách, thì Google có khả năng tôn trọng quyết định của bạn và coi trang đó là Canonical URL . Tuy nhiên, nếu không có Canonical URL cụ thể cho các trang trùng lặp hoặc gần giống, Google sẽ sử dụng sự đánh giá tốt nhất của mình để chọn URL Canonical thay bạn.
Vấn đề ở đây là, đây có thể không phải là URL mà bạn muốn Google chọn là Canonical URL . Vì vậy, nếu bạn muốn có cơ hội tốt nhất để nó là URL đúng, bạn nên thiết lập Canonical URL bằng tay.
Làm thế nào để thiết lập Canonical URL ?
Google xem xét nhiều tín hiệu để xác định Canonical URL cho một tập hợp các trang trùng lặp hoặc gần giống nhau, trong đó có thẻ Canonical URL . Thẻ Canonical URL là một đoạn mã HTML mà bạn thêm vào phầncủa một trang để chỉ định phiên bản Canonical URL của trang đó.
Nó có dạng như sau:
<link rel=”canonical” href=“https://example.com/canonical-page/” />
Ví dụ, giả sử bạn sở hữu cửa hàng thương mại điện tử nơi khách hàng có thể lọc sản phẩm theo các tham số như kiểu dáng, kích thước và màu sắc. Trong trường hợp này, thường xảy ra các URL có tham số với nội dung gần giống nhau với “trang chính” của bạn:
- domain.com/tshirts (“trang chính” liệt kê tất cả áo thun)
- domain.com/tshirts?size=small (giống “trang chính” nhưng lọc sản phẩm là áo thun size nhỏ)
- domain.com/tshirts?color=red (giống “trang chính” nhưng lọc sản phẩm là áo thun màu đỏ)
Nếu không có việc thiết lập Canonical URL đúng cách, bạn có thể gặp phải tình huống mà Google chọn lập chỉ mục phiên bản “sai” của trang hoặc cả hai phiên bản. Cả hai kết quả này thường gây khó khăn cho SEO.
Để đảm bảo Google có đủ thông tin để lập chỉ mục trang của bạn, bạn có thể thiết lập phiên bản Canonical URL của các URL này bằng cách sử dụng thẻ Canonical URL trên trang chính, trỏ đến phiên bản “chính” mà không có tham số URL.
Điều này giúp Google hiểu rõ phiên bản nào của trang nó nên lập chỉ mục.
Các phương pháp hay nhất cho Canonical URL chuẩn
Canonicalization là một chủ đề phức tạp và kỹ thuật, nhưng hầu hết các chủ sở hữu trang web cần chỉ cần biết một số thực prát tốt nhất. Vì vậy, để giữ mọi thứ đơn giản, chúng ta sẽ chỉ đề cập đến một số trong số chúng ở đây.
- Sử dụng thẻ Canonical URL tự tham chiếu
- Thẻ Canonical URL tự tham chiếu là các thẻ Canonical URL trên một trang trỏ về chính nó.
Ví dụ, trang này có một thẻ Canonical URL tự tham chiếu có dạng như sau:
<link rel=”canonical” href=”https://ahrefs.com/blog/what-is-a-canonical-url/” />
Mặc dù việc sử dụng thẻ URL Canon tự tham chiếu không bắt buộc và có thể dường như là một điều lạ lẫm, nhưng John Mueller của Google thực sự khuyên dùng việc này:
I recommend [using a] self-referential canonical because it really makes it clear to us which page you want to have indexed, or what the URL should be when it is indexed.
Một thẻ Canonical URL tự tham chiếu cho biết với Google rằng bạn coi URL đó là Canonical URL và bạn muốn Google lập chỉ mục trang đó. Tất nhiên, việc lập chỉ mục không được đảm bảo, nhưng thẻ Canonical URL, tự tham chiếu hoặc không, là một trong những tín hiệu mạnh nhất mà Google sử dụng để hiểu rõ cái gì là Canonical URL và cái gì không phải trên trang web của bạn.
Loại bỏ các URL không phải là Canonical khỏi bản đồ trang web của bạn
Google khuyên bạn không nên liệt kê các URL không phải là Canonical trong bản đồ trang web của bạn vì nó xem những URL này như các Canonical đề xuất.
Tương tự như các thẻ Canonical URL, điều này không nhất thiết có nghĩa rằng Google luôn luôn sẽ coi một URL trong bản đồ trang web của bạn là Canonical – nhưng đó là một tín hiệu khác để giúp Google hiểu rõ hơn cách bạn xem nội dung trang web của mình.
Một cách nhanh chóng để kiểm tra xem bạn có các URL không phải là Canonical trong bản đồ trang web của mình là tạo một bản sao trang web miễn phí bằng cách sử dụng Công cụ Kiểm tra trang web trong Ahrefs Webmaster Tools (AWT).
Dưới đây là cách thực hiện trong năm bước đơn giản:
- Tạo một tài khoản AWT miễn phí.
- Thêm và xác minh sở hữu trang web của bạn.
- Tạo bản sao trang web của bạn bằng Công cụ Kiểm tra trang web.
- Nhấn vào “Tất cả vấn đề” trong menu bên trái.
- Tìm lỗi “Trang không phải là Canonical trong bản đồ”.
Nếu bạn thấy lỗi này, hãy nhấn vào lỗi đó và nhấn nút “Xem URL bị ảnh hưởng”. Sau đó, bạn có thể thực hiện các bước để loại bỏ các URL này khỏi bản đồ trang web hoặc thay đổi trạng thái Canonical của chúng.
Không đặt 404 làm Canonical URL
Mã trạng thái 404 được trình duyệt trả về khi không thể tìm thấy một trang hoặc tài nguyên. Điều này thường xảy ra khi trang đã bị xóa hoặc ngừng hoạt động.
Có lẽ không cần phải nói rằng bạn không nên cố ý chỉ định một trang 404 làm Canonical URL, nhưng đây vẫn là một lỗi khá phổ biến xảy ra trên các trang web theo thời gian vì người ta thường xóa hoặc di chuyển trang.
Do đó, quan trọng để bạn theo dõi các trang chết được đánh dấu là Canonical. Bạn có thể làm điều này miễn phí bằng cách sử dụng Công cụ Kiểm tra trang web trong Ahrefs Webmaster Tools (AWT).
Dưới đây là cách thực hiện trong năm bước đơn giản:
- Tạo một tài khoản AWT miễn phí.
- Thêm và xác minh sở hữu trang web của bạn.
- Tạo bản sao trang web của bạn bằng Công cụ Kiểm tra trang web.
- Nhấn vào “Tất cả vấn đề” trong menu bên trái.
- Tìm lỗi “Canonical URL trỏ đến 4XX”.
Nếu bạn thấy lỗi này, bạn đã đặt thẻ Canonical URL trên trang web của mình để chỉ định các URL chết làm Canonical URL. Bạn có thể xem những trang nào bị ảnh hưởng bằng cách nhấn vào lỗi và nhấn nút “Xem URL bị ảnh hưởng”.
Bạn nên thay thế bất kỳ thẻ Canonical URL nào trỏ đến các URL 4XX bằng các liên kết đến các trang hoạt động.
Câu hỏi thường gặp
Có nên sử dụng Canonical URL cho các trang phân trang trỏ về trang gốc không?
Nếu bạn có các trang phân trang, chẳng hạn như một loạt các trang lưu trữ blog, chúng hoạt động một chút khác so với các URL có tham số. Trong trường hợp này, các trang phân trang không nên được chỉ định là Canonical trỏ về trang đầu tiên trong loạt. Thay vào đó, bạn nên sử dụng các thẻ Canonical URL tự tham chiếu trên mỗi trang. John Mueller của Google đã xác nhận rằng đây là cách đúng để xử lý vấn đề Canonical URL với trang phân trang trên Reddit.
Có được phép sử dụng nhiều thẻ Canonical URL không?
Không, không phải là thực hành tốt khi có nhiều thẻ Canonical URL trên cùng một trang. Trong trường hợp này, Google có khả năng sẽ bỏ qua cả hai thẻ Canonical URL và có thể không lập chỉ mục trang đó.
Tốt nghiệp CNTT và bắt đầu công việc Thiết kế web, SEO, Adwords,… từ 2008, với hơn 15 năm kinh nghiệm của mình, tôi thành lập BALICO với mục tiêu mang đến những giải pháp chuyển đổi số trong kinh doanh dành cho doanh nghiệp vừa và nhỏ (SME), nâng cao năng lực cạnh tranh, đồng hành cùng khách hàng tự tin bước vào kỷ nguyên công nghệ 4.0
Kết nối với tôi: Facebook | Tiktok | Twitter | Linkedin | Youtube | Blog