Tìm hiểu tác động của URL trùng lặp

30/11/2019

Một số trang web thỉnh thoảng cung cấp cùng một nội dung qua các URL khác nhau bằng cách sử dụng ID phiên hoặc các thông số URL khác. ID phiên là một con số được nối thêm vào đường dẫn URL, qua đó tạo một trang mới với trải nghiệm tùy chỉnh cho người truy cập vào trang tương ứng với ID đó. Ví dụ: ID phiên cho phép một trang web mua sắm phân biệt giữa các khách hàng để mỗi người có thể nhìn thấy những gì có trong giỏ hàng của họ trong khi duyệt danh mục trên trang web. Trong khi đó, thông số URL ít cụ thể hơn trong việc xác định khách hàng riêng lẻ: một ví dụ là khi khách hàng tìm kiếm "chó con" trên trang web của một cửa hàng vật nuôi, họ có thể chọn lọc hay sắp xếp kết quả của mình theo tuổi, giống, màu sắc và phạm vi giá. Khi đó mỗi tổ hợp bộ lọc đại diện cho một URL khác nhau vì bộ lọc nối chuỗi hay thông số mới vào đường dẫn URL ban đầu để thay đổi kết quả khách hàng nhìn thấy, mặc dù thông thường các URL có chứa kết quả giống nhau hay trùng lặp.

 Ví dụ

Các URL sau trỏ đến cùng một nội dung: một bộ sưu tập váy màu xanh lá cây, mặc dù một vài trang trong số này có thể được tổ chức hoặc lọc hơi khác nhau.

 http://www.example.com/products/women/dresses/green.htm
 http://www.example.com/products/women?category=dresses&color=green
 http://example.com/shop/index.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123&affid=431

Khi Google phát hiện nội dung trùng lặp, chẳng hạn như các trang trong ví dụ trên, thuật toán của Google nhóm các URL trùng lặp thành một cụm và chọn URL mà thuật toán cho là URL tốt nhất để đại diện cho cụm trong kết quả tìm kiếm (ví dụ: Google có thể chọn URL với nhiều nội dung nhất). Khi đó Google cố hợp nhất những gì chúng tôi biết về URL trong cụm, chẳng hạn như mức độ phổ biến của liên kết, với URL đại diện để cải thiện độ chính xác của xếp hạng trang và kết quả trong Google Tìm kiếm.

Tuy nhiên, khi Google không thể tìm thấy tất cả các URL trong một cụm hoặc không thể chọn URL đại diện mà bạn muốn, bạn có thể sử dụng công cụ thông số URL để cung cấp cho Google thông tin về cách xử lý các URL có chứa các thông số cụ thể.

Xin lưu ý rằng bạn cần phải cẩn trọng khi sử dụng công cụ Thông số URL. Nếu bạn mắc lỗi khi chỉ cho chúng tôi nội dung trùng lặp không nên được thu thập dữ liệu, Google có thể ngừng thu thập dữ liệu các trang mà bạn muốn có sẵn trong Google Tìm kiếm.

Ví dụ: nếu bạn yêu cầu Google chỉ thu thập dữ liệu một URL chứa thông số food nếu nó có giá trị food=savory, Google có thể không thu thập dữ liệu một URL chứa food=sweet trong đường dẫn URL của nó. Kết quả là không thể tìm thấy các trang từ trang web của bạn về đồ ăn ngọt (sweet) trong Google Tìm kiếm.

TIẾP THEO: PHÂN LOẠI THÔNG SỐ URL CỦA BẠN

* Nguồn: Google Search Console