Duy trì cấu trúc URL đơn giản

30/11/2019

Cấu trúc URL của trang web nên càng đơn giản càng tốt. Hãy xem xét tổ chức nội dung của bạn sao cho URL được tạo một cách logic và dễ hiểu với con người (hãy sử dụng các từ dễ đọc thay cho số ID dài khi có thể). Ví dụ: nếu bạn đang tìm kiếm thông tin về hàng không, một URL như http://en.wikipedia.org/wiki/Aviation sẽ giúp bạn quyết định có nên nhấp vào liên kết đó không. Một URL như http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1, sẽ kém thu hút hơn với người dùng.

Xem xét sử dụng dấu câu trong URL của bạn. URL http://www.example.com/green-dress.html hữu ích hơn nhiều cho chúng tôi so với http://www.example.com/greendress.html. Chúng tôi khuyên bạn nên sử dụng dấu gạch ngang (-) thay cho dấu gạch dưới (_) trong URL của bạn.

Những URL quá phức tạp, đặc biệt là những URL chứa nhiều tham số, có thể gây sự cố cho trình thu thập dữ liệu do tạo ra nhiều URL không cần thiết cùng chỉ đến một nội dung giống nhau hoặc tương tự trên trang web của bạn. Hậu quả là Googlebot có thể tốn nhiều băng thông hơn mức cần thiết, hoặc không thể lập chỉ mục hoàn chỉnh tất cả nội dung trên trang web của bạn.

Nguyên nhân phổ biến của sự cố này

Có thể tạo ra nhiều URL không cần thiết do một số vấn đề. Các sơ đồ trang web này bao gồm:

  • Lọc bổ sung nhóm các mục Nhiều trang web cung cấp các chế độ xem khác nhau của cùng một nhóm các mục hoặc kết quả tìm kiếm, thường cho phép người dùng sử dụng tiêu chí đã xác định để lọc nhóm này (ví dụ: hãy cho tôi biết các khách sạn trên bãi biển). Khi bộ lọc được tổng hợp theo phương thức bổ sung (ví dụ: các khách sạn trên bãi biển có trung tâm thể dục thể hình), số URL (chế độ xem dữ liệu) trong trang web rất nhiều. Việc tạo một số lượng lớn danh sách khách sạn hơi khác nhau là không cần thiết, do Googlebot chỉ cần xem một số lượng nhỏ danh sách mà từ đó nó có thể đi đến trang của mỗi khách sạn. Ví dụ:
    • Tài sản của khách sạn ở "mức giá trị":
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Tài sản của khách sạn ở "mức giá trị" trên bãi biển:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Tài sản của khách sạn ở "mức giá trị" trên bãi biển và có trung tâm thể dục thể hình:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Tạo tài liệu động. Điều này có thể dẫn tới thay đổi nhỏ do các bộ đếm, dấu thời gian hoặc quảng cáo.
  • Thông số có vấn đề trong URL. Ví dụ: ID phiên có thể tạo số lượng sao chép khổng lồ và số URL lớn hơn.
  • Sắp xếp thông số. Một số trang mua sắm lớn đưa ra nhiều cách sắp xếp cùng mục, dẫn đến số lượng URL lớn hơn. Ví dụ:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
       &search_category=25
  • Thông số không liên quan trong URL, như thông số giới thiệu. Ví dụ:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
       OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Sự cố lịch. Lịch được tạo động có thể tạo ra liên kết đến ngày tương lai và ngày đã qua mà không có giới hạn về ngày bắt đầu hoặc ngày kết thúc. Ví dụ:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Liên kết tương đối bị hỏng. Liên kết tương đối bị hỏng thường tạo các khoảng vô hạn. Thông thường, sự cố này xuất hiện do cấu phần đường dẫn bị lặp lại. Ví dụ:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/
      category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
Các bước giải quyết sự cố này

Để tránh các sự cố có khả năng xảy ra với cấu trúc URL, chúng tôi khuyên bạn:

  • Xem xét sử dụng tệp robots.txt để chặn truy cập của Googlebot vào URL có sự cố. Thông thường, bạn nên xem xét việc chặn các URL động, chẳng hạn như các URL tạo kết quả tìm kiếm hoặc URL tạo khoảng vô hạn, chẳng hạn như lịch. Sử dụng các cụm từ thông thường trong tệp robots.txt của bạn có thể cho phép bạn dễ dàng chặn số lượng lớn URL.
  • Bất cứ nơi nào có thể, hãy tránh sử dụng ID phiên trong URL. Hãy kiểm tra Nguyên tắc Quản trị Trang web của chúng tôi để biết thêm thông tin.
  • Bất cứ khi nào có thể, hãy rút ngắn URL bằng cách cắt bớt các tham số không cần thiết.
  • Nếu trang web của bạn có lịch không giới hạn, hãy thêm thuộc tính nofollow vào liên kết đến các trang lịch được tạo động cho các năm sắp tới.
  • Hãy kiểm tra trang web của bạn để tìm liên kết được kết nối bị hỏng.

* Nguồn: Google Search Console