Báo cáo Sơ đồ trang web
Sử dụng báo cáo Sơ đồ trang web để xem những sơ đồ trang web đã xử lý cho trang web của bạn, bất kỳ lỗi xử lý nào hoặc để gửi sơ đồ trang web mới cho trang web. Công cụ Search Console mới khuyến khích việc sử dụng sơ đồ trang web để giúp Google phát hiện đúng nội dung trên trang web của bạn và cải thiện theo dõi nội dung và báo cáo lỗi.
Thêm sơ đồ trang web
Để gửi sơ đồ trang mới để thu thập dữ liệu, hãy thực hiện theo các bước sau:
- Đăng sơ đồ trang web trên trang web của bạn.
- Sơ đồ trang web phải sử dụng một trong các định dạng được chấp nhận.
- Googlebot phải truy cập được vào sơ đồ trang web và sơ đồ không bị chặn bởi bất kỳ yêu cầu đăng nhập nào.
- Nhập URL tương đối cho sơ đồ trang web vào báo cáo Sơ đồ trang web và nhấp vào Gửi.
- Sơ đồ trang web sẽ được xử lý ngay lập tức. Tuy nhiên, có thể mất một thời gian để thu thập dữ liệu các URL có trong sơ đồ trang web, và có thể không phải toàn bộ URL trong sơ đồ đều sẽ được thu thập dữ liệu, tùy thuộc vào kích thước trang web, hoạt động, lưu lượng truy cập, v.v.
Để gửi lại sơ đồ trang web, hãy thực hiện lại các bước này.
Hiểu báo cáo
Báo cáo có các thông tin sau. Để biết thêm thông tin không hiển thị ở đây, bạn có thể mở báo cáo Sơ đồ trang web cũ.
Báo cáo cung cấp thông tin sau cho mỗi sơ đồ trang web đã gửi:
- URL sơ đồ trang web: URL nơi bản đồ trang web được đăng. Các sơ đồ trang web nằm trong mọi thư mục hoặc thư mục con đều sẽ hiển thị. Vì vậy, nếu sản phẩm là example.com/, thì tất cả các sơ đồ trang web example.com/map.xml, example.com/a/map.xml và example.com/a/b/map.xml đều có thể hiển thị.
- Loại: Loại sơ đồ trang web. Các giá trị có thể:
- Sơ đồ trang web: Sơ đồ trang web chuẩn
- Chỉ mục sơ đồ trang web: Đây là một sơ đồ về nhiều sơ đồ trang web khác
- Không xác định: Tệp đã gửi không thuộc một loại sơ đồ trang web đã biết hoặc sơ đồ trang web chưa được xử lý.
- Ngày gửi: Ngày gửi sơ đồ trang web.
- Lần xử lý cuối cùng: Lần cuối cùng sơ đồ trang web được xử lý bởi Google.
- Trạng thái: Trạng thái gửi hay thu thập dữ liệu. Các giá trị có thể:
- Đã xử lý thành công: Sơ đồ trang web đã được tải và xử lý thành công mà không gặp lỗi. Tất cả URL đều sẽ được đưa vào hàng đợi thu thập dữ liệu.
- Có vấn đề: Sơ đồ trang web có một hoặc nhiều lỗi; bất kỳ URL nào có thể truy xuất từ sơ đồ trang web đều sẽ được đưa vào hàng đợi thu thập dữ liệu.
- Không thể tìm nạp: Không thể tìm nạp sơ đồ trang web vì một lý do nào đó.
- Số URL: Số URL được liệt kê trong sơ đồ trang web. Nếu đây là chỉ mục sơ đồ trang web thì số này là tổng số URL trong tất cả sơ đồ trang web được tham chiếu. Các URL trùng lặp chỉ được tính một lần.
Sơ đồ trang web của tôi không có trong báo cáo!
Dưới đây là một vài lý do bạn có thể không thấy sơ đồ trang web trong báo cáo:
- Sơ đồ nằm trên một sản phẩm khác Các sơ đồ trang web liên kết với một sản phẩm sẽ không hiển thị trên sản phẩm khác. Do đó, sơ đồ trang web bạn đã gửi cho trang web
http://example.com
sẽ không hiển thị trong báo cáo Sơ đồ trang web chohttp://www.example.com
. hoặchttps://example.com
. Để giải quyết vấn đề này, hãy đảm bảo rằng bạn đã thêm tất cả phiên bản của trang web của mình trong sơ đồ, cho Google biết miền ưa thích và chỉ gửi sơ đồ trang web cho miền ưa thích. - Bạn không gửi sơ đồ trang web bằng báo cáo này Báo cáo này chỉ hiển thị các sơ đồ trang web mà bạn gửi bằng báo cáo. Những sơ đồ trang web được phát hiện hoặc gửi bằng các phương pháp khác sẽ không hiển thị, ngay cả khi Google có thể tìm thấy và sử dụng chúng.
Lỗi sơ đồ trang web
Sơ đồ báo cáo trang web cung cấp thông tin về các lỗi sau.
Danh sách lỗi đầy đủ
URL không thể truy cập được
Cho biết Google đã gặp lỗi khi thử xem một URL trong sơ đồ trang web của bạn. Kiểm tra URL trong sơ đồ trang web bằng cách sử dụng công cụ kiểm tra URL để biết Google có thể xem URL này hay không.
Không thể theo URL
Thường chỉ báo rằng Google không thể xử lý hoàn toàn sơ đồ trang web của bạn vì một số URL chứa quá nhiều chuyển hướng khiến trình thu thập dữ liệu web của Google không thể theo toàn bộ chúng. Chúng tôi đề nghị bạn nên thay thế mỗi URL chuyển hướng đến một trang khác bằng URL mà chuyển hướng đó trỏ tới (URL đích).
Danh sách sau đây mô tả một số lý do bổ sung khiến Google không thể theo một chuyển hướng kèm theo các giải pháp khả thi:
- Hãy sử dụng trình duyệt văn bản như Lynx để kiểm tra trang web của bạn vì có nhiều công cụ tìm kiếm có thể xem trang web của bạn như Lynx. Nếu tính năng như Javascript, cookie, ID phiên, khung, DHTML hoặc Flash ngăn bạn xem được toàn bộ trang web mình trong một trình duyệt văn bản thì khi đó các trình thu thập dữ liệu của công cụ tìm kiếm đơn giản có thể gặp khó khăn khi thu thập dữ liệu trang web của bạn.
- Nếu bạn đang chuyển hướng vĩnh viễn từ trang này sang trang khác, bạn có thể sử dụng chuyển hướng vĩnh viễn; bạn nên tránh sử dụng JavaScript hoặc chuyển hướng loại làm mới meta.
- Nếu có thể, hãy sử dụng liên kết tuyệt đối hoặc đầy đủ chứ không phải liên kết tương đối. Ví dụ: khi liên kết đến một trang khác trong trang web của bạn, hãy liên kết đến
https://www.example.com/mypage.html
hơn là chỉmypage.html
.
URL không được phép
Sơ đồ trang web của bạn bao gồm một số URL ở cấp cao hơn hoặc miền khác so với tệp sơ đồ trang web.
Cấp cao hơn: Nếu sơ đồ trang web của bạn nằm trong http://www.example.com/mysite/sitemap.xml
, thì các URL sau không hợp lệ cho sơ đồ trang web đó:
http://www.example.com/
- URL này ở cấp cao hơn sơ đồ trang webhttp://www.example.com/yoursite/
- URL này nằm trong thư mục song song với sơ đồ trang web
Miền khác: Kiểm tra để đảm bảo tất cả URL đều bắt đầu với cùng một miền như vị trí sơ đồ trang web của bạn. Ví dụ, nếu sơ đồ trang web của bạn nằm tại http://www.example.com/sitemap.xml
, các URL sau không hợp lệ cho sơ đồ trang web đó:
http://example.com/
- Thiếu "www"www.example.com/
- Thiếu "http"https://www.example.com/
- Sử dụng https thay vì http
Lỗi nén
Google đã gặp phải lỗi khi tiến hành giải nén cho tệp nén sơ đồ trang web của bạn. Nén lại tệp sơ đồ trang web của bạn (bằng công cụ như gzip), tải tệp đã nén lên trang web và gửi lại.
Sơ đồ trang web trống
Sơ đồ trang web của bạn không chứa bất kỳ URL nào. Kiểm tra sơ đồ trang web của bạn và đảm bảo rằng nó không trống. Nếu sơ đồ trang web của bạn sử dụng giao thức sơ đồ trang web, hãy đảm bảo rằng các URL được gắn thẻ chính xác.
Lỗi kích thước tệp sơ đồ trang web: Sơ đồ trang web của bạn vượt quá giới hạn kích thước tệp tối đa.
Sơ đồ trang web của bạn lớn hơn 50MB khi đã giải nén. Nếu sơ đồ trang web của bạn lớn hơn giới hạn, hãy chia sơ đồ thành nhiều sơ đồ trang web nhỏ hơn và liệt kê chúng trong tệp chỉ mục sơ đồ trang web rồi gửi (các) tệp chỉ mục sơ đồ trang web.
Giá trị thuộc tính không hợp lệ
Bạn chỉ định một giá trị không hợp lệ cho thuộc tính thẻ XML. Kiểm tra sơ đồ trang web để đảm bảo rằng chỉ các thuộc tính được phép hiện diện, và bạn chỉ gán các giá trị được phép theo đặc tả sơ đồ trang web. Kiểm tra chính tả của thuộc tính và giá trị của bạn.
Ngày không hợp lệ
Sơ đồ trang web của bạn có chứa một hoặc nhiều giá trị ngày không hợp lệ. Lỗi này có thể là vì ngày có định dạng không đúng hoặc ngày không hợp lệ. Giá trị ngày phải sử dụng Chuẩn mã hoá ngày giờ W3C, mặc dù bạn có thể bỏ qua phần giờ. Đảm bảo rằng ngày của bạn khớp với một trong các định dạng ngày giờ W3C sau:
2005-02-21 2005-02-21T18:00:15+00:00
Việc xác định thời gian là tùy chọn (thời gian mặc định là 00:00:00Z), nhưng nếu bạn chỉ định thời gian, bạn cũng phải xác định múi giờ.
Giá trị thẻ không hợp lệ
Sơ đồ trang web của bạn chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Lỗi sẽ liệt kê thẻ có lỗi. Kiểm tra đặc tả cho loại sơ đồ trang web của bạn (chỉ mục, tiêu chuẩn, video, v.v.).
URL không hợp lệ
Một URL trong sơ đồ trang web của bạn không hợp lệ. Lỗi này có thể là vì URL có chứa ký tự không được hỗ trợ, khoảng trắng hoặc các ký tự khác như dấu trích hoặc có thể có định dạng không chính xác (ví dụ,htp://
thay vì http://
). Hãy đảm bảo rằng các URL có trong sơ đồ trang web của bạn đều được mã hóa để dễ đọc và thoát đúng cách. Kiểm tra xem có bất kỳ ký tự không đúng nào như khoảng trắng hay dấu trích hay không. Bạn cũng có thể thử sao chép URL vào một trình duyệt để xem trình duyệt đó có thể hiểu được URL này và tải được trang không.
URL không hợp lệ trong tệp chỉ mục sơ đồ trang web: URL không đầy đủ
Tệp chỉ mục sơ đồ trang web của bạn không bao gồm URL đầy đủ cho mỗi tệp sơ đồ trang web trong chỉ mục. Khi thấy tệp chỉ mục sơ đồ trang web, chúng tôi sẽ tìm các tệp mà chỉ mục tham chiếu trong cùng thư mục đó. Ví dụ: nếu tệp chỉ mục sơ đồ trang web của bạn nằm tại http://www.example.com/folder1/sitemap_index.xml và liệt kê một sơ đồ trang web dưới dạng sitemap.xml, chúng tôi sẽ tìm sơ đồ trang web đó tại http://www.example.com/folder1/sitemap.xml. Nếu chúng tôi không thể tìm thấy sơ đồ ở đó, bạn sẽ thấy lỗi này.
Cập nhật tệp chỉ mục sơ đồ trang web của bạn để bao gồm đường dẫn đầy đủ đến từng tệp sơ đồ trang web được liệt kê, sau đó gửi lại.
XML Không hợp lệ: quá nhiều thẻ
Sơ đồ trang web của bạn chứa các thẻ trùng lặp. Ví dụ: mục nhập sau đây sẽ gây ra lỗi này vì thẻ
http://www.example.com/ http://www.example.com/page1.html 2005-01-01 monthly 0.8
Lỗi liệt kê thẻ có vấn đề và số dòng. Xóa thẻ trùng lặp và gửi lại sơ đồ trang web của bạn.
Thiếu thuộc tính XML
Một thẻ trong sơ đồ trang web của bạn bị thiếu một thuộc tính bắt buộc. Kiểm tra sơ đồ trang web của bạn để đảm bảo rằng không có thuộc tính bắt buộc nào bị thiếu. Khi bạn đã sửa giá trị thuộc tính, hãy gửi lại sơ đồ trang web của bạn.Thiếu thẻ XML
Một hoặc nhiều mục nhập trong sơ đồ trang web của bạn thiếu một thẻ bắt buộc. Thông báo lỗi liệt kê số dòng. Xem lại trang kiến thức cơ bản về sơ đồ trang web để biết thông tin về thẻ bắt buộc.
URL hình ảnh thu nhỏ bị thiếu
Một hoặc nhiều mục video bị thiếu URL cho hình ảnh thu nhỏ. Hãy đảm bảo xác định vị trí của bất kỳ URL hình ảnh thu nhỏ nào bằng cách sử dụng thẻ
Thiếu tiêu đề video
Một hoặc nhiều mục video bị thiếu tiêu đề. Đảm bảo mỗi video trong sơ đồ trang web của bạn đều có tiêu đề, được xác định trong thẻ
Định dạng chỉ mục sơ đồ trang web không chính xác: Chỉ mục sơ đồ trang web lồng ghép
Một hoặc nhiều mục nhập trong tệp chỉ mục sơ đồ trang web của bạn sử dụng URL của riêng mục dod hoặc URL của một tệp chỉ mục sơ đồ trang web khác.
Một tệp chỉ mục sơ đồ trang web chỉ được liệt kê các tệp sơ đồ trang web, không được liệt kê các tệp chỉ mục sơ đồ trang web khác.
Xóa bất kỳ mục nhập nào trỏ đến tệp chỉ mục sơ đồ trang web rồi gửi lại sơ đồ trang web của bạn.Lỗi phân tích cú pháp
Google không thể phân tích cú pháp XML của sơ đồ trang web.Vấn đề này thường được gây ra bởi một ký tự chưa được thoát trong URL. Cũng như với tất cả các tệp XML, bất kỳ giá trị dữ liệu nào (kể cả các URL) cũng phải sử dụng các mã thoát của thực thể cho các ký tự cụ thể như các biểu tượng & ' " <>. Hãy đảm bảo rằng URL của bạn được thoát đúng cách.
Lỗi tạm thời
Hệ thống của chúng tôi gặp phải vấn đề tạm thời ngăn chúng tôi xử lý sơ đồ trang web của bạn. Nói chung, khi bạn thấy lỗi này, bạn không cần phải gửi lại sơ đồ trang web của bạn. Google có thể cố gắng truy xuất lại sơ đồ trang web của bạn sau này. Nếu lỗi vẫn tồn tại sau vài giờ, hãy thử gửi lại sơ đồ trang web của bạn.
Quá nhiều sơ đồ trang web trong tệp chỉ mục sơ đồ trang web
Tệp chỉ mục sơ đồ trang web của bạn liệt kê hơn 50.000 sơ đồ trang web. Tách chỉ mục sơ đồ trang web của bạn thành nhiều tệp chỉ mục sơ đồ trang web và đảm bảo rằng mỗi danh sách có không quá 50.000 sơ đồ trang web.
Quá nhiều URL trong sơ đồ trang web
Sơ đồ trang web của bạn liệt kê hơn 50.000 URL. Tách sơ đồ trang web của bạn thành nhiều Sơ đồ trang web và đảm bảo rằng mỗi sơ đồ chứa không quá 50.000 URL. Bạn cũng có thể sử dụng tệp chỉ mục sơ đồ trang web để quản lý sơ đồ trang web của bạn.
Định dạng không được hỗ trợ
Sơ đồ trang web của bạn không có định dạng được hỗ trợ.
Một số lỗi XML thường gặp:
- Sơ đồ trang web của bạn phải sử dụng tiêu đề chính xác. Ví dụ: nếu sơ đồ trang web của bạn có chứa thông tin video, nó sẽ có tiêu đề sau đây:
- Vùng chứa tên trong tiêu đề phải là "http://www.sitemaps.org/schemas/sitemap/0.9" (không phải .9).
- Tất cả thuộc tính XML phải nằm trong dấu nháy đơn (') hoặc dấu ngoặc kép (") và cdấu ngoặc kép đó phải thẳng chứ không móc. Chương trình xử lý văn bản như Microsoft Word có thể chèn dấu ngoặc móc.
Đường dẫn không khớp: Thiếu www
Đường dẫn tới sơ đồ trang web của bạn không chứa tiền tố www
(ví dụ, http://example.com/sitemap.xml
), nhưng URL trong sơ đồ trang web của bạn lại có tiền tố đó (ví dụ, http://www.example.com/myfile.html
).
Nếu bạn muốn gửi sơ đồ trang web của bạn đến đường dẫn không có www, nhưng URL trong sơ đồ là www, hãy chọn www làm miền ưa thích cho trang web của bạn.
Nếu không, sửa đổi sơ đồ trang web của bạn để xóa "www" khỏi tất cả các URL để khớp với vị trí sơ đồ trang web của bạn.
Đường dẫn không khớp: Bao gồm www
Đường dẫn tới sơ đồ trang web của bạn chứa tiền tố www
(ví dụ: http://www.example.com/sitemap.xml
), nhưng URL trong sơ đồ trang web của bạn lại không có tiền tố đó (ví dụ: http://example.com/myfile.xml
).
Nếu bạn muốn gửi sơ đồ trang web của bạn đến đường dẫn có www, nhưng URL trong sơ đồ không phải www, hãy chọn không phải www làm miền ưa thích cho trang web của bạn.
Nếu không, hãy sửa đổi sơ đồ trang web của bạn để thêm "www" vào tất cả các URL để khớp với vị trí sơ đồ trang web của bạn.
Vùng chứa tên sai
Phần tử gốc của sơ đồ trang web của bạn không có vùng chứa tên chính xác, hoặc vùng chứa tên được khai báo sai hoặc có lỗi chính tả hay URL không chính xác.
Đảm bảo rằng bạn đang sử dụng vùng chứa tên chính xác cho loại tệp của bạn. Ví dụ:
- Tệp sơ đồ trang web:
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
- Tệp sơ đồ trang web video:
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
- Tệp chỉ mục sơ đồ trang web:
- Loại sơ đồ trang web khác...
Bắt đầu bằng khoảng trắng
Sơ đồ trang web của bạn bắt đầu với khoảng trắng, chứ không phải khai báo vùng chứa tên. Tệp XML phải bắt đầu với khai báo XML trong đó xác định phiên bản XML được sử dụng.
Lỗi này sẽ không ngăn Google xử lý sơ đồ trang web của bạn, nhưng bạn có thể muốn xóa khoảng trắng để các tệp tuân theo chuẩn XML và bạn không còn thấy lỗi này.
Lỗi HTTP [mã cụ thể]
Google đã gặp phải lỗi HTTP khi đang cố gắng tải xuống sơ đồ trang web của bạn. Thông báo này sẽ hiển thị mã trạng thái chúng tôi nhận được (ví dụ: 404). Đảm bảo rằng URL của sơ đồ trang web mà bạn chỉ định là đúng và sơ đồ trang web đó có ở vị trí bạn chỉ định. Sau đó, gửi lại sơ đồ trang web của bạn.
Hình thu nhỏ quá lớn
Hình thu nhỏ video được xác định trong sơ đồ trang web của bạn quá lớn. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn với thông tin mới rồi gửi lại. Thông tin khác về việc thêm thông tin video vào sơ đồ trang web.
Hình thu nhỏ quá nhỏ
Hình thu nhỏ video được xác định trong sơ đồ trang web của bạn quá nhỏ. Hãy đổi kích thước hình thu nhỏ video của bạn sang 160 x 120px. Cập nhật sơ đồ trang web của bạn nếu cần thiết. Thông tin khác về việc thêm thông tin video vào sơ đồ trang web.
Vị trí video và vị trí trang phát giống nhau
Trong một sơ đồ trang web video, URL nội dung video và URL trình phát không được giống nhau. Nếu bạn cung cấp cả
và
, các URL phải khác nhau. Thông tin khác về việc thêm thông tin video vào sơ đồ trang web.
URL vị trí video dường như là URL trang phát
Trong một sơ đồ trang web video, URL
trỏ đến trang chứa trình phát. Thông tin khác về việc thêm thông tin video vào sơ đồ trang web.
Sơ đồ trang web chứa url bị chặn bởi robots.txt
Google không thể truy cập sơ đồ trang web của bạn, hoặc không thể truy cập vào tất cả các nội dung liệt kê trong sơ đồ trang web của bạn vì bị chặn bởi robots.txt
. Sử dụng công cụ Kiểm tra URL để xác minh xem tệp nào đang chặn Googlebot và sửa đổi tệp robots.txt của bạn để cho phép Googlebot truy cập sơ đồ trang web.
Vấn đề đã biết
Dưới đây là các vấn đề đã biết trong phiên bản beta này của Search Console mới. Bạn không cần báo cáo các vấn đề này cho chúng tôi, nhưng chúng tôi rất muốn nhận được phản hồi của bạn về bất kỳ tính năng hoặc vấn đề nào bạn tìm thấy. Hãy sử dụng cơ chế Phản hồi trong thanh điều hướng.
- Nguồn cấp dữ liệu RSS chưa được hỗ trợ.
- Trải nghiệm di động vẫn chưa hoàn tất.
- Tập hợp sản phẩm chưa được hỗ trợ.
- Chỉ có báo cáo về các URL thuộc sản phẩm hiện được chọn.
* Nguồn: Google Search Console