Quản lý các trang web nhiều khu vực và nhiều ngôn ngữ

30/11/2019

Nếu trang web của bạn cung cấp nội dung khác nhau cho người dùng theo các ngôn ngữ, quốc gia hoặc khu vực khác nhau, thì bạn có thể tối ưu hóa kết quả của Google Tìm kiếm cho trang web.

Thông tin cơ bản:

  • Trang web nhiều ngôn ngữ là bất kỳ trang web nào cung cấp nội dung bằng nhiều ngôn ngữ. Ví dụ: một doanh nghiệp Canada có các phiên bản tiếng Anh và tiếng Pháp cho trang web của họ. Google Tìm kiếm sẽ cố gắng tìm các trang phù hợp với ngôn ngữ của người tìm kiếm.
  • Trang web nhiều khu vực là một trang web nhắm mục tiêu rõ ràng đến người dùng ở nhiều quốc gia khác nhau. Ví dụ: một nhà sản xuất gửi hàng đến cả Canada và Hoa Kỳ. Google Tìm kiếm sẽ cố gắng tìm trang địa phương phù hợp cho người tìm kiếm.

Một số trang web vừa nhiều khu vực lại vừa nhiều ngôn ngữ, ví dụ: một trang web có thể có các phiên bản khác nhau cho Hoa Kỳ và Canada và cả phiên bản tiếng Pháp và tiếng Anh cho nội dung ở Canada.

Quản lý các phiên bản nhiều ngôn ngữ của trang web của bạn

Nếu bạn có nội dung giống nhau bằng nhiều ngôn ngữ trên trang web của mình, dưới đây là một số mẹo giúp người dùng (và Google Tìm kiếm) tìm đúng trang:

Sử dụng URL khác nhau cho các phiên bản ngôn ngữ khác nhau

Bạn nên sử dụng các URL khác nhau cho mỗi phiên bản ngôn ngữ của một trang thay vì sử dụng cookie hoặc mục cài đặt trình duyệt để điều chỉnh ngôn ngữ nội dung trên trang.

Nếu bạn sử dụng các URL khác nhau cho các ngôn ngữ khác nhau, hãy sử dụng chú thích hreflang để giúp kết quả tìm kiếm của Google liên kết đến phiên bản ngôn ngữ thích hợp của trang.

Nếu bạn muốn tự động thay đổi nội dung hoặc chuyển hướng người dùng dựa trên tùy chọn cài đặt ngôn ngữ, hãy lưu ý rằng Google có thể không tìm và thu thập dữ liệu được tất cả các phiên bản của bạn. Điều này là do trình thu thập dữ liệu Googlebot thường bắt nguồn từ Hoa Kỳ. Ngoài ra, trình thu thập dữ liệu gửi yêu cầu HTTP mà không thiết lập Accept-Language trong tiêu đề yêu cầu.

Cho Google biết về các phiên bản ngôn ngữ khác nhau

Google hỗ trợ một số phương pháp khác nhau để gắn nhãn các phiên bản ngôn ngữ hoặc khu vực của một trang, bao gồm chú thích hreflang và sơ đồ trang web. Hãy đánh dấu trang của bạn một cách thích hợp.

Đảm bảo rằng ngôn ngữ của trang rõ ràng

Google sử dụng nội dung hiển thị trên trang của bạn để xác định ngôn ngữ của trang. Chúng tôi không sử dụng bất kỳ thông tin ngôn ngữ cấp mã nào như thuộc tính lang hay URL. Bạn có thể giúp Google xác định ngôn ngữ chính xác bằng cách sử dụng một ngôn ngữ duy nhất cho nội dung và thành phần điều hướng trên mỗi trang và bằng cách tránh các bản dịch song song.

Việc chỉ dịch văn bản soạn sẵn trên trang của bạn và đồng thời cung cấp phần lớn nội dung bằng một ngôn ngữ duy nhất (như thường thấy trên các trang có nội dung do người dùng tạo) có thể tạo trải nghiệm người dùng kém nếu cùng nội dung đó xuất hiện nhiều lần trong kết quả tìm kiếm với nhiều ngôn ngữ có sẵn khác nhau.

Sử dụng robots.txt để chặn công cụ tìm kiếm thu thập dữ liệu các trang được dịch tự động trên trang web của bạn. Bản dịch tự động không phải lúc nào cũng có nghĩa và có thể bị xem là spam. Quan trọng hơn, một bản dịch kém hoặc máy móc có thể có tác động xấu đến nhận thức về trang web của bạn.

Cho phép người dùng chuyển đổi ngôn ngữ trên trang

Nếu trang của bạn có nhiều phiên bản, hãy làm những điều sau:

  • Cân nhắc việc thêm siêu liên kết vào các phiên bản ngôn ngữ khác của trang. Bằng cách đó, người dùng có thể nhấp để chọn phiên bản ngôn ngữ khác của trang.
  • Tránh chuyển hướng tự động dựa trên ngôn ngữ dự đoán của người dùng. Các chuyển hướng này có thể ngăn người dùng (và công cụ tìm kiếm) xem được tất cả các phiên bản của trang web của bạn.

Sử dụng các URL theo ngôn ngữ

Bạn có thể sử dụng các từ được bản địa hóa trong URL hoặc sử dụng Tên miền quốc tế hóa (IDN). Tuy nhiên, hãy đảm bảo sử dụng mã hóa UTF-8 trong URL (trong thực tế, bạn nên sử dụng UTF-8 bất cứ khi nào có thể) và nhớ thoát các URL đúng cách khi liên kết đến chúng.

Nhắm mục tiêu nội dung trang web đến một quốc gia cụ thể (nhắm mục tiêu theo địa lý)

Bạn có thể nhắm mục tiêu trang web hoặc các phần trên trang web của bạn đến người dùng ở một quốc gia cụ thể và nói một ngôn ngữ cụ thể. Điều này có thể cải thiện xếp hạng của trang ở quốc gia mục tiêu, nhưng sẽ làm giảm xếp hạng trong kết quả ở khu vực/ngôn ngữ khác.

Để nhắm mục tiêu trang web của bạn theo địa lý trên Google, hãy thực hiện các bước sau:

  • Cấp trang hoặc cấp trang web: Sử dụng URL theo khu vực cho trang web hoặc trang.
  • Cấp trang: Sử dụng hreflang hoặc sơ đồ trang web để cho Google biết vị trí và ngôn ngữ áp dụng cho mỗi trang.
  • Cấp trang web: Nếu trang web của bạn có miền cấp cao nhất chung (ví dụ: .com, .org hoặc .eu), hãy chỉ định khu vực của trang web bằng cách sử dụng báo cáo Nhắm mục tiêu quốc tế. Không sử dụng công cụ này nếu trang web của bạn nhắm mục tiêu nhiều hơn một quốc gia. Ví dụ: việc nhắm mục tiêu Canada cho một trang web về nhà hàng ở Montreal là hợp lý; nhưng việc đặt cùng một mục tiêu này cho trang web nhắm mục tiêu đến người nói tiếng Pháp ở Pháp, Canada và Mali lại không hợp lý.

Xin lưu ý rằng nhắm mục tiêu theo địa lý không phải là khoa học chính xác, vì thế điều quan trọng là phải xem xét đến những người dùng truy cập vào phiên bản "sai" của trang web của bạn. Một cách để thực hiện điều này có thể là hiển thị liên kết trên tất cả các trang để người dùng chọn khu vực và/hoặc ngôn ngữ lựa chọn của họ.

Không sử dụng phân tích IP để điều chỉnh nội dung của bạn. Việc phân tích địa điểm IP rất khó và thường không đáng tin cậy. Hơn nữa, Google có thể không thu thập được dữ liệu các biến thể của trang web một cách chính xác. Trong phần lớn trường hợp, các lần thu thập dữ liệu của Google xuất phát từ Hoa Kỳ và chúng tôi không cố gắng thay đổi vị trí để phát hiện các biến thể của trang web. Hãy sử dụng một trong các phương pháp nêu rõ ràng ở đây (hreflang, URL thay thế và liên kết rõ ràng).

Sử dụng URL theo khu vực

Xem xét sử dụng một cấu trúc URL giúp bạn dễ dàng nhắm mục tiêu trang web hoặc các phần trang web của bạn đến các khu vực khác nhau. Bảng sau mô tả các tùy chọn cho bạn:

Cấu trúc URL URL mẫu Ưu điểm Nhược điểm
Tên miền theo quốc gia example.de
  • Nhắm mục tiêu theo địa lý rõ ràng
  • Vị trí máy chủ không liên quan
  • Dễ dàng phân tách các trang web
  • Đắt tiền (có thể có nguồn cung hạn chế)
  • Yêu cầu nhiều cơ sở hạ tầng hơn
  • Yêu cầu nghiêm ngặt đối với ccTLD (thỉnh thoảng)
Tên miền phụ với gTLD de.example.com
  • Dễ dàng thiết lập
  • Có thể sử dụng nhắm mục tiêu theo địa lý trong Search Console
  • Cho phép các vị trí máy chủ khác nhau
  • Dễ dàng phân tách các trang web
  • Người dùng có thể không nhận ra nhắm mục tiêu theo địa lý chỉ qua URL ("de" là ngôn ngữ hay quốc gia?)
Thư mục con với gTLD example.com/de/
  • Dễ dàng thiết lập
  • Có thể sử dụng nhắm mục tiêu theo địa lý trong Search Console
  • Chi phí bảo trì thấp (cùng máy chủ)
  • Người dùng có thể không nhận ra nhắm mục tiêu theo địa lý chỉ qua URL
  • Một vị trí máy chủ
  • Khó phân tách các trang web
Thông số URL site.com?loc=de
  • Không nên sử dụng.
  • Khó phân đoạn dựa trên URL
  • Người dùng có thể không nhận ra nhắm mục tiêu theo địa lý chỉ qua URL
  • Không thể nhắm mục tiêu theo địa lý trong Search Console

 

Google xác định khu vực đích như thế nào?

Google sử dụng một số tín hiệu để xác định đối tượng mục tiêu tốt nhất cho một trang:

  • Khu vực đích được xác định bằng cách sử dụng báo cáo Nhắm mục tiêu quốc tế của Search Console. Nếu sử dụng tên miền cấp cao nhất chung (gTLD) và sử dụng nhà cung cấp dịch vụ lưu trữ ở một quốc gia khác, bạn nên sử dụng Search Console để cho chúng tôi biết trang web của bạn nên được liên kết với quốc gia nào (nếu bạn muốn nhắm mục tiêu trang web theo địa lý).
  • Tên miền được mã hóa theo quốc gia cấp cao nhất (ccTLD). Chúng được gắn với một quốc gia cụ thể (ví dụ .de cho Đức, .cn cho Trung Quốc) và vì thế là một tín hiệu mạnh cho cả người dùng và công cụ tìm kiếm rằng trang web của bạn rõ ràng dành cho một quốc gia cụ thể. (Một số quốc gia có hạn chế về những người có thể sử dụng ccTLD, vì vậy, hãy đảm bảo bạn phải tìm hiểu trước.) Chúng tôi cũng xem một số ccTLD ảo (chẳng hạn như .tv, .me, v.v.) là gTLD, vì chúng tôi thấy rằng người dùng và quản trị viên thường xem các miền này là chung chứ không phải được nhắm mục tiêu theo quốc gia (chúng tôi không có danh sách đầy đủ các ccTLD mà chúng tôi xem là gTLD vì danh sách đó sẽ thay đổi theo thời gian). Xem danh sách gTLD của Google.
  • Chú thích hreflang, cho dù trong thẻ, tiêu đề hay sơ đồ trang web.
  • Vị trí máy chủ (thông qua địa chỉ IP của máy chủ). Vị trí máy chủ thường nằm gần người dùng của bạn và có thể là tín hiệu về đối tượng mục tiêu của trang web của bạn. Một số trang web sử dụng mạng cung cấp nội dung được phân phối (CDN) hoặc được lưu trữ tại một quốc gia với cơ sở hạ tầng máy chủ web tốt hơn, vì thế, điều này không phải là một tín hiệu chắc chắn.
  • Các tín hiệu khác. Các nguồn gợi ý khác về đối tượng mục tiêu của trang web của bạn có thể bao gồm địa chỉ địa phương và số điện thoại trên trang, việc sử dụng ngôn ngữ và tiền tệ địa phương, liên kết từ các trang web địa phương khác và/hoặc việc sử dụng Google Doanh nghiệp của tôi (nếu có).

Những việc Google không làm:

  • Google thu thập dữ liệu web từ các vị trí khác nhau trên khắp thế giới. Chúng tôi không cố gắng sử dụng trình thu thập dữ liệu từ nhiều nguồn khác nhau cho một trang web để tìm mọi phiên bản có thể có của một trang. Do đó, bất kỳ phiên bản theo khu vực hoặc ngôn ngữ nào của trang web của bạn đều phải được thông báo cho Google một cách rõ ràng bằng các phương pháp hiển thị ở đây (chẳng hạn như mục hreflang, ccTLD hoặc liên kết rõ ràng).
  • Google bỏ qua các thẻ meta vị trí (như geo.position hay distribution) hoặc thuộc tính HTML nhắm mục tiêu theo địa lý.

Xử lý các trang trùng lặp trong trường hợp trang web nhiều khu vực/ngôn ngữ

Nếu cung cấp nội dung tương tự hoặc trùng lặp trên các URL khác nhau có cùng ngôn ngữ thuộc một trang web nhiều khu vực (ví dụ: nếu cả example.de/example.com/de/ đều hiển thị nội dung tiếng Đức giống nhau), bạn nên chọn một phiên bản ưa thích và sử dụng phần tử liên kết rel=canonical và thẻ hreflang để đảm bảo người tìm kiếm được cung cấp URL khu vực hay ngôn ngữ thích hợp.

 

Tên miền cấp cao nhất chung

Miền cấp cao nhất chung (gTLD) là các miền không được liên kết với vị trí cụ thể. Nếu trang web của bạn có miền cấp cao nhất chung chẳng hạn như .com, .org hoặc bất kỳ miền nào được liệt kê dưới đây và muốn nhắm mục tiêu đến người dùng ở các vị trí địa lý cụ thể, bạn nên đặt mục tiêu quốc gia rõ ràng bằng một trong các phương pháp nêu trên.

Google xử lý các miền sau như gTLD có thể được nhắm mục tiêu địa lý trong Search Console:

  • Miền cấp cao nhất chung (gTLD): Trừ khi miền cấp cao nhất được đăng ký dưới dạng miền cấp cao nhất theo mã quốc gia (ccTLD) với ICANN, Google sẽ xử lý bất kỳ TLD nào phân giải thông qua vùng gốc DNS IANA là gTLD. Ví dụ:
    • .com
    • .org
    • .edu
    • .gov
    • và nhiều miền khác...
  • Miền cấp cao nhất theo khu vực chung: Mặc dù các miền này được liên kết với một khu vực địa lý, chúng thường được xử lý như miền cấp cao nhất chung (giống như .com hoặc .org):
    • .eu
    • .asia
  • Miền cấp cao nhất theo mã quốc gia chung (ccTLD): Google xử lý một số ccTLD (như .tv, .me, v.v.) như gTLD, vì chúng tôi thấy rằng người dùng và quản trị viên web thường xem các trang web này là trang chung hơn là được nhắm mục tiêu quốc gia. Đây là danh sách các ccTLD đó (danh sách này có thể thay đổi).
    • .ad
    • .as
    • .bz
    • .cc
    • .cd
    • .co
    • .dj
    • .fm
    • .io
    • .la
    • .me
    • .ms
    • .nu
    • .sc
    • .sr
    • .su
    • .tv
    • .tk
    • .ws

* Nguồn: Google Search Console