Ẩn IP trong Analytics

30/11/2019

Sơ lược

Khi khách hàng của Analytics yêu cầu ẩn địa chỉ IP, Analytics ẩn danh địa chỉ ngay sau khi khả thi về mặt kỹ thuật ở giai đoạn sớm nhất có thể của mạng thu thập. Tính năng ẩn danh IP trong Analytics đặt octet cuối cùng của địa chỉ IP người dùng IPv4 và 80 bit cuối cùng của địa chỉ IPv6 thành số không trong bộ nhớ ngay sau khi được gửi đến Mạng thu thập Analytics. Địa chỉ IP đầy đủ không bao giờ được ghi vào đĩa trong trường hợp này.

Thông tin chuyên sâu

Kể từ ngày 25 tháng 5 năm 2010, Analytics đã cung cấp tính năng _anonymizelp trong thư viện JavaScript ga.js JavaScript library (và gần đây hơn là ga('set', 'anonymizeIp', true) trong thư viện analytics.js) để cho phép chủ sở hữu trang web yêu cầu ẩn tất cả các địa chỉ IP của người dùng của họ bên trong sản phẩm. Tính năng này được thiết kế để giúp chủ sở hữu trang web tuân thủ chính sách bảo mật riêng của họ hoặc ở một số quốc gia, các khuyến cáo từ các cơ quan bảo vệ dữ liệu địa phương, có thể chặn việc lưu đầy đủ thông tin địa chỉ IP. Việc ẩn danh/che mặt nạ IP diễn ra ngay sau khi Mạng thu thập Analytics nhận được dữ liệu, trước khi diễn ra bất kỳ quá trình lưu trữ hoặc xử lý nào.

Quá trình ẩn danh IP trong Analytics diễn ra trong hai bước trong kênh thu thập: Thẻ JavaScript và Mạng thu thập. Các bước này được giải thích bên dưới.

Thẻ JavaScript Analytics

Khi trình duyệt web bật JavaScript tải một trang bằng thẻ Google Analytic (ga.js hoặc analytics.js), thẻ này thực hiện hai chức năng cùng lúc: tải và xử lý hàng đợi chức năng của Analytics và yêu cầu JavaScript của Analytics. Hàng đợi chức năng là mảng JavaScript mà cấu hình và chức năng thu thập của Analytics được đẩy tới. Những chức năng này được các chủ sở hữu trang web đặt khi triển khai Analytics bao gồm các chức năng như việc xác định số tài khoản Analytics và thực sự gửi dữ liệu xem trang đến Mạng thu thập của Analytics để xử lý.

Khi JavaScript Analytics chạy chức năng từ hàng đợi chức năng kích hoạt dữ liệu để được gửi đến Mạng thu thập Analytics (chức năng này thường là ga ('gửi', 'lượt xem trang') trong thư viện JavaScript analytics.js và _trackPageview trong thư viện ga.js), nó sẽ gửi dữ liệu dưới dạng thông số URL gắn với một yêu cầu HTTP cho http://www.google-analytics.com/_utm.gif (đối với ga.js) và http://www.google-analytics.com/collect (đối với analytics.js). Nếu chức năng ẩn danh được gọi trước chức năng theo dõi trang, một tham số bổ sung sẽ được thêm vào yêu cầu pixel. Tham số ẩn danh IP trông giống như thế này: &aip = 1

Mạng thu thập Analytics

Mạng thu thập Analytics là tập hợp các máy chủ cung cấp hai dịch vụ chính: phân phát ga.js và analytics.js (JavaScript của Analytics) và tập hợp dữ liệu được gửi thông qua yêu cầu cho _utm.gif và/collect.

Khi có yêu cầu ga.js, analytics.js, _utm.gif hoặc /collect, nó bao gồm thông tin bổ sung trong tiêu đề yêu cầu HTTP (tức là loại trình duyệt đang được sử dụng) và trong tiêu đề TCP/IP (tức là địa chỉ IP của người yêu cầu).

Ngay sau khi có yêu cầu cho _utm.gif, yêu cầu được giữ trong bộ nhớ để ẩn danh. Nếu thông số &aip = 1 được tìm thấy trong URL yêu cầu (như có thể được đặt bởi JavaScript Analytics sau khi xử lý chức năng ẩn danh trong ga.js hoặc analytics.js ), thì sau đó octet cuối cùng của địa chỉ IP người dùng được đặt thành số không trong khi vẫn còn ở trong bộ nhớ. Ví dụ: địa chỉ IP là 12.214.31.144 sẽ được thay đổi thành 12.214.31.0. (Nếu địa chỉ IP là địa chỉ IPv6, 80 trong 128 bit cuối cùng được đặt thành số không.) Chỉ sau khi điều này xảy ra, quá trình ẩn danh là yêu cầu được ghi lên đĩa để xử lý. Nếu phương pháp ẩn danh IP được sử dụng, thì địa chỉ IP đầy đủ không bao giờ được ghi lên đĩa như tất cả quy trình ẩn danh xảy ra trong bộ nhớ gần như ngay lập tức sau khi nhận yêu cầu.

* Nguồn: Google Analytics