Giới thiệu về bỏ trùng lặp dữ liệu sự kiện offline

30/11/2019

Khi bạn tải dữ liệu sự kiện offline lên, các sự kiện trùng lặp đã được tải lên nhóm sự kiện offline đó trong 4 ngày qua sẽ tự động được bỏ qua hoặc bỏ trùng lặp. Quy trình này giúp đảm bảo độ chính xác trong việc báo cáo ghi nhận và sự kiện offline.

Cách hoạt động

Khi xử lý tệp dữ liệu sự kiện offline để tải lên, hệ thống của Facebook sẽ phát hiện và bỏ qua các sự kiện trùng lặp đã được khớp và tải lên trong 4 ngày qua. Tổ hợp dữ liệu dùng để phát hiện các sự kiện trùng lặp là: ID nhóm sự kiện offline + Mốc thời gian của sự kiện + Hash của các khóa đối chiếu + Tên sự kiện + ID đơn đặt hàng + Số hiệu mặt hàng (tùy chọn).

Quy trình này rất hữu ích khi:

  • Bạn tải lên hàng ngày vào những thời điểm khác nhau và có trùng lặp chút ít với lần tải lên của ngày trước đó.
  • Bạn muốn tải lên lại tệp sự kiện với các trường dữ liệu khách hàng hay khóa đối chiếu bổ sung hoặc cập nhật nhằm cố gắng tăng số lượng sự kiện trùng khớp. Khóa đối chiếu chỉ dùng để khớp sự kiện với mọi người nhằm giúp xác định sự kiện nào sẽ tải lên và không được bỏ trùng lặp.
  • Bạn đã hoàn tất tải lên một phần trong nhiều lần cố gắng tải lên.

Lưu ý: Quy trình bỏ trùng lặp được thiết kế để so sánh dữ liệu sự kiện mới với các sự kiện đã tải lên và được khớp trước đó từ 4 ngày qua nhằm phát hiện và chỉ tải lên các sự kiện mới. Quy trình này không nhằm để chỉnh sửa hoặc cập nhật các giá trị sự kiện đã tải lên trước đó.

Các cách hay nhất để chuẩn bị dữ liệu

Nếu cùng một người thực hiện nhiều giao dịch mua hàng vào các thời điểm khác nhau, bạn có thể đảm bảo chắc chắn hơn rằng tất cả các sự kiện mua hàng đều được xử lý nếu bạn tải lên dấu thời gian chính xác.

Tuy nhiên, chỉ sự kiện đầu tiên sẽ được xử lý (và các sự kiện còn lại sẽ bị bỏ qua) nếu:

  • Bạn tải lên một giao dịch mua hàng dưới dạng nhiều sự kiện, chẳng hạn như phân tách từng dòng mục thành sự kiện riêng mà không cung cấp order_id và item_number.
  • Bạn không có dấu thời gian chính xác, chẳng hạn như nếu dấu thời gian của bạn chỉ hiển thị ngày (không có giờ, phút, giây) và khách hàng thực hiện các giao dịch mua hàng riêng biệt trong cùng một ngày.

Để đảm bảo tất cả các sự kiện mua hàng duy nhất được xử lý, bạn có thể cung cấp order_id (ID giao dịch duy nhất) và item_number để Facebook có thể xác định sự kiện là duy nhất và không có trùng lặp.

Lưu ý: Chuyển đổi offline hiện không dùng trường order_id để báo cáo ID đơn đặt hàng. Trường này chỉ dùng để ngăn bỏ trùng lặp không chính xác như đã mô tả trong tình huống ở trên.

* Nguồn: Facebook