Giới thiệu về biểu thức chính quy (regex)
Analytics hỗ trợ biểu thức chính quy, do đó bạn có thể tạo các định nghĩa linh hoạt hơn cho những thứ như bộ lọc chế độ xem, mục tiêu, phân đoạn, đối tượng, nhóm nội dung và nhóm kênh.
Trong ngữ cảnh của Analytics, biểu thức chính quy là chuỗi các ký tự cụ thể đối sánh rộng hoặc hẹp với các mẫu trong dữ liệu Analytics của bạn.
Ví dụ: nếu bạn muốn tạo bộ lọc chế độ xem để loại trừ dữ liệu trang web được tạo bởi nhân viên của riêng bạn, bạn có thể sử dụng biểu thức chính quy để loại trừ bất kỳ dữ liệu nào từ toàn bộ dải địa chỉ IP mà nhân viên của bạn sử dụng. Giả sử các địa chỉ IP đó có dải từ 198.51.100.1 - 198.51.100.25. Thay vì nhập 25 địa chỉ IP khác nhau, bạn có thể tạo biểu thức chính quy như 198\.51\.100\.\d* để đối sánh với toàn bộ dải địa chỉ.
Hoặc nếu bạn muốn tạo bộ lọc chế độ xem chỉ bao gồm dữ liệu chiến dịch từ hai thành phố khác nhau, bạn có thể tạo biểu thức chính quy như San Francisco|New York (San Francisco hoặc New York).
Siêu ký tự regex
Ký tự đại diện
. | Đối sánh với bất kỳ ký tự đơn nào (chữ cái, số hoặc ký hiệu) | 1. đối sánh với 10, 1A 1.1 đối sánh với 111, 1A1 Ví dụ: |
? | Đối sánh với ký tự trước đó 0 hoặc 1 lần | 10? khớp với 1, 10 Ví dụ: |
+ | Đối sánh với ký tự trước đó 1 hoặc nhiều lần | 10+ đối sánh với 10, 100 Ví dụ: |
* | Đối sánh với ký tự trước đó 0 hoặc nhiều lần | 1* đối sánh với 1, 10 Ví dụ: |
| | Tạo đối sánh OR Không sử dụng ở cuối một biểu thức |
1|10 đối sánh với 1, 10 Ví dụ: |
Neo
^ | Đối sánh với các ký tự liền kề ở đầu chuỗi | ^10 đối sánh với 10, 100, 10x ^10 không đối sánh với 110, 110x Ví dụ: |
$ | Đối sánh với các ký tự liền kề ở cuối chuỗi | 10$ đối sánh với 110, 1010 10$ không đối sánh với 100, 10x Ví dụ: |
Nhóm
( ) | Đối sánh với các ký tự trong ngoặc theo thứ tự chính xác ở bất kỳ đâu trong chuỗi Cũng được sử dụng để nhóm các biểu thức khác |
(10) đối sánh với 10, 101, 1011 ([0-9]|[a-z]) đối sánh với bất kỳ số hoặc chữ viết thường Ví dụ: |
[ ] | Đối sánh với các ký tự trong ngoặc theo thứ tự bất kỳ ở bất kỳ đâu trong chuỗi | [10] đối sánh với 012, 123, 202, 120, 210 Ví dụ: |
- | Tạo một loạt các ký tự trong dấu ngoặc vuông để đối sánh với bất kỳ đâu trong chuỗi | [0-9] đối sánh với bất kỳ số nào từ 0 đến 9 Ví dụ: |
Thoát
\ | Cho biết rằng ký tự liền kề nên được hiểu theo nghĩa đen chứ không được hiểu là siêu ký tự regex | \. cho biết rằng dấu chấm liền kề nên được hiểu là dấu chấm hoặc dấu thập phân chứ không được hiểu là ký tự đại diện. 216\.239\.32\.34 đối sánh với 216.239.32.34 Ví dụ: |
Mẹo
Giữ biểu thức chính quy của bạn đơn giản. Regex đơn giản giúp người dùng khác hiểu và sửa đổi dễ dàng hơn.
Sử dụng dấu gạch chéo ngược (\) để thoát khỏi siêu ký tự regex khi bạn cần các ký tự đó được hiểu theo nghĩa đen. Ví dụ: nếu bạn sử dụng dấu chấm làm dấu phân tách số thập phân trong địa chỉ IP, hãy thoát khỏi siêu ký tự regex bằng dấu gạch chéo ngược (\) để dấu chấm không được hiểu là ký tự đại diện.
Biểu thức chính quy không cần bao gồm siêu ký tự regex. Ví dụ: bạn có thể tạo phân đoạn cho tất cả dữ liệu từ Ấn Độ với định nghĩa bộ lọc sau: Quốc gia đối sánh với regex Ấn Độ
Biểu thức chính quy về bản chất đối sánh rất nhiều dữ liệu: nếu bạn không chỉ định cho regex biết không nên đối sánh dữ liệu nào, chúng sẽ đối sánh với những gì bạn chỉ định cộng thêm bất kỳ ký tự liền kề nào. Ví dụ: site đối sánh với mysite, yoursite, theirsite, parasite--bất kỳ chuỗi có chứa “site”. Nếu bạn cần thực hiện đối sánh cụ thể, hãy thiết lập cấu trúc regex của bạn cho phù hợp. Ví dụ: nếu bạn chỉ cần đối sánh với chuỗi “site”, hãy thiết lập cấu trúc regex của bạn để “site” vừa là bắt đầu chuỗi vừa là kết thúc chuỗi: ^site$.
* Nguồn: Google Analytics