Thêm vào đó, Facebook đã cố tình không tuân theo tín hiệu “không theo dõi” do Internet Explorer gửi đi, lấy lý do là nó “không có sự đồng thuận của toàn ngành.” Trình theo dõi của Facebook có các hình thức cổ điển: cookie, JavaScript, ảnh 1 pixel, và iframe. Điều này cho phép các nhà quảng cáo có thể quét và truy cập các cookie cũng như các trình theo dõi cụ thể của trình duyệt để phân phối sản phẩm, dịch vụ, và quảng cáo, cả trong và ngoài Facebook.
May mắn là có các tiện ích mở rộng trình duyệt giúp chặn các dịch vụ Facebook trên các website của bên thứ ba, ví dụ như Facebook Disconnect dành cho Chrome và Facebook Privacy List trên Adblock Plus (hoạt động với cả Firefox và Chrome). Mục tiêu cuối cùng của tất cả các công cụ plugin này là mang đến cho bạn quyền kiểm soát những gì bạn chia sẻ với Facebook cũng như bất kỳ mạng xã hội nào khác thay vì để bạn phải khoanh tay ngồi nhìn các dịch vụ bạn sử dụng chi phối những điều đó.
Với những gì Facebook biết về 1,65 tỉ thuê bao của mình, công ty này khá tử tế – cho đến nay là như vậy. Họ có hàng tấn dữ liệu, nhưng cũng giống như Google, họ đã quyết định không hành động trên tất cả số dữ liệu đó. Nhưng điều đó không có nghĩa là họ sẽ không làm gì.
Không giấu diếm như cookie – nhưng khả năng ký sinh cũng bền bỉ không kém – là các thanh công cụ (toolbar). Thanh công cụ bổ sung mà bạn thấy ở phần đầu trình duyệt trên máy tính cá nhân truyền thống có thể ghi tên YAHOO, MCAFEE, ASK, hoặc tên của bất kỳ công ty nào khác. Rất có thể bạn không nhớ làm thế nào mà thanh công cụ này lại xuất hiện ở đó. Bạn cũng không bao giờ sử dụng nó. Và bạn cũng không biết cách xóa bỏ nó.
Những thanh công cụ như thế này thu hút sự chú ý của bạn, khiến bạn quên mất thanh công cụ đi kèm với trình duyệt của bạn. Thanh công cụ gốc cho phép bạn chọn công cụ tìm kiếm mặc định. Thanh công cụ ký sinh sẽ đưa bạn đến trang tìm kiếm riêng của mình, và kết quả trả về có thể chứa đầy các nội dung được tài trợ. Điều này đã xảy ra với Gary More, một cư dân ở Tây Hollywood. Anh gặp thanh công cụ Ask.com mà không có cách nào để gỡ bỏ nó. “Nó hệt như một khách trọ xấu tính vậy,” More nói. “Nó không chịu rời đi.”
Nếu bạn có thanh công cụ thứ hai hoặc thứ ba, có thể là do bạn đã tải xuống phần mềm mới hoặc vừa cập nhật phần mềm hiện tại. Ví dụ, nếu bạn mới cài đặt Java, nhà cung cấp Java là Oracle sẽ tự động bổ sung một thanh công cụ trừ khi bạn yêu cầu không cài. Khi nhấp chuột trên màn hình tải xuống hoặc cập nhật, có thể bạn không để ý thấy ô đánh dấu nhỏ mặc định cho biết bạn đã đồng ý cài đặt thanh công cụ. Điều này không có gì là bất hợp pháp; bạn đã đồng ý, dù rằng điều đó có nghĩa là bạn cũng chọn cài đặt nó tự động. Nhưng thanh công cụ đó cho phép công ty khác theo dõi thói quen duyệt web của bạn và có thể thay đổi công cụ tìm kiếm mặc định của bạn sang dịch vụ riêng của nó.
Cách tốt nhất để loại bỏ thanh công cụ là gỡ cài đặt theo cách gỡ các chương trình trên máy tính cá nhân truyền thống. Nhưng một số thanh công cụ gan lỳ có thể yêu cầu bạn phải tải xuống công cụ gỡ, và thường quá trình gỡ cài đặt này có thể để lại đủ thông tin để các đại lý quảng cáo liên quan đến thanh công cụ đó thực hiện cài đặt lại nó.
Khi cài đặt phần mềm mới hoặc cập nhật phần mềm hiện tại, hãy để ý đến tất cả các ô chọn. Bạn có thể tránh được rất nhiều rắc rối nếu không đồng ý cài đặt các thanh công cụ này ngay từ đầu.
Điều gì sẽ xảy ra nếu bạn sử dụng tính năng duyệt web riêng tư, dùng NoScript, HTTPS Everywhere, và định kỳ xóa các cookie trình duyệt và thanh công cụ bổ sung? Liệu bạn sẽ an toàn hay không? Không. Bạn vẫn có thể bị theo dõi trực tuyến.
Các website được mã hóa bằng ngôn ngữ đánh dấu siêu văn bản, hay HTML. Phiên bản hiện hành, HTML5, có nhiều tính năng mới, trong đó có những tính năng giúp loại bỏ các siêu cookie Silverlight và Flash nhanh hơn – đây là một điều tốt. Tuy nhiên, có lẽ do vô tình, HTML5 lại cho phép các công nghệ theo dõi mới.
Một trong số đó là canvas fingerprinting, một công cụ theo dõi trực tuyến tuyệt vời theo cách rất đáng sợ. Canvas fingerprinting sử dụng phần tử canvas[67] của HTML5 để vẽ một hình ảnh đơn giản. Chỉ như vậy là xong. Quá trình vẽ diễn ra bên trong trình duyệt và không hiển thị cho bạn thấy. Tất cả chỉ mất một phần nhỏ của một giây. Nhưng kết quả sẽ hiển thị trên website truy vấn.
[67] Canvas: Thẻ <canvas> được dùng để vẽ đồ họa thông qua JavaScript.
Ý tưởng ở đây là phần cứng và phần mềm của bạn, khi được kết hợp thành tài nguyên của trình duyệt, sẽ hiển thị hình ảnh đó một cách riêng biệt, không giống với bất kỳ hình ảnh nào khác. Hình ảnh này – có thể là một loạt các hình dạng có màu sắc khác nhau – sau đó được chuyển đổi thành một số duy nhất, gần giống như mật khẩu. Số này tiếp tục được đối chiếu với các trường hợp mà nó được nhìn thấy trên các website khác trong Internet. Và từ đó – từ số lượng các địa điểm mà số duy nhất đó được nhìn thấy – hồ sơ về các website bạn đã truy cập sẽ được hình thành. Có thể dùng số này, hay còn gọi là canvas fingerprinting, để xác định trình duyệt của bạn khi nó quay trở lại website yêu cầu nó, ngay cả khi bạn đã xóa tất cả cookie hoặc chặn việc cài đặt cookie trong tương lai, vì nó sử dụng một phần tử đã được tích hợp vào chính bản thân HTML5.
Canvas fingerprinting là một tiến trình chạy ngầm tự động; nó không yêu cầu bạn phải bấm hoặc làm bất cứ điều gì mà chỉ đơn giản là xem một trang web. May mắn thay, có một số plugin trên trình duyệt có thể chặn nó. Đối với Firefox có CanvasBlocker. Đối với Google Chrome có CanvasFingerprintBlock. Ngay cả dự án Tor cũng mới bổ sung công nghệ chống canvas cho trình duyệt của mình.
Nếu bạn sử dụng các plugin này và làm theo tất cả những lời khuyên khác của tôi, có thể bạn sẽ nghĩ rằng cuối cùng mình cũng không còn bị theo dõi trực tuyến nữa. Nhưng bạn sai rồi.
Các công ty như Drawbridge, Tapad, và Crossswise của Oracle, đã nâng kỹ thuật theo dõi trực tuyến lên một bước nữa. Họ tuyên bố sở hữu các công nghệ có thể theo dõi sở thích của bạn trên nhiều thiết bị, bao gồm cả những website bạn chỉ truy cập trên điện thoại di động và máy tính bảng.
Một số kỹ thuật theo dõi kiểu này là kết quả của việc ứng dụng máy học và logic mờ[68]. Ví dụ: nếu thiết bị di động và máy tính cá nhân truyền thống đều liên hệ với một website qua cùng một địa chỉ IP, thì rất có thể chúng có chung một chủ sở hữu. Chẳng hạn, nếu bạn dùng điện thoại di động để tìm kiếm một món quần áo, rồi khi về nhà sử dụng máy tính cá nhân truyền thống, bạn sẽ thấy món đồ đó trong phần “đã xem gần đây” trên website của nhà bán lẻ. Kết quả tốt hơn nữa là bạn mua món đồ trên bằng máy tính cá nhân. Càng có nhiều kết quả tương đồng giữa các thiết bị khác nhau, khả năng chúng có chung một người sử dụng càng cao. Drawbridge tuyên bố trong năm 2015, họ đã liên kết 1,2 tỉ người dùng qua 3,6 tỉ thiết bị khác nhau.
[68] Logic mờ (fuzzy logic): Một hình thức logic đa trị, dùng để xử lý khái niệm về sự thật một phần, trong đó giá trị đúng có thể dao động từ hoàn toàn đúng sang hoàn toàn sai thay vì logic Bolean truyền thống chỉ có giá trị đúng hoặc sai (0 hay 1).
Tất nhiên, Google, Apple, và Microsoft cũng làm vậy. Điện thoại Android yêu cầu sử dụng tài khoản Google. Các thiết bị Apple sử dụng ID Apple. Dù người dùng có điện thoại thông minh hay máy tính xách tay, lưu lượng truy cập web được tạo ra từ mỗi thiết bị đều được liên kết với một người dùng cụ thể. Và các hệ điều hành mới nhất của Microsoft đều yêu cầu tài khoản Microsoft để có thể tải xuống các ứng dụng hoặc lưu trữ ảnh và tài liệu bằng dịch vụ đám mây của hãng này.
Điểm khác biệt lớn ở đây là Google, Apple, và Microsoft cho phép bạn tắt một số hoặc tất cả các hoạt động thu thập dữ liệu này và xóa dữ liệu đã thu thập trước đó. Drawbridge, Crosswise, và Tapad khiến cho quá trình vô hiệu hóa và xóa này trở nên mập mờ hơn. Hoặc có khi họ không có các tính năng đó.
Proxy hoặc Tor là các phương pháp thuận tiện giúp che giấu vị trí thực của bạn khi truy cập Internet, xong điều này có thể mang đến những rắc rối thú vị, thậm chí gây phản tác dụng, bởi vì đôi khi việc theo dõi trực tuyến là hợp lý, đặc biệt khi một công ty thẻ tín dụng muốn tìm cách chống gian lận. Ví dụ, vài ngày trước khi Edward Snowden xuất hiện công khai, anh muốn tạo một trang web hỗ trợ các quyền trực tuyến. Tuy nhiên, anh gặp rắc rối khi dùng thẻ tín dụng để trả phí đăng ký cho công ty cung cấp dịch vụ máy chủ.
Vào thời điểm đó, Snowden vẫn sử dụng tên thật, địa chỉ email thật, và thẻ tín dụng cá nhân – điều này diễn ra ngay trước khi anh tiết lộ các tài liệu. Anh cũng sử dụng Tor – điều này đôi khi khiến các hãng thẻ tín dụng phải cảnh giác khi họ muốn xác minh danh tính của bạn và không thể khớp một số thông tin bạn cung cấp với những gì họ có trong hồ sơ. Ví dụ, nếu tài khoản thẻ tín dụng cho biết bạn sống ở New York, vậy tại sao nút thoát Tor lại chỉ ra bạn đang ở Đức? Sự khác biệt về vị trí địa lý như thế này thường là dấu hiệu cho thấy ý định mua bán bất hợp pháp, do đó khiến họ phải nghiên cứu kỹ hơn.