AI có thể lật tẩy danh tính người dùng ẩn danh với độ chính xác đáng kinh ngạc

Một nghiên cứu mới cho thấy các mô hình ngôn ngữ lớn (LLM) có thể xác định danh tính người dùng ẩn danh trên nhiều nền tảng mạng xã hội với độ chính xác cao. Phát hiện này gióng lên hồi chuông cảnh báo về tương lai của quyền riêng tư trên không gian mạng, khi các biện pháp bảo vệ truyền thống không còn hiệu quả.
Các nhà nghiên cứu cho biết, những tài khoản ẩn danh (burner account) trên các trang mạng xã hội ngày càng có thể bị phân tích để xác định danh tính người dùng đứng sau chúng bằng trí tuệ nhân tạo (AI). Đây là một nghiên cứu có thể gây ra những hậu quả sâu rộng đối với quyền riêng tư trên Internet.
Phát hiện này, từ một bài báo nghiên cứu được công bố gần đây, dựa trên kết quả của các thí nghiệm liên kết các cá nhân cụ thể với các tài khoản hoặc bài đăng trên nhiều nền tảng mạng xã hội. Tỷ lệ thành công cao hơn nhiều so với các phương pháp giải ẩn danh truyền thống, vốn phụ thuộc vào con người trong việc thu thập các bộ dữ liệu có cấu trúc phù hợp cho thuật toán đối chiếu hoặc công việc thủ công của các điều tra viên lành nghề. Tỷ lệ phát hiện (Recall) — tức là số lượng người dùng được giải ẩn danh thành công — lên tới 68%. Trong khi đó, độ chính xác (Precision) — tức là tỷ lệ các phỏng đoán xác định đúng người dùng — đạt tới 90%.
Khi lớp vỏ ẩn danh bị phá vỡ
Những phát hiện này có khả năng làm lung lay khái niệm ẩn danh trên mạng, một biện pháp bảo vệ quyền riêng tư không hoàn hảo nhưng thường đủ hiệu quả, được nhiều người sử dụng để đặt câu hỏi và tham gia vào các cuộc thảo luận công khai nhạy cảm mà không muốn người khác dễ dàng xác định danh tính. Khả năng xác định danh tính những người đứng sau các tài khoản này một cách nhanh chóng và với chi phí thấp sẽ khiến họ có nguy cơ bị tấn công lộ thông tin cá nhân (doxxing), bị theo dõi và trở thành đối tượng của các hồ sơ tiếp thị chi tiết, theo dõi nơi họ sống, công việc và các thông tin cá nhân khác. Biện pháp bảo vệ bằng danh tính ảo này không còn vững chắc nữa.
“Phát hiện của chúng tôi có ý nghĩa quan trọng đối với quyền riêng tư trực tuyến,” các nhà nghiên cứu viết. “Người dùng Internet trung bình từ lâu đã hoạt động dưới một mô hình đe dọa ngầm, nơi họ cho rằng việc ẩn danh cung cấp sự bảo vệ đầy đủ vì việc giải ẩn danh có chủ đích đòi hỏi nỗ lực rất lớn. Các mô hình ngôn ngữ lớn (LLM) đã vô hiệu hóa giả định này.”
Để kiểm tra kỹ thuật này mà vẫn bảo vệ quyền riêng tư của người tham gia, các nhà nghiên cứu đã thu thập một số bộ dữ liệu từ các trang mạng xã hội công khai. Một trong số đó thu thập các bài đăng từ Hacker News và hồ sơ LinkedIn, sau đó liên kết chúng bằng cách sử dụng các tham chiếu chéo nền tảng xuất hiện trong hồ sơ người dùng. Tiếp theo, họ loại bỏ tất cả các thông tin nhận dạng khỏi các bài đăng và cho một mô hình ngôn ngữ lớn phân tích chúng. Một bộ dữ liệu thứ hai được lấy từ một bản phát hành của Netflix về các định danh vi mô, chẳng hạn như sở thích cá nhân, đề xuất và hồ sơ giao dịch. Một bài báo nghiên cứu năm 2008 đã chỉ ra rằng bằng cách sử dụng phương pháp tấn công "Netflix prize attack", danh sách này có thể xác định người dùng và các khuynh hướng chính trị cũng như thông tin cá nhân khác của họ. Kỹ thuật cuối cùng là chia nhỏ lịch sử hoạt động trên Reddit của một người dùng duy nhất.
Nguồn: Ars Technica Cloud

