Khi sự riêng tư của ta là dữ liệu lớn

Khi sử dụng facebook, bạn thường post những bức ảnh. Nếu để ý, bạn sẽ thấy rằng facebook có khả năng nhận diện khuôn mặt rất chính xác nhiều người trong bức ảnh tập thể. Cùng với việc nhận diện, facebook sẽ gợi ý tên của những người ấy để bạn tag vào.

Facebook làm được điều đó vì trong quá trình phát triển và hoàn thiện của mạng xã hội ấy, có một đội ngũ kỹ thuật viên luôn đưa vào các phần mềm ứng dụng trí tuệ nhân tạo để phân tích xử lý khối dữ liệu khổng lồ do chính người dùng đưa tới!

ĐÂU CHỈ LÀ TRÒ CHƠI

Rất nhiều người dùng facebook thích thú với các ứng dụng, trò chơi vui vui được tích hợp trong môi trường mạng xã hội này. Các dịp lễ, Tết là thời điểm mà nhiều ứng dụng như thế đổ bộ và thu hút khá đông người tham gia kiểu như: Tỷ lệ giảm cân thành công sau Tết của bạn? Tiên đoán điều bất ngờ đến với bạn trong đêm giao thừa? Bạn sẽ nhận được chữ gì cho năm mới từ ông đồ?

Những ứng dụng có khai thác yếu tố đồ họa thường hấp dẫn người sử dụng hơn. Thời gian vừa qua, trò “Bạn trông như thế nào nếu có râu” được nhiều nam facebooker khai thác hoặc trò “Gương mặt bạn giống với người nổi tiếng nào?” thì thu hút không chỉ các bạn trẻ. 

Nhiều lắm, những trò chơi này ra đời với tốc độ gần như hằng ngày: “Ai đang muốn thủ tiêu bạn?”, “Nghề gì phù hợp với trí thông minh của bạn?”,  “Chúng tôi có thể đoán ra con người thực của bạn?”, “Gương mặt của bạn bao nhiêu tuổi?”, “Bạn trông như thế nào nếu đổi giới tính?” v.v…

Thoạt nhìn thì những trò chơi này có vẻ vô hại, chủ yếu là giải trí. Nhưng ngẫm kỹ một chút thì có thể đặt câu hỏi: đội ngũ quản trị phát triển của các trang như fiverr.com, playtry.net, quizzstar.com, helloquiz.com… rảnh quá sao suốt ngày cứ lo chế ứng dụng miễn phí như thế?

Các chuyên gia cảnh báo rằng, thời của dữ liệu lớn (big data) - trí tuệ nhân tạo (AI), việc người ta khai thác các thông tin cá nhân của chúng ta vào các mục đích thương mại, thậm chí chính trị, là chuyện bình thường. Tham gia các trò chơi, các ứng dụng ấy, chúng ta có thể vô tình để lộ thông tin cá nhân (và sau này, có khi gặp những phiền phức).

BIG DATA TRONG CUỘC CHƠI CỦA NHỮNG “ÔNG LỚN”

Ngày nay, ai trong chúng ta cũng đều nghe đến thuật ngữ Big Data. Dịch nôm na là “dữ liệu lớn”. Bài viết này không đi sâu vào khái niệm, mà câu chuyện Big Data chúng tôi muốn nhấn mạnh ở đây là: tất cả những hành vi của chúng ta, trên mạng hay ngoại tuyến (offline) đều để lại dấu vết số. Ví dụ, bạn mua hàng gì bằng thẻ gì, bạn thường search gì trên công cụ tìm kiếm Google, thói quen dùng điện thoại của bạn thế nào, bạn hay bày tỏ cảm xúc thái độ (like, love, angry, haha..., share, comment) trên mạng xã hội ra sao đều được robot lưu lại và được xử lý.

Rất nhiều người sử dụng mạng xã hội facebook, twitter rất ngạc nhiên khi thấy trên tường (new feed) của mình luôn có các thông tin phù hợp, có các quảng cáo theo mối quan tâm của chính mình. Bản thân người viết thường gặp những quảng cáo về máy ảnh, đàn guitare, điện thoại, thiết bị công nghệ… mà không hề nhận quảng cáo mỹ phẩm hay thuốc đông dược!

Những điều đó xuất phát từ năng lực “hướng đối tượng” của cỗ máy trí tuệ nhân tạo được tích hợp trong lòng các mạng xã hội ấy. Dữ liệu lớn được cá nhân hóa để “phục vụ” cho những mục đích nhất định. 

Đằng sau chiến dịch tranh cử của Trump trên mạng, và đằng sau chiến dịch ủng hộ Brexit là cùng một công ty chuyên nghiên cứu Big Data: Cambridge Analytica. Công ty này phát triển một thuật toán dựa trên kết quả nghiên cứu tâm lý học gọi lại psychometrics (đôi khi gọi là psychography), là một phương pháp đo nhân cách. 

Từ phương pháp đo nhân cách psychography, các công ty có thể dùng những dữ liệu của Big Data để có số đo về từng thành viên trong cộng đồng mạng, có thể hiểu chính xác họ là ai, họ có mong muốn và nỗi sợ hãi nào, và cuối cùng là họ sẽ hành xử như thế nào. Những kết quả phân tích đo lường ấy sẽ là cơ sở để xây dựng các chiến dịch truyền thông tác động trực tiếp đến đối tượng. Những chiến dịch truyền thông ấy hiệu quả đến mức nhiều đối tượng trước đó, ghét ông Donald Trump, ủng hộ bà Hillary Clinton nhưng đã quay 180 độ khi gần đến ngày bầu cử!

Năm 2012, Kosinski chứng minh rằng, chỉ cần phân tích 68 like trên Facebook là đủ xác định màu da của người dùng (xác suất 95%), khả năng đồng tính (88%) và thiên hướng ủng hộ đảng Dân chủ hay Cộng hòa Mỹ (85%). Quá trình còn tiến xa hơn: mức độ thông minh, thiên kiến tôn giáo, mức độ nghiện rượu, thuốc lá hay ma túy.  Dữ liệu thậm chí cho phép xác định là cha mẹ đối tượng có li dị trước khi người này trưởng thành hay không. Mô hình hiệu quả đến mức cho phép đoán được câu trả lời của đối tượng cho một số câu hỏi. 

Thời của trí tuệ nhân tạo và dữ liệu lớn đặt cho người sử dụng truyền thông cần biết khai thác công nghệ một cách thông minh hơn. Chúng ta đừng vô tình tiếp tay cho các cỗ máy thu thập chính sự riêng tư của mình để phục vụ cho những mục đích không tốt!
Phan Văn Tú