Tôn Thất Hoàn, hay Hoan Ton-That, sinh năm 1988 trong một gia đình người Việt tại Australia. Từng đạt giải Nhất cuộc thi Olympic Tin học tại Australia, Hoan chuyển đến San Francisco năm 19 tuổi và tạo ra hơn 20 ứng dụng iPhone / Facebook với hơn mười triệu lượt tải. Hiện tại, Hoàn là nhà sáng lập, đồng thời là CEO của Clearview AI, một start-up về công nghệ nhận diện gương mặt có trụ sở tại New York, Mỹ.
Start-up này đã phát triển một công cụ tích hợp trí tuệ nhân tạo, vốn có khả năng tra cứu ra tên, địa chỉ và các thông tin khác của cá nhân chỉ dựa vào một bức ảnh duy nhất. Việc công nghệ tưởng chừng chỉ có trong các bộ phim Hollywood nay đã xuất hiện ngoài đời thực đã khiến giới công nghệ thực sự dậy sóng.
Tôn Thất Hoàn, đồng sáng lập và CEO của Clearview
Điều gì sẽ xảy ra nếu thông tin cá nhân của bạn, từ họ tên, ngày sinh, địa chỉ, sở thích..., bị kẻ lạ thu thập dễ dàng chỉ nhờ vào một bức ảnh chụp bạn vừa đăng tải lên Facebook? Chính nỗi lo sợ này đã khiến Clearview rơi vào tầm ngắm của các nhà lập pháp lẫn truyền thông Hoa Kỳ trong suốt những tháng đầu năm 2020.
"Mắt thần’ sục sạo Internet
Clearview hoạt động bằng cách ‘đào sâu’ vào các dữ liệu được chia sẻ trên Internet để có được thông tin liên quan đến một đối tượng cần tìm kiếm. Người dùng chỉ cần đăng tải ảnh người mình muốn nhận diện lên hệ thống của Clearview, sau đó sẽ nhận lại những bức ảnh người đó từng công khai. Ứng dụng này có thể nhận diện gương mặt bằng cách so sánh và đối chiếu ảnh của từng cá nhân với kho dữ liệu hình ảnh riêng.
Theo CNN, cơ sở dữ liệu khổng lồ của ClearviewAI chính là điều khiến công chúng đặc biệt quan ngại. Với 3 tỷ bức ảnh thu thập được từ hàng triệu website trên Internet, phần lớn trong số chúng đến từ một loạt các mạng xã hội như Facebook, Youtube, Twitter, Instagram. Đáng nói, ngay cả khi người dùng xóa những bức ảnh của mình trên mạng xã hội hoặc để chế độ riêng tư, chúng vẫn được giữ nguyên trong kho cơ sở dữ liệu của Clearview.
Xét về mặt quy mô, cơ sở dữ liệu này thậm chí vượt xa mọi thứ mà chính phủ Mỹ cũng như các "ông lớn" ở Thung lũng Sillicon từng gây dựng. Đơn cử, cơ sở dữ liệu của FBI, vốn lưu trữ 641 triệu hình ảnh của công dân Hoa Kỳ, vẫn thua kém đáng kể về mặt số lượng hình ảnh thu thập được so với Clearview.
Nhờ cơ sở dữ liệu này, Clearview có thể dùng trí tuệ nhân tạo phác họa nên ‘chân dung’ chi tiết nhất về đối tượng cần tìm, bao gồm tên tuổi, hình ảnh, địa chỉ nơi ở, nghề nghiệp, bạn bè người thân cùng một loạt thông tin cá nhân khác được "khai quật".
Phóng viên CNN thực sự kinh ngạc khi chứng kiến cách Clearview hoạt động
Bản thân Donie O'Sullivan - phóng viên của CNN đã hết sức ngạc nhiên khi được trực tiếp chứng kiến cách Clearview hoạt động. Đầu tiên, Tôn Thất Hoàn đã dùng một tấm ảnh chân dung của Donie O'Sullivanđ để đăng lên hệ thống nhằm tiến hành đối chiếu. Ngay lập tức, cơ sở dữ liệu của Clearview đã trả lại một loạt tấm hình của Donie O'Sullivan, bao gồm cả những bức ảnh được đăng trên một tạp chí địa phương khi nam phóng viên này mới 15 tuổi và đang học trung học.
Bức ảnh đăng tải cách đây hàng chục năm của phóng viên CNN đã được Clearview 'đào bới'
Điều đáng kinh ngạc ở chỗ, ngoại hình của phóng viên này ở hiện tại rất khác so với thời điểm cách đây một thập kỷ. Thậm chí, đồng nghiệp thân thiết của Donie O'Sullivan tại CNN cũng không thể nhận ra anh khi nhìn vào bức hình được tìm thấy. Tuy nhiên, với trí tuệ nhân tạo của Clearview, mọi thứ đều hoàn toàn khả thi.
Cam kết độ chính xác tới 99%
Trước khi có Clearview, cảnh sát tại Mỹ đã sử dụng hệ thống nhận diện gương mặt trong việc phá án. Tuy nhiên, họ bị giới hạn với những cơ sở dữ liệu hình ảnh từ chính phủ, bao gồm ảnh chụp bằng lái hay ảnh chụp ở đồn cảnh sát.
Thế nhưng, khi mạng xã hội bùng nổ và công nghệ phát triển, những ứng dụng với cơ sở dữ liệu hình ảnh khổng lồ như Clearview AI mang lại hiệu quả cao hơn.
Theo Tôn Thất Hoàn, khả năng tìm kiếm danh tính của Clearview đạt tỷ lệ gần như hoàn hảo – lên tới 99%. Hệ thống này cũng hoạt động rất ổn định và không có bất kì sai số nào khi tìm kiếm các đối tượng có màu da khác nhau – một vấn đề mà phần lớn các công cụ nhận diện khuôn mặt trên thế giới đều gặp phải.
Thuật toán của Clearview AI cũng có khả năng lọc các bức ảnh có đặc điểm trùng khớp với nhân dạng của đối tượng cần tìm, song song với việc tiếp tục khai thác thêm thông tin liên quan đến đối tượng trên các mạng xã hội và trang web có liên quan.
Khi mạng xã hội bùng nổ và công nghệ phát triển, những ứng dụng với cơ sở dữ liệu hình ảnh khổng lồ như Clearview AI mang lại hiệu quả cao hơn
Nhờ khả năng ‘sục sạo Internet’ của Clearview AI, cảnh sát bang Indiana chỉ mất 20 phút để xử lý một một vụ nổ súng. Nghi phạm không có bằng lái xe nên không có thông tin trong cơ sở dữ liệu của chính phủ, song lại tình cờ xuất hiện trong một video đăng tải trên mạng xã hội.
Bộ công cụ này hoạt động hiệu quả đến mức, sở cảnh sát thành phố Chicago sẵn sàng chi 50000 USD để sử dụng Clearview trong vòng 2 năm, trong khi cục Điều tra Liên bang Mỹ (FBI) và Bộ An ninh Nội địa Mỹ đang lên kế hoạch thử nghiệm công cụ này trong thời gian tới.
Theo thống kê, hơn 600 sở cảnh sát ở các bang như Florida, Georgia, New Jersey đã sử dụng Clearview từ năm ngoái. Không chỉ các cơ quan thực thi pháp luật, một số ngân hàng tại Mỹ cũng rất quan tâm tới Clearview nhằm hỗ trợ điều tra các cá nhân liên quan tới những vụ việc gian lận tài chính.
Khả năng tìm kiếm danh tính của Clearview đạt tỷ lệ gần như hoàn hảo – lên tới 99%
Gây ra nhiều tranh cãi
Với việc Clearview thu thập hình ảnh khuôn mặt từ Internet, các hãng công nghệ lớn đương nhiên không thể hài lòng. Từ Facebook, Twitter cho đến Google đã yêu cầu Clearview AI ngừng thu thập dữ liệu của họ để phục vụ cho công nghệ nhận diện khuôn mặt.
Trớ trêu thay, bất chấp những lo ngại của Facebook về Clearview, tỷ phú Peter Thiel, thành viên hội đồng quản trị của Facebook lại là một những người đầu tiên đầu tư vào Clearview. Cả Facebook, Thiel và Tôn Thất Hoàn đều từ chối bình luận về việc liệu Thiel có biết Clearview đang sử dụng ‘trái phép’ dữ liệu Facebook hay không.
Về phần Tôn Thất Hoàn, những lời cảnh cáo từ phía Google hay Facebook dường như không làm cho CEO Clearview cảm thấy run sợ. Điều này hoàn toàn có lý do.
Cơ sở dữ liệu của Clearview vượt xa mọi thứ mà chính phủ Mỹ cũng như các "ông lớn" ở Thung lũng Sillicon từng gây dựng
Về cơ bản, các công ty công nghệ không kiểm soát được những gì xảy ra với dữ liệu sau khi chúng được tải xuống từ nền tảng của họ. Nói cách khác, việc đảm bảo một ai đó thật sự tuân thủ các yêu cầu ngừng thu thập dữ liệu là điều gần như không thể.
Bản thân Tôn Thất Hoàn cũng cho rằng công ty của mình có quyền sử dụng dữ liệu này, tương tự như cách Google thu thập dữ liệu. Trả lời phỏng vấn CBS News, CEO của Clearview khẳng định "quyền về thông tin công khai cũng có trong tu chính án I Hiến pháp Hoa Kỳ", Tôn Thất Hoàn. "Để xây dựng hệ thống này, chúng tôi chỉ sử dụng những thông tin sẵn có và công khai", CEO Clearview cho biết.
Khi được hỏi liệu bản thân có sẵn sàng rời màn hình máy tính để đối mặt với các vụ kiện tụng ở tòa hay không, Tôn Thất Hoàn trả lời: "Đương nhiên là có rồi. Nhưng tôi nghĩ là không có nhiều (vụ kiện) đến thế đâu".
Tham khảo CNN