Sự phục hưng gần đây của lĩnh vực trí tuệ nhân tạo sau sự sụp đổ của những năm 1980 - "mùa đông AI" - đã được chứng minh là hoàn toàn mang tính cách mạng. Gần đây, DeepMind, một công ty con của Google được giao nhiệm vụ phát triển các chương trình AI tiên tiến, đã tiết lộ rằng hệ thống AlphaFold của họ đã giải mã cấu trúc của hầu như tất cả các protein mà khoa học biết đến - hơn 200 triệu trong số đó.
Và ở thời điểm hiện tại, một công cụ AI mới đang đẩy ranh giới của những gì có thể xảy ra tiến thêm một bước nữa bằng cách cho phép các nhà khoa học thiết kế các protein ban đầu và không giống với bất cứ thứ gì được thấy trong tự nhiên. Công cụ mới này, được gọi là ProteinMPNN, gần đây đã được các nhà nghiên cứu tại Đại học Washington mô tả trong một cặp nghiên cứu được công bố trên tạp chí Science.
Các tác giả của nó tin tưởng rằng ProteinMPNN và các công cụ tương tự khác được liên kết với bề mặt trong tương lai gần sẽ mở ra một lĩnh vực khả năng mới và các ứng dụng tiếp theo. Chúng bao gồm các protein hoàn toàn mới được thiết kế từ đầu để đáp ứng một số mục tiêu nhất định, có thể là các enzym tiêu hóa nhựa hay các loại thuốc mới nhắm vào một số căn bệnh nan y và khó chữa nhất hiện nay.
Protein là thành phần cần thiết cho sự sống của tế bào. Nó thực hiện các nhiệm vụ phức tạp và là chất xúc tác cho các phản ứng hóa học. Từ lâu, nhiều nhà khoa học đã tìm cách khai thác sức mạnh này bằng cách thiết kế các protein nhân tạo có thể thực hiện chức năng mới như điều trị bệnh tật, thu giữ carbon hoặc tích lũy năng lượng. Tuy nhiên, nhiều quá trình tạo ra các loại protein như vậy khá chậm chạm vì tính phức tạp của nó và tỷ lệ thất bại cao. Những nghiên cứu trước đây đã tạo ra nhiều phương pháp có thể định hình được cấu trúc protein, nhưng lại khó nắm bắt được chức năng của nó.
Vai trò của protein trong việc hỗ trợ sự sống và tự nhiên nói chung có ý nghĩa vô cùng to lớn. Một số là cấu trúc, một số khác vận chuyển các phân tử, một số khác vẫn là các thụ thể, v.v. Mỗi chức năng này có liên quan chặt chẽ đến hình dạng cụ thể của nó.
Tất cả các protein bắt đầu như một chuỗi tuyến tính của các đơn vị cơ bản được gọi là axit amin. Cấu trúc 2D chính của axit amin này chứa “công thức” mà protein sử dụng để tự gấp lại. Một protein sẽ trải qua các giai đoạn gấp nếp lặp đi lặp lại, áp dụng một loạt các cấu hình trước khi đạt đến hình dạng cuối cùng, đây là cấu hình có lợi nhất về mặt năng lượng.
Trong khi AlphaFold có thể dự đoán hình dạng của các protein hiện có, từ đó suy ra chức năng của chúng, ProteinMPNN thì có thể giải quyết vấn đề tương tự nhưng ở góc độ ngược lại. Thay vì thiết kế ngược lại vai trò của protein từ tự nhiên, công cụ mới có thể giúp các nhà khoa học thiết kế các protein hoàn toàn mới từ đầu. Chẳng hạn, họ có thể thiết kế một chức năng hoặc mục đích nhất định cho một protein, sau đó nhờ AI đưa ra cấu trúc tương ứng mà các thành phần phân tử và hình dạng có lợi cho chức năng mong muốn. Sau đó, vấn đề còn lại là tổng hợp các protein này trong phòng thí nghiệm.
ProteinMPNN có thể đạt được tất cả những điều thực sự đáng chú ý này bằng cách sử dụng hai AI mạnh mẽ được phát triển tại Đại học Washington. Công cụ đầu tiên, được đặt tên là “hallucination”, cho phép các nhà khoa học tìm kiếm trong số các chuỗi protein hữu ích tiềm năng dựa trên các lời nhắc đơn giản - giống như công cụ AI tạo DALL-E nổi tiếng hiện nay giúp tạo ra những hình ảnh tuyệt vời từ một lời nhắc văn bản.
AI thứ hai, được gọi là “inpainting”, có thể được coi là một tính năng tự động hoàn thành giống như loại bạn thấy khi nhập câu hỏi vào Google - chỉ dành cho protein. Khi được sử dụng trong sức mạnh tổng hợp, hai AI này có thể cho phép các nhà khoa học khám phá ra các protein hoàn toàn mới phù hợp với chức năng mong muốn.
Thông qua việc phát triển các mô hình học máy có khả năng xem xét thông tin protein được chọn lọc từ cơ sở dữ liệu hệ gene, các nhà nghiên cứu đã tìm ra các quy tắc thiết kế protein tương đối đơn giản để có thể tạo ra protein nhân tạo mới. Khi tạo dựng những protein này trong phòng thí nghiệm vật lý, họ thấy rằng chúng hoạt động tốt về mặt hóa học đến mức có thể cạnh tranh được với những loại có sẵn trong tự nhiên.
Để xác thực các hình dạng protein khác nhau được tạo ra bởi hai AI, các nhà nghiên cứu đã chuyển dữ liệu sang AlphaFold và thử nghiệm để xem liệu các chuỗi axit amin có thực sự có khả năng gấp lại theo hình dạng mong muốn hay không.
Các protein ban đầu được thiết kế bằng ProteinMPNN sau đó được lắp ráp trong phòng thí nghiệm. Trong số đó có những cấu trúc chỉ có kích thước siêu nhỏ, có thể được lắp vào bên trong các thiết bị nano tùy chỉnh.
“Đây là bước khởi đầu của máy học trong thiết kế protein. Trong những tháng tới, chúng tôi sẽ làm việc để cải thiện các công cụ này nhằm tạo ra các protein năng động và chức năng hơn nữa”, tác giả cấp cao David Baker , giáo sư hóa sinh tại Trường Y Đại học Washington cho biết.