Các AI có khả năng biến những đoạn văn bản thành hình ảnh theo ý muốn đã trở nên quen thuộc đến mức làm giới hội họa nổi giận trước khả năng vẽ nên những bức tranh ấn tượng của chúng. Thế nhưng giờ đây một startup AI còn muốn đi xa hơn thế khi giới thiệu một mô hình AI có khả năng làm mới các đoạn video có sẵn chỉ bằng vài dòng văn bản hoặc một hình ảnh tham chiếu nào đó.
Runway, startup AI đồng sáng tạo nên Stable Diffusion, mô hình AI biến các đoạn văn bản thành hình ảnh, vừa ra mắt một mô hình AI mới có tên Gen-1, giúp biến đổi các đoạn video có sẵn theo ý muốn chỉ bằng vài dòng văn bản hoặc một hình ảnh tham chiếu nào đó.
Chỉ bằng một dòng văn bản, Gen-1 có thể thay đổi cả đoạn video. Ảnh Runway
Trong đoạn clip demo đăng tải trên website của mình, phần mềm của Runway có thể biến những người trên phố thành các con rối bằng đất sét và những quyển sách xếp chồng trên bàn thành khung cảnh thành phố về đêm. Runway hy vọng rằng Gen-1 sẽ làm được những điều như Stable Diffusion từng làm được với hình ảnh. "Chúng ta đã thấy sự bùng nổ lớn đối với các mô hình AI chỉnh sửa hình ảnh." CEO Runway Cristóbal Valenzuela cho biết. "Tôi thực sự hy vọng rằng năm 2023 sẽ là năm của video."
Được thành lập từ năm 2018, trong nhiều năm nay Runway tập trung vào phát triển phần mềm chỉnh sửa video trên nền tảng AI. Các công cụ của họ rất được các TikToker và YouTuber ưa chuộng cũng như được sử dụng rộng rãi trong các studio dựng phim và truyền hình. Nhà sản xuất của chương trình The Late Show with Stephen Colbert cũng sử dụng phần mềm của Runway để chỉnh sửa đồ họa của chương trình. Đội ngũ hiệu ứng hình ảnh đằng sau bộ phim đình đám Everything Everywhere All at Once cũng sử dụng công nghệ của công ty để giúp tạo ra một số cảnh quay nhất định.
Trong năm 2021, Runway đã cộng tác với các nhà nghiên cứu tại Đại học Munich để xây dựng phiên bản đầu tiên của Stable Diffusion. Sau đó, một startup của Anh có tên Stability AI cùng tham gia vào để chi trả chi phí điện toán cần thiết cho việc huấn luyện mô hình AI với nhiều dữ liệu hơn. Trong năm 2022, Stability AI đưa Stable Diffusion trở nên nổi tiếng, biến nó từ một dự án nghiên cứu thành một hiệu ứng toàn cầu.
Ảnh Runway
Nhưng hiện tại 2 công ty đã không còn hợp tác với nhau nữa sau khi Getty khởi kiện Stability AI với cáo buộc cho rằng công ty này vi phạm bản quyền khi lấy hình ảnh trong dữ liệu của công ty này để huấn luyện cho AI của Stable Diffusion.
Do vậy, có thể xem Gen-1 là khởi đầu hoàn toàn mới của Runway. Cũng tương tự như các mô hình biến văn bản thành video đơn sơ từng được Meta và Google giới thiệu vào cuối năm ngoái, nhưng nếu nhìn vào hình ảnh demo của Runway, Gen-1 cho thấy bước tiến đáng kể về chất lượng video.
Cách làm của Runway cũng tương tự như Dreamix – một AI sản sinh của Google từng được giới thiệu vài tuần trước – có khả năng tạo thành các đoạn video mới từ những cái đã có khi đưa vào một số hiệu ứng cụ thể. Nhưng khác với Google, Genk-1 của Runway chuyển đổi từ các đoạn video sẵn có., do vậy nó có thể tạo ra các đoạn video dài hơn so với những mô hình trước đây.
Hơn thế nữa, không giống Meta và Google, Runway được xây dựng với mục đích phục vụ khách hàng thay vì làm một dự án nghiên cứu đơn thuần. "Đây là một trong những mô hình đầu tiên được phát triển gắn liền với cộng đồng các nhà sản xuất video." Valenzuela cho biết. "Nó đi cùng với nhiều năm hiểu biết sâu sắc về cách các nhà làm phim và đội ngũ chỉnh sửa VFX làm việc trong giai đoạn hậu kỳ sản xuất."
Được chạy trên đám mây riêng thông qua website của Runway, hiện tại Gen-1 đã ra mắt một số nhỏ người dùng nhận được lời mời và sẽ ra mắt với những người dùng trong danh sách chờ vài tuần tới.
Năm ngoái, hàng triệu người đã say mê trong đợt bùng nổ các AI sản sinh khi lần đầu tiên nhận ra rằng chúng có thể mang lại cho họ một công cụ mạnh mẽ đến như thế nào và chia sẻ những gì chúng làm được. Valenzuela hy vọng rằng việc đưa Gen-1 tới cộng đồng các chuyên gia sáng tạo sẽ sớm tạo ra tác động lớn đến lĩnh vực chỉnh sửa video.