Một nhóm các nhà nghiên cứu đến từ Đại học Stanford, UC San Diego, UC Berkeley và UT Austin, hợp tác với hãng chip Nvidia, đã cùng nhau xây dựng một hệ thống AI mang tên gọi TTT-MLP, với khả năng tạo ra phim hoạt hình từ kịch bản được mô tả chi tiết.
Các nhà nghiên cứu đã huấn luyện công cụ AI này bằng 81 tập phim hoạt hình nổi tiếng "Tom & Jerry", sau đó viết một kịch bản chi tiết để mô tả về đoạn phim muốn tạo ra và yêu cầu công cụ AI thực hiện.
Điểm nổi bật của TTT-MLP là khả năng tạo ra video hoạt hình với độ dài lên đến một phút và bám sát kịch bản theo mô tả của người dùng.
Đoạn phim hoạt hình nội dung Tom làm việc tại New York và bị Jerry phá bĩnh (Video: TTT-MLP).
Mục đích của nghiên cứu này là muốn xây dựng một công cụ AI có khả năng nhất quán về mặt nội dung và nhân vật trong video, đặc biệt có thể vượt qua giới hạn về thời gian tạo video của AI.
Các công cụ AI tạo video từ văn bản mô tả hiện nay thường chỉ có thể tạo ra những đoạn video với thời lượng ngắn, chẳng hạn Sora của OpenAI chỉ có thể tạo ra video với độ dài tối đa 20 giây, Moviegen của Meta tạo được video 16 giây hay Veo 2 của Google cũng chỉ tạo được video độ dài tối đa 8 giây.
"Các video được tạo ra với các cảnh mạch lạc và chuyển động mượt mà. Các nội dung đều được tạo ra hoàn toàn mới nhờ kịch bản được cung cấp. Kết quả được tạo ra không cần phải trải qua thêm bất kỳ bước ghép nối, chỉnh sửa hay xử lý hậu kỳ nào", nhóm tác giả cho biết.
Đoạn phim hoạt hình về màn truy tìm kho báu dưới biển của Tom và Jerry (Video: TTT-MLP).
Không chỉ "Tom & Jerry", TTT-MLP có thể tạo ra những đoạn phim hoạt hình dựa trên phong cách của những bộ phim khác, miễn là công cụ này được cung cấp dữ liệu để huấn luyện phù hợp.
TTT-MLP đã gây ra nhiều tranh cãi trong cộng đồng mạng. Nhiều người đã bày tỏ sự thán phục và ấn tượng với khả năng tạo phim hoạt hình của công cụ AI này.
Tuy nhiên, không ít cư dân mạng và các nhà phê bình đánh giá những bộ phim do AI tạo ra là "vô hồn" và làm mất đi nét riêng của một bộ phim hoạt hình được xem là huyền thoại.
Nhiều người cho rằng những công cụ AI làm phim hoạt hình bằng cách sao chép phong cách của những bộ phim sẵn có là một sự vi phạm bản quyền nghiêm trọng và xem thường nỗ lực của các nhà làm phim chân chính.
Hiện chưa rõ các nhà nghiên cứu có dự định phát triển TTT-MLP thành một công cụ AI phổ biến để sử dụng rộng rãi, hay chỉ xem đây là một dự án phát triển để thử nghiệm khả năng của AI.