Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây

Quên ChatGPT đi - Runway Gen 2 có thể chuyển văn bản thành video vô cùng chân thực chỉ trong vài giây.

Với tính năng dịch văn bản sang hình ảnh, các mô hình AI gần đây như Dall-E hoặc Stable Diffusion đã chứng minh được giá trị của nó. Nhưng cải tiến mới đây cho phép AI chuyển văn bản thành video dự kiến sẽ "làm mưa làm gió" trong tương lai.

Runway, một startup nổi tiếng về AI vừa công bố mô hình mới Gen 2, có thể chuyển đổi bất kỳ mô tả văn bản nào thành một video dài 3 giây, mở ra một thế giới mới cho những người tạo nội dung video. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây

Cris Valenzuela - đồng sáng lập và Giám đốc điều hành của Runway trình diễn một loạt ví dụ, trong đó cho thấy Gen 2 có thể tạo được cảnh quay "drone trên một vùng sa mạc" chỉ trong vài giây. Sự phát triển này là một dấu hiệu cho thấy việc chuyển văn bản thành video sắp trở thành hiện thực.

Việc tạo cảnh quay video từ các mô tả văn bản của AI giúp hợp lý hoá, giảm chi phí quá trình sản xuất video và cho phép đạo diễn, diễn viên biến tầm nhìn của họ thành hiện thực một cách dễ dàng nhất. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 2

Cùng với việc tạo hình ảnh, công cụ của Runway có thể sử dụng lời nhắc văn bản để thay đổi hình ảnh hiện có, tạo họa tiết cho đối tượng 3D và tô màu cho ảnh đen trắng. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 3

Các công cụ chỉnh sửa video của công ty có thể thêm hoặc bớt các yếu tố cảnh, nội suy khung hình, triển khai chuyển động chậm, kiểm duyệt khuôn mặt, tạo bản ghi và phụ đề, trích xuất thông tin độ sâu, theo dõi chuyển động và chỉnh sửa âm thanh. Bên cạnh đó cho phép người dùng xoá, làm mờ hoặc thay thế background trong video.

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 4

Hiện tại, Gen 2 vẫn chưa có sẵn cho tất cả mọi người. Những người muốn sử dụng tính năng này có thể đăng ký danh sách chờ trên kênh Discord. Dự kiến trong những tuần tới, công ty sẽ cung cấp quyền truy cập rộng rãi cho người dùng khắp nơi trên thế giới.

Việc tạo video bằng văn bản không phải là mới trong lĩnh vực AI. Những gã khổng lồ công nghệ như Meta và Google trước đây đã phát hành các tài liệu nghiên cứu về các mô hình AI chuyển văn bản thành video tương tự vào cuối năm 2022. 

 

Bài viết liên quan

Bài viết đọc nhiều nhất

Lên đầu trang