Công nghệ AI mới nhất của Nvidia chuyển ngữ từ thành hình ảnh thực tế

Nvidia đã giới thiệu công nghệ GauGAN của mình lần đầu tiên vào năm 2019.

Công nghệ GauGAN của Nvidia đã cho thấy tính năng của nó, biến các bản phác thảo đơn giản thành hình ảnh chân thực. Kể từ đó, chúng ta đã thấy nó được sử dụng trong Nvidia Canvas, nhưng có vẻ như gã khổng lồ GPU đang nhắm đến mục tiêu cao hơn với AI của mình, tung ra một phiên bản mới có khả năng biến từ thành hình ảnh.

Công nghệ AI mới nhất của Nvidia chuyển ngữ từ thành hình ảnh thực tế

Nvidia đã giới thiệu công nghệ GauGAN của mình lần đầu tiên vào năm 2019, nhưng chỉ gần đây, chúng ta mới thấy nó được giới thiệu trong một sản phẩm dành cho công chúng. Được đặt tên là Canvas, phần mềm này có thể rất thú vị khi sử dụng, cho phép người dùng tạo ra những hình ảnh giống như ảnh tuyệt vời với các bản phác thảo cơ bản.

Công nghệ AI mới nhất của Nvidia chuyển ngữ từ thành hình ảnh thực tế 2

Đã vài tháng trôi qua kể từ thông báo của Canvas, nhưng công việc trên GauGAN vẫn tiếp tục và nó hiện đang đạt được phiên bản 2.0. Công nghệ này thậm chí còn trở nên ấn tượng hơn, vì giờ đây nó có khả năng biến từ ngữ thành hình ảnh chân thực, mang lại kết quả tương tự như kết quả mà chúng ta nhận được khi sử dụng tính năng vẽ thành ảnh.

Công nghệ AI mới nhất của Nvidia chuyển ngữ từ thành hình ảnh thực tế 3

Như đã thấy trong video ở trên, hãy viết một cái gì đó trên hộp văn bản và một hình ảnh sẽ được tạo ngay lập tức dựa trên lời nói của bạn. Thêm một tính từ hoặc thay thế một danh từ trong cụm từ, và hình ảnh sẽ thay đổi tương ứng.

Công nghệ AI mới nhất của Nvidia chuyển ngữ từ thành hình ảnh thực tế 4

Để cá nhân hóa hơn, người dùng có thể kết hợp các tính năng văn bản và vẽ thành hình ảnh. Sử dụng các từ đã viết để tạo cơ sở và bản vẽ để chi tiết hóa hình ảnh, bạn có thể thay đổi hình dạng, kích thước và kết cấu của bất kỳ đối tượng nào trong hình ảnh.

Để đạt được những kết quả này, tính năng chuyển văn bản thành hình ảnh GauGAN 2 của Nvidia sử dụng mô hình AI dựa trên mạng đối thủ chung "kết hợp giữa ánh xạ phân đoạn, sơn in và tạo văn bản thành hình ảnh." Mô hình này đã được đào tạo bằng cách sử dụng 10 triệu hình ảnh phong cảnh, vì vậy nó phải được chuẩn bị kỹ lưỡng cho bất cứ điều gì bạn ném vào nó (hoặc không).

Bạn có thể dùng thử bản trình diễn tương tác AI của Nvidia cho GauGAN 2 bằng trình duyệt web của mình. Để trải nghiệm, trước tiên bạn phải đồng ý với các điều khoản và điều kiện của Nvidia.

Bài viết liên quan

Bài viết đọc nhiều nhất

Bài viết mới trong ngày

Lên đầu trang