Meta trình làng mô hình AI mới có khả năng nhận diện từng đối tượng trong bức ảnh

Giám đốc điều hành Mark Zuckerberg tuyên bố rằng việc kết hợp trí tuệ nhân tạo vào các ứng dụng của mình là ưu tiên hàng đầu của công ty trong năm nay.

Một số công ty công nghệ đã thử nghiệm AI để cải thiện trải nghiệm người dùng kể từ khi trí tuệ nhân tạo (AI) ra đời. 

Meta, công ty mẹ Facebook đã giới thiệu Segment Anything Model (SAM), với kỹ năng xác định và phân tách các đối tượng cụ thể trong hình ảnh và video.

Meta trình làng mô hình AI mới có khả năng nhận diện từng đối tượng trong bức ảnh

“Segmentation - xác định pixel hình ảnh nào thuộc về một đối tượng là nhiệm vụ cốt lõi trong thị giác máy tính và được sử dụng trong nhiều ứng dụng, từ phân tích hình ảnh khoa học đến chỉnh sửa ảnh,” trong phần giới thiệu bởi Meta. 

Đơn giản, mô hình này có thể nhận dạng từng đối tượng trong một hình ảnh với nhiều đối tượng khác nhau. Trong phần giới thiệu, Meta cũng cho thấy công cụ AI xác định thành công từng loại trái cây trong ảnh chụp một hộp trái cây. 

Meta cho biết, người dùng cũng có thể viết gợi ý đối tượng mà họ muốn chọn, bằng văn bản hoặc chỉ bằng một cú nhấp chuột.

Meta trình làng mô hình AI mới có khả năng nhận diện từng đối tượng trong bức ảnh

Công ty cũng đã phát hành bộ dữ liệu mặt nạ Segment Anything 1-Billion (SA-1B), một trong những bộ dữ liệu phân đoạn lớn nhất từng được tạo. Dựa trên điều này, hệ thống AI đã được đào tạo trên 11 triệu hình ảnh và đã xác định được hơn 1 tỷ mặt nạ. 

Trong tương lai, phần mềm AI này có thể hỗ trợ nhiều ứng dụng khác nhau. Công nghệ phân đoạn hình ảnh có thể chỉnh sửa ảnh, phân tích hình ảnh khoa học, được sử dụng trong các ứng dụng thực tế ảo và tăng cường, thậm chí được sử dụng để xây dựng các hệ thống AI lớn hơn.

Meta trình làng mô hình AI mới có khả năng nhận diện từng đối tượng trong bức ảnh

Meta cho biết: “Giảm nhu cầu về kiến ​​thức chuyên môn về lập mô hình theo nhiệm vụ cụ thể, tính toán đào tạo và chú thích dữ liệu tùy chỉnh cho phân đoạn hình ảnh là cốt lõi của dự án Segment Anything.”

Hơn nữa, gã khổng lồ công nghệ đã biến công cụ mới này thành mã nguồn mở, nghĩa là bất kỳ ai cũng có thể sử dụng nó. 

 

Bài viết liên quan

Bài viết đọc nhiều nhất

Lên đầu trang