Nvidia, Apple Và Loạt Big Tech Bị Cáo Buộc Sử Dụng 173.000 Video Trên YouTube Để Đào Tạo AI

Các nhà sáng tạo nội dung lên án việc sử dụng video của họ mà không được phép đồng ý, đồng thời cho rằng việc thiếu minh bạch về cách dữ liệu được sử dụng là vi phạm quyền riêng tư và bản quyền.

Các công ty lớn như Apple và Nvidia đang bị cáo buộc đã sử dụng các video trên YouTube không theo quy định để đào tạo AI của mình, theo một báo cáo chung từ Proof News và Wired. Những video từ YouTube, được cho là vi phạm Điều khoản dịch vụ của nền tảng này, đã được sử dụng làm dữ liệu đào tạo cho AI, gây ra mối lo ngại về quyền sở hữu nội dung và sự bảo mật dữ liệu.

Nvidia, Apple Và Loạt Big Tech Bị Cáo Buộc Sử Dụng 173.000 Video Trên YouTube Để Đào Tạo AI

Dữ liệu đào tạo này bao gồm "YouTube Subtitles", một tập hợp lớn các bản ghi văn bản của YouTube, với hơn 173.536 bản ghi, trong đó có hơn 12.000 video đã bị xóa kể từ khi tập dữ liệu được tạo vào năm 2020. Các kênh như Crash Course và Philosophy Tube, cùng với các nhân vật nổi tiếng trên YouTube như MrBeast và Pewdiepie, là một số trong số các nguồn nội dung bị ảnh hưởng.

EleutherAI, một tổ chức phi lợi nhuận trong lĩnh vực nghiên cứu AI, đã phát triển tập dữ liệu "The Pile", một kho dữ liệu 800 GB được thiết kế để "dân chủ hóa" công nghệ AI, nhằm cung cấp nguồn tài nguyên cho cộng đồng và không chỉ giới hạn ở các công ty lớn. Tuy nhiên, sự hiện diện của các tập đoàn lớn trong quá trình này đã làm lu mờ mục tiêu ban đầu, với việc sử dụng dữ liệu không được chấp nhận rộng rãi gây ra nhiều tranh cãi.

Nvidia, Apple Và Loạt Big Tech Bị Cáo Buộc Sử Dụng 173.000 Video Trên YouTube Để Đào Tạo AI

Các cuộc thảo luận đang diễn ra trong ngành về tính đạo đức của việc sử dụng dữ liệu đào tạo, với câu hỏi liệu các công ty nên chịu trách nhiệm về việc thu thập dữ liệu không phù hợp hoặc không. Trong khi đó, EleutherAI chưa đưa ra bất kỳ bình luận nào về các cáo buộc hoặc hành vi sai trái.

Ngành công nghệ đang phát triển nhanh chóng, đặt ra nhu cầu cao cho phần cứng AI, với ước tính cần đạt 600 tỷ đô la lợi nhuận mỗi năm để đáp ứng. Sự cạnh tranh gay gắt và chi phí liên tục tăng có thể thúc đẩy các hành vi lấy dữ liệu một cách bất hợp pháp, như đã thấy trong trường hợp này và các vụ việc khác như Gemini của Google. Câu hỏi về tính bền vững và đạo đức của việc thu thập dữ liệu cho AI vẫn còn là một chủ đề nóng hổi trong ngành công nghệ hiện nay.

Bài viết đọc nhiều nhất

Bài viết mới trong ngày

Kadokawa và cuộc "thay máu" lịch sử: Khi gã khổng lồ giải trí kêu gọi nhân viên trên 45 tuổi nghỉ hưu sớm

Kadokawa và cuộc "thay máu" lịch sử: Khi gã khổng lồ giải trí kêu gọi nhân viên trên 45 tuổi nghỉ hưu sớm

hoanlagvn

Trong một động thái đầy bất ngờ nhằm tái thiết lập bộ máy vận hành, tập đoàn truyền thông hàng đầu Nhật Bản - Kadokawa - vừa chính thức phát đi thông báo về chương trình nghỉ hưu sớm tự nguyện. Đây được xem là nỗ lực "tinh gọn" đội ngũ để đối đầu với sức ép cạnh tranh khủng khiếp trong kỷ nguyên giải trí đa nền tảng.

Giải trí
"Cơn địa chấn" 16 nghìn tỷ đồng: Tên miền của nhóm nhạc Aqours bị rao bán, fan lo sợ sập bẫy lừa đảo

"Cơn địa chấn" 16 nghìn tỷ đồng: Tên miền của nhóm nhạc Aqours bị rao bán, fan lo sợ sập bẫy lừa đảo

hoanlagvn

Một sự việc hy hữu đang khiến cộng đồng yêu thích thương hiệu Love Live! Sunshine!! đứng ngồi không yên: Tên miền của câu lạc bộ người hâm mộ chính thức nhóm Aqours bất ngờ bị đưa lên sàn đấu giá. Với mức giá "trên trời" cùng những rủi ro an ninh tiềm ẩn, đây đang là chủ đề nóng nhất trên các diễn đàn công nghệ và giải trí tại Nhật Bản.

Giải trí
Lên đầu trang