Việc xóa dữ liệu xây dựng lại không chỉ ảnh hưởng trực tiếp tới khả năng vận hành mà nó còn tiêu tốn của OpenAI khoảng thời gian dài để huấn luyện lại AI.
OpenAI, công ty đứng sau công cụ AI phổ biến ChatGPT, có thể buộc phải xóa sạch toàn bộ dữ liệu và bắt đầu lại từ đầu.
Theo Arsc Techina, việc xóa toàn bộ dữ liệu có thể liên quan đến của một vụ kiện của trang báo New York Times. Cũng chính vụ việc trên cũng khiến OpenAI bị phạt tới 150.000 USD cho mỗi phần tài liệu có bản quyền được sử dụng để đào tạo mô hình ngôn ngữ.
Việc xóa dữ liệu xây dựng lại không chỉ ảnh hưởng trực tiếp tới khả năng vận hành mà nó còn tiêu tốn của OpenAI khoảng thời gian dài để huấn luyện lại AI.
Theo nguồn tin, NYT lo ngại về cách AI sẽ được sử dụng trong các công cụ tìm kiếm. Khi người dùng tìm kiếm một chủ đề, thay vì phải nhấp vào một bài báo được đăng bởi Times, AI có thể chỉ cần tóm tắt bất cứ điều gì được viết bởi nhà báo và cũng chính vì điều đó cũng sẽ khiến "nhu cầu truy cập trang web của nhà xuất bản đã giảm đi rất nhiều."
NYT sẽ không phải là đơn vị đầu tiên đệ đơn kiện một công ty AI. Đầu năm nay, Getty Images đã kiện Stability AI vì đào tạo Stable Diffusion bằng cách sử dụng ảnh từ Getty mà không có sự cho phép. Tuy nhiên, Getty Images đã không mong muốn khoảng phí bồi thường tài chính từ Stability AI; thay vào đó, nền tảng mong muốn xây dựng lại mô hình với hy vọng "tôn trọng quyền sở hữu trí tuệ".
Tiếp đó, một vụ kiện tập thể cũng đã được đệ trình chống lại OpenAI, với cáo buộc ChatGPT đã lấy dữ liệu từ hàng triệu người dùng mà không có sự đồng ý hoặc biết trước. Thông tin này được lấy từ nhiều ứng dụng của bên thứ ba như Spotify, Microsoft Teams và Snapchat, trong số nhiều ứng dụng khác.
Hiện tại, New York Times và OpenAI đang có một "cuộc đàm phán" nhằm có được thoả thuận cho phép OpenAI đào tạo hợp pháp mô hình GPT của mình từ tài liệu do NYT xuất bản, điều mà tờ báo này đưa ra quyết định cấm vào đầu tháng này.