Project Gutenberg sử dụng AI chuyển văn bản thành giọng nói, phát hành 5.000 cuốn sách nói miễn phí

Sách nói đã trở nên phổ biến trong những năm gần đây nhưng việc tiếp cận là vô cùng khó khăn và tốn kém.

Giờ đây, độc giả có thể nghe hàng nghìn cuốn sách nói về văn học cổ điển miễn phí và các tài liệu thuộc phạm vi công cộng khác thông qua Project Gutenberg. Các nhà nghiên cứu của Microsoft và MIT đã tạo ra bộ sưu tập này bằng cách quét sách bằng phần mềm chuyển văn bản thành giọng nói nghe có vẻ tự nhiên và có thể phân tích định dạng đầy đủ.

Các văn bản bao gồm các tác phẩm của Shakespeare, Agatha Christie, Jane Austen, Leonardo Da Vinci và những người nổi tiếng khác. Người dùng có thể nghe chúng trên Internet Archive, Spotify, Apple Podcasts và Google Podcasts. Mã được sử dụng để xây dựng bộ sưu tập có sẵn trên GitHub.

Apple bắt đầu bán sách nói vào tháng 1 bằng công nghệ chuyển văn bản thành giọng nói tự động. Tuy nhiên, dự án này đã bị xem xét kỹ lưỡng bởi các tác giả văn học vì ứng dụng vào thương mại và những dữ liệu này được dùng để đào tạo AI của công ty. Cách tiếp cận của Gutenberg cũng có thể thể gây ra phản ứng tương tự như Apple vì sử dụng mã nguồn mở.

Dự án Gutenberg đã dành nhiều thập kỷ để tập hợp một thư viện tài liệu miễn phí ở định dạng văn bản và "sách nói" lại giúp tài liệu này trở nên dễ tiếp cận hơn. Chúng hữu ích cho những độc giả đang lái xe, làm việc, khiếm thị, học đọc hoặc học một ngôn ngữ mới.

Vấn đề đầu tiên và quan trọng nhất là xác định những cuốn sách kỹ thuật số nào mà phần mềm có thể phân tích. Project Gutenberg thu thập tài liệu của mình ở nhiều định dạng và nhiều file của nó có lỗi hoặc bản quét không hoàn hảo. Vì vậy, các nhà nghiên cứu đã tập trung vào những cuốn sách được lưu trữ dưới dạng tệp HTML và xây dựng một công cụ (như hình trên) để khám phá những mục nào hiển thị định dạng tương tự.

Project Gutenberg sử dụng AI chuyển văn bản thành giọng nói, phát hành 5.000 cuốn sách nói miễn phí

Một vấn đề khác mà các nhà nghiên cứu đã giải quyết là đảm bảo hệ thống nhận biết được văn bản nào cần đọc hoặc bỏ qua. Nó giải quyết các thành phần như mục lục, số trang, chú thích cuối trang và các tài liệu không liên quan khác.

Hơn nữa, kết quả văn bản được đọc bởi giọng nói tự nhiên của con người. Các nhà nghiên cứu tập trung vào việc truyền tải giọng phù hợp nhất cho các tác phẩm phi hư cấu và tường thuật, nhưng người dùng có thể điều chỉnh phần mềm để thử đọc kịch tính.

Project Gutenberg sử dụng AI chuyển văn bản thành giọng nói, phát hành 5.000 cuốn sách nói miễn phí

20/09/2023 14:16

Sách nói đã trở nên phổ biến trong những năm gần đây nhưng việc tiếp cận là vô cùng khó khăn và tốn kém.

Elon Musk lên kế hoạch biến X thành ứng dụng trả phí

Trung Quốc thành lập các tiêu chuẩn quản lý cho metaverse

Sức mạnh của Nintendo Switch 2 được hé lộ bởi tài liệu toà án của Microsoft

Nhóm AI của Microsoft vô tình làm lộ 38TB dữ liệu nhạy cảm

Đồng sáng lập DeepMind dự đoán "làn sóng thứ ba" của Ai

Những điều cần biết về iOS 17: Tính năng mới, điện thoại tương thích,...

4 nhược điểm cần cân nhắc trước khi mua iPhone 15 Pro

Apple để lộ dung lượng pin iPhone 15 series

TikTok bị phạt 345 triệu euro vì vi phạm dữ liệu trẻ em

iPhone 15 Pro Max vs Huawei Mate 60 Pro: So sánh thông số kỹ thuật siêu phẩm hot nhất năm 2023

Halo: Campaign Evolved Bất Ngờ Yêu Cầu Duy Trì Kết Nối Mạng Trên PlayStation 5

Cơn thịnh nộ toàn cầu: Crunchyroll bị tẩy chay dữ dội vì ép fan trả phí gói cao cấp mới được... mua đồ lưu niệm

Báo lớn Philippines phá lệ ca ngợi "Thất nghiệp chuyển sinh": Kiệt tác gai góc phá vỡ mọi lối mòn của dòng phim Isekai

Sao Nam Xolo Maridueña Trở Lại Vai Blue Beetle Trong Hậu Truyện Superman: Man of Tomorrow

"Cụ tổ" ngành nghỉ hưu sớm tái xuất: Siêu phẩm The Greatest Magicmaster's Retirement Plan chính thức chốt lịch hóa Anime

Smartphone AI đầu tiên muốn vượt mặt Apple và OpenAI, dùng AI thay thế ứng dụng truyền thống

Project Gutenberg sử dụng AI chuyển văn bản thành giọng nói, phát hành 5.000 cuốn sách nói miễn phí

20/09/2023 14:16

Sách nói đã trở nên phổ biến trong những năm gần đây nhưng việc tiếp cận là vô cùng khó khăn và tốn kém.

Bài viết liên quan

Vì sao dùng repeater WiFi nhưng mạng vẫn chậm? Trường hợp Totolink EX200

OpenAI được cho là phát triển thiết bị AI đầu tiên, không có màn hình và có thể di chuyển

Galaxy Watch 9 và Galaxy Watch Ultra 2 lộ cấu hình trước ngày ra mắt, lần đầu dùng chip Snapdragon

Google Pixel 11 lộ ảnh render với ba tùy chọn màu trước ngày ra mắt

Bài viết đọc nhiều nhất

Palit ra mắt phiên bản mới, NVIDIA dường như chưa muốn khai tử huyền thoại Ampere

Chuột gaming đầu tiên tích hợp quạt Noctua sắp ra mắt

Heartstopper Forever Khép Lại Hành Trình 10 Năm Đầy Cảm Xúc

Đỉnh cao nhập vai: Siêu coser Hane Ame gây bão toàn cầu với bộ ảnh "Thất nghiệp chuyển sinh" đẹp nghẹt thở

Bài viết mới trong ngày

EU chính thức buộc Google chia sẻ dữ liệu tìm kiếm và mở Android cho AI bên thứ ba

Bóc trần góc khuất Tokyo: Anime "Chainsmoker Cat" phơi bày thực trạng nghèo đói tàn khốc bị che giấu tại Nhật Bản

Rò Rỉ Tin Đồn Assassin's Creed Hexe Có Thể Ra Mắt Giữa Năm 2027

ASUS tung BIOS Beta mới, tối ưu RAM DDR5 CXMT trên bo mạch chủ AMD X670/X870

Diễn Viên Liam Neeson Rượt Đuổi Nghẹt Thở Trong Trailer Đầu Tiên Của The Mongoose