Cảnh báo lừa đảo bằng AI làm giả giọng nói (Voice Deepfake) ngày càng tinh vi

Một nghiên cứu mới cho thấy con người chỉ có thể phát hiện giọng nói được tạo ra nhân tạo trong 73% thời gian bằng cả tiếng Anh và tiếng Quan thoại.

Nghiên cứu được thực hiện bởi Kimberly Mai tại Đại học College London và các đồng nghiệp của cô, những người đã sử dụng thuật toán chuyển văn bản thành giọng nói được đào tạo trên hai bộ dữ liệu có sẵn công khai. 

Trong thử nghiệm, có hơn 50 mẫu giọng nói với hai ngôn ngữ và yêu cầu người tham gia phân biệt đâu là giọng nói thật hay giọng nói do AI tạo ra.

Cảnh báo lừa đảo bằng AI làm giả giọng nói (Voice Deepfake) ngày càng tinh vi

Có đến 529 người đã tham gia vào nghiên cứu và nhiệm vụ của họ là lắng nghe một diễn giả nữ đọc những đoạn văn bản bằng tiếng Anh hoặc tiếng Quan thoại.

Nhóm đầu tiên được nghe 20 mẫu giọng nói và xác định đâu âm thanh giả và thật. Những người tham gia đã chọn chính xác Voice Deepfake trong 73% thời gian. 

Nhóm thứ hai được nghe 20 cặp âm thanh được xáo trộn và kết quả là nhóm đã xác định âm thanh do deepfake tạo ra trong 85% thời gian.

Các giọng nói Voice Deepfake tạo ra thường đi kèm với các dấu hiệu chẳng hạn như giọng nói đều đều, cộc lốc hoặc không tự nhiên khiến.Tuy nhiên, các con số về độ chính xác chỉ tăng nhẹ sau khi những người tham gia được đào tạo về cách nhận biết các đặc điểm của giọng nói do AI tạo ra.

"Trong nghiên cứu của mình, chúng tôi đã có gắng giúp họ cải thiện việc phát hiện Voice Deepfake. Và với thử nghiệm này cũng giúp chúng tôi thấy được, các công cụ phát hiện tự động cũng không đáng tin cậy ở thời điểm hiện tại". Tiến sĩ Mai cho biết.

Cảnh báo lừa đảo bằng AI làm giả giọng nói (Voice Deepfake) ngày càng tinh vi

Nhiều trường hợp lừa đảo sử dụng deepfakes từ hình ảnh đến âm thanh vô cùng tinh vi. Gần đây xuất hiện hàng loạt vụ lừa đảo khi sử dụng giọng nói AI để gọi cho người thân, gia đình, bạn bè của nạn nhân để chuyển tiền hoặc dữ liệu nhạy cảm. Cũng có mối lo ngại về một số hệ thống bảo mật sử dụng nhận dạng giọng nói.

Mai cũng nói rằng các thuật toán được sử dụng để tạo ra các deepfakes trong nghiên cứu tương đối cũ, vì vậy những thuật toán được tạo ra bằng các công nghệ mới hơn và tương lai sẽ nghe giống như thật hơn và ít có dấu hiệu kỳ lạ khiến chúng ta khó xác định hơn.

Trở lại vào tháng 1, các nhà nghiên cứu của Microsoft đã công bố một AI mới có thể bắt chước chính xác giọng nói của con người từ một mẫu âm thanh chỉ dài 3 giây.

 

Bài viết đọc nhiều nhất

Lên đầu trang