Tìm HiểU Khả Năng Tương Thích CủA Zodiac Sign
Gặp gỡ Forensia, một phần mềm sẵn sàng gỡ lỗi các tệp âm thanh WhatsApp giả mạo
Kiểm Tra Thực Tế

Bởi Inferiorz Presents / Shutterstock
Những người kiểm tra sự thật thường đảo mắt khi họ cần xác minh tệp âm thanh được trích xuất từ WhatsApp. Họ biết rằng đó là một công việc tốn nhiều thời gian và thiếu công cụ để giúp họ đưa ra phán quyết về giọng nói mà họ nghe được. Kịch bản này, tuy nhiên, đã thay đổi. Forensia đang hoạt động ở Buenos Aires và sẵn sàng hoạt động bằng các ngôn ngữ Saxon và Lãng mạn - nhưng không miễn phí.
Được ra mắt bởi Phòng thí nghiệm Nghiên cứu Cảm quan (LIS), một phần của Hội đồng Nghiên cứu Khoa học và Kỹ thuật Quốc gia của Argentina (Conicet), Forensia - như tên gọi - một phần mềm pháp y được sử dụng để xác minh thực tế lần đầu tiên vào tuần trước.
Vào đầu tháng, tổ chức kiểm tra thực tế của Argentina đã kiểm tra đã thấy một tệp âm thanh trở nên lan truyền trên WhatsApp và quyết định chi 10.000 peso (vì Chequeado là một tổ chức phi chính phủ quốc gia) cho một báo cáo từ LIS.
Laura Zommer, giám đốc của nền tảng, đã rất ngạc nhiên trước kết quả mà nhóm của cô ấy thu được và quyết định chia sẻ kinh nghiệm này với Mạng lưới kiểm tra sự thật quốc tế.
Cô nói: “Chúng tôi luôn nhận được nhiều tệp âm thanh để xác minh tính xác thực và mặc dù chúng tôi luôn muốn xác minh chúng, nhưng chúng tôi chưa bao giờ có thể làm như vậy. “Forensia không phải là một giải pháp rẻ tiền, nhưng chắc chắn nên được sử dụng để xác minh các chủ đề quan trọng và khi các nhân vật quan trọng có liên quan.”
Vụ kiện mà Chequeado có trong tay tuần trước thực sự rất mạnh mẽ. Trong tệp âm thanh mà họ muốn xác minh, một chính trị gia cụ thể được cho là đã buộc tội toàn bộ cộng đồng không phải người da trắng đã bỏ phiếu cho Chủ nghĩa Kirchnerism vì 'người da đen * muốn thịt nướng, rượu rẻ, bia, nhiều bia, nồi và cocaine.' Chequeado cần xác nhận xem giọng nói đó có thực sự là từ nghị sĩ Guillermo Montenegro hay không - như đã được lan truyền trên WhatsApp và các kênh truyền thông xã hội khác.
Jorge Gurlekian, nhà khoa học nghiên cứu chỉ đạo LIS, đã nhận được tệp WhatsApp và yêu cầu người kiểm tra xác thực cung cấp các tệp âm thanh thực khác từ giọng nói của Montenegro. Anh ấy cắm tất cả chúng vào Forensia và trong vài phút, kết luận rằng có rất ít khả năng giọng nói đó là của Montenegro. Trên thang điểm từ -5 đến +5, đoạn âm thanh được chấm điểm -1.
“Đầu tiên chúng tôi so sánh hồ sơ được hỏi với những hồ sơ mang tiếng nói thực sự của ứng viên. Sau đó, chúng tôi so sánh hồ sơ được hỏi với một cơ sở dữ liệu khổng lồ về giọng nói và âm thanh từ những người sinh ra và sống ở khu vực ứng viên đến từ đâu, ”Gurlekian giải thích. “Câu trả lời cuối cùng của chúng tôi không bao giờ là nhị phân. Đó là một xác suất và chúng tôi đặc biệt đề nghị những người kiểm tra thực tế sử dụng Forensia như một bằng chứng khác cho công việc của họ - giống như thẩm phán sử dụng xét nghiệm DNA ”.
Gurlekian đã nghiên cứu tính năng nhận dạng giọng nói trong nhiều thập kỷ và đã giúp đỡ các lực lượng an ninh và hệ thống tư pháp ở nước mình trong một thời gian dài. Giờ đây, anh ấy rất hào hứng khi thấy kiến thức của mình - và công cụ của anh ấy - có thể phục vụ trong cuộc chiến chống lại thông tin sai lệch trực tuyến.
“Nhóm của tôi, bao gồm Miguel Martinez Soler, Pedro Univaso và tôi, đã sẵn sàng 100% để làm việc với những người kiểm tra thực tế và thử nghiệm trong lĩnh vực này,” anh nói. “Chúng tôi chỉ cần ghi nhớ rằng một số yêu cầu kỹ thuật là cần thiết. Ví dụ: âm thanh được đặt câu hỏi phải dài ít nhất 15 giây để được xác minh và phải phức tạp về mặt ngữ âm. Ví dụ: một tệp mà bạn chỉ nghe thấy một người nói 'vâng, vâng, vâng' sẽ không phù hợp với Forensia. '
Định dạng tệp hoàn hảo để chạy trong phần mềm là .wav, nhưng Gurlekian biết điều này là không thực tế trong vũ trụ tin tức sai lệch và sẵn sàng đối phó với các bản ghi WhatsApp. Khoảng 90 chỉ số khác nhau được xác minh trong mỗi tệp và hầu hết chúng không liên quan gì đến nội dung của những gì đang được nói, đó là lý do tại sao công cụ này có thể xử lý nhiều thành ngữ.
Forensia có thể được cấp phép và cài đặt trong máy tính nhưng Gurlekian đề nghị cộng đồng kiểm tra thực tế quốc tế nên thực hiện một bước mới và cho phép Gurlekian chạy thử nghiệm.
Để hiểu đầy đủ báo cáo do phần mềm cung cấp, cần phải đào tạo một số. Điều quan trọng là phải nhập cơ sở dữ liệu địa phương về giọng nói vào Forensia để có báo cáo chính xác hơn từ máy - và chỉ Gurlekian và nhóm của anh ấy có thể làm điều đó.
“Các quốc gia phát triển nhất trên thế giới đã có cơ sở dữ liệu công khai về tiếng nói của công dân. Một số trong số chúng thậm chí còn được chia thành các vùng và một số cơ sở dữ liệu này là công khai. Nhưng những người khác thì không, ”Gurlekian nói.
Forensia cũng có thể chỉ ra các ấn bản được tạo trong một tệp và giúp xác định thời điểm thay đổi được thực hiện trong một câu.
Vậy hạn chế của nó là gì?
“Hạn chế là có thể bị lão hóa. Giọng của con trai và con gái thay đổi theo thời gian. Nếu chúng tôi đặt câu hỏi về một đoạn âm thanh được ghi lại khi chúng còn nhỏ, chúng tôi sẽ cần những ví dụ về giọng nói thực của thời đó để so sánh và điều đó có thể khó khăn ”.
* Thuật ngữ được sử dụng trong tiếng Tây Ban Nha là 'los negros'. Điều đó thường đề cập đến các cộng đồng không phải người da trắng, người nghèo và người nhập cư.
Cristina Tardáguila là phó giám đốc của Mạng lưới Kiểm tra Dữ kiện Quốc tế. Có thể liên lạc với cô ấy qua email.