IBM vừa công bố một cột mốc mới mà họ đạt được trong việc phát triển công cụ nhận diện giọng nói, giúp máy móc nhận biết giọng nói con người chính xác hơn trong các cuộc hội thoại.
ảnh minh họa
Công ty đã thành công khi công nghệ của họ nhận diện giọng nói với sai số là 6,9% và tới bây giờ thì họ giảm sai số xuống chỉ còn 5,5%.
Mức sai số này được đo giữa các cuộc hội thoại của con người về những chủ đề tự nhiên, ví dụ như mua xe hơi. Đó là tham chiếu đã được dùng trong 20 năm gần đây để đo độ chính xác của các hệ thống nhận giọng nói. Một vài công ty khác công bố mức sai số 5,9% là có thể chấp nhận được nhưng với IBM, họ luôn muốn mọi thứ chính xác nhất, họ cho rằng nó phải là 5,1%.
Các công nghệ nhận diện giọng nói như IBM đang phát triển sẽ nhận giọng nói, đặc biệt là ghi nhớ trong các cuộc hội thoại dài chính xác hơn. Nó chính là tiền đề cho các trợ lý ảo mà chúng ta đang dùng ngày nay như Amazon Alexa, Google Assistant chẳng hạn.