1/7/23

Whisper

 


Similar al producto mostrado en la entrada anterior de Biblumliteraria, es Whisper, una herramienta de transcripción desarrollada por Open. AI. Según sus desarrolladores, la red neuronal que constituye su motor de reconocimiento del habla es equiparable en cuanto a acierto a un ser humano, siempre que se trate del idioma inglés.

De manera similar, se trata de un transcriptor de voz a texto en tiempo real. Permite, por ejemplo, pasarle un audio grabado en MP3 para que devuelva un texto escrito. Así, puede usarse para transcribir podcasts que nos interesen, lo hablado en una conferencia grabada, etc.

Para entrenar la red neuronal se han utilizado casi 700.000 horas de muestra de datos. Los fundamentos técnicos del sistema pueden leerse en este artículo técnico, que es sumamente interesante.

Más información en el sitio del producto.


0 comentarios :