-
Aproximadamente por 1769, W.R. Kempelen, ingeniero y arquitecto húngaro, bien situado en el gobierno de su monarquía, ya había comenzado a trabajar en su máquina parlante (speaking machine). Se trataba de un dispositivo mucho más sofisticado, que era capaz de producir también sonidos consonánticos. Esta tarea le ocupó más de 20 años y sus resultados fueron publicados en un extenso volumen de 456 páginas, en 1791.
-
Esta máquina producía sonidos que eran comunes a todas las lenguas europeas. El inventor
aseguraba que cualquier persona podía lograr en tres semanas realizar síntesis de voz,
realmente sorprendente, en las lenguas francesa, italiana y latina. . Usando la descripción dada por Kempelen, C.
Wheatstone, físico inglés nacido el 6 de febrero de 1802 en Gloucester y muerto el 19 de octubre
de 1875 en París, construyó una versión mejorada de la máquina parlante. -
Alexander Graham Bell quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono
-
Alexander Graham Bell quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono
-
A principios del año 1940, los laboratorios de AT&T y Bell desarrollaron un aparato primitivo que podía reconocer la voz. Estos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir información verbal compleja, con alta precisión y constancia.
-
El primer sistema de reconocimiento de voz fue desarrollado sobre una computadora analógica que reconocía dígitos del 0 al 9, este sistema era dependiente del locutor, en RCA Lab
-
Reconocedor fonético, creado en University College en Inglaterra
-
La primera máquina capaz de reconocer habla fue un perro de juguete , llamado Radio Rex, que avanzaba cuando percibía un tono de 500 hz, que coincidía aproximadamente con el primer formante de la pronunciación de la palabra "Rex", de forma que parecía que el perro avanzaba cuando se le llamaba.
-
Advanced Research Projects Agency (ARPA) de la sección Americana de Defensa comenzó investigaciones enfocados al habla continua y usando vocabularios mas extensos, tambien se mejoró la tecnología de reconocimiento para palabras aisladas y continuas.
-
Se desarrollaron técnicas para el reconocimiento de voz como: Time warping, modelado probabilístico y el algoritmo de retropropagación
-
Durante los 80 el reconocimiento de voz se favoreció por tres factores: el crecimiento de computadoras personales, el apoyo de ARPA y los costos reducidos de aplicaciones comerciales.
El mayor interés era el desarrollo de vocabularios grandes -
Los costos de las aplicaciones de reconocimiento de voz continuaron decreciendo y los vocabularios extensos comenzaron a ser normales. También las aplicaciones independientes del locutor y de flujo continuo (lo contrario al flujo discreto, es decir, en el habla no hay pausas significantes) comenzaron a ser más comunes.
-
CMU Sphinx (acortado como Sphinx), es el término general para describir un grupo de sistemas de reconocimiento de voz desarrollado en la Universidad de Carnegie Mellon. Incluye una serie de programas para reconocimiento de voz (Sphinx 2 - 4) y un entrenador modelo acústico (SphinxTrain).
-
La tecnología de reconocimiento de voz no nació con el iPhone 4s el primero en el que apareció Siri. La atención telefónica lleva utilizando esta forma de interacción muchos años. Y no deja de ser un reflejo de la mejora de la técnica el que la máquina antes entendiera al humano de pascuas a ramos mientras que ahora la precisión ha aumentado.
-
Que Google guarde archivos con grabaciones de nuestra voz y los suba a nuestra cuenta no tendría que ser una sorpresa para muchos, ya que lo lleva haciendo desde el año pasado, cuando lanzó la detección del "Ok Google" desde cualquier pantalla. Y no es la única compañía que lo hace, Apple con Siri también guarda la voz. Es con la activación del "Ok Google" desde cualquier pantalla cuando se comienza a guardar nuestra voz.