-
Los laboratorios de AT&T y Bell desarrollaron un aparato primitivo que podía reconocer la voz. Estos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir información verbal compleja, con alta precisión y constancia.
-
El físico John Larry Kelly, y su colega Louis Gerstman usaron una computadora IBM 704 para sintetizar la voz, un evento importante en la historia de los laboratorios Bell. El sintetizador de voz de Kelly (vocoder) reprodujo la canción "Daisy Bell" con el acompañamiento musical de Max Mathews. Casualmente, Arthur C. Clarke estaba visitando a su amigo y colega John Pierce en los laboratorios Bell en Murray Hill.
-
Los científicos se empezaron a enfocar, en desarrollar un sistema de reconocimiento de voz mas complejo. Como primer paso, desarrollaron un aparato que podía usar la conversación discreta, un estimulo verbal puntuado por pausas.
-
Los primeros sistemas de computadora basados en la síntesis de voz fueron creados en los cincuenta. El primer sistema general de inglés de texto-habla fue desarrollado por Noriko Umeda en 1968 en Laboratorio Electrotecnico en Japón.
-
Sin embargo en 1970, es cuando realmente se desarrollo la tecnología de reconocimiento de voz que no requería que el usuario haga pausas entre palabras. Esta tecnología se volvió practica en los años 80 y sigue siendo desarrollada y afinada hasta hoy en día.
-
Dispositivos móviles electrónicos incluyendo síntesis de voz comenzaron a aparecer en los setentas. Unos de los primeros fue la calculadora para ciegos Speech+ de Telesensory Systems Inc. (TSI)
-
Otros dispositivos fueron producidos con fines educativos como el "Speak & Spell", creado por Texas Instruments.
-
Fidelity lanzó una versión parlante de su ajedrez electrónico.
-
El primer videojuego en incluir la síntesis de voz fue el arcade shoot 'em up, Stratovox, de Sunsoft.
-
El primer juego electrónico multijugador en usar la síntesis de voz fue "Milton" de Milton Bradley Company, 23 la cual produjo el dispositivo.
-
El sistema, puesto a la venta en 1994, permite una conversión de texto-habla basada en una completa articulación usando una guía de ondas o una línea de transmisión análoga de la voz humana y conductos nasales controlados por el "modelo distintivo de región" de Carré.
-
Allied Business Intellignece (ABI) proyectó que el incremento en la popularidad de sistemas de reconocimiento de voz creara un aumento de ventas de $677 millones en el 2002 a ventas de $5.3 billones en el 2008
-
Algunos sistemas PBX permiten a los usuarios ejecutar comandos mediante el habla, en lugar de pulsar tonos. En muchos casos se pide al usuario que diga un número para navegar un menú.
-
Los sistemas de reconocimiento de habla diseñados para dar órdenes a un computador (p.e. "Abrir Firefox", "cerrar ventana") se llaman Control por comandos. Estos sistemas reconocen un vocabulario muy reducido, lo que incrementa su rendimiento.