-
Los primeros intentos de producción artificial de voz humana, se realizaron mediante
dispositivos mecánicos. El siguiente paso consistió en la construcción de dispositivos eléctricos,
para llegar en los últimos años a sistemas desarrollados gracias al creciente avance de
la informática. -
Alexander Graham Bell quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono.
-
Tihamer Nemes científico húngaro quiso patentar el desarrollo de una maquina para la transcripción automática de la voz. La petición de Nemes Fue negada y a este proyecto lo llamaron poco realista
-
1940 – 1950
En los principio de los años 40'
Los laboratorios de AT&T y Bell desarrollaron un aparato primitivo que podía reconocer la voz. Estos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir información verbal compleja, con alta precisión y constancia. -
Se creo el primer sistema de reconocimiento de voz, sobre una computadora analógica que reconocía dígitos del 0 al 9, este sistema era dependiente del locutor. Los experimentos dieron una exactitud de reconocimiento del 98%.
-
Se desarrollan los primeros prototipos de aparatos electrodomésticos —Whirlpool Corp.
Actualmente las PC's integran utilerías de voz. Microsoft Corp.: Facilidades para construir objetos de comandos de voz (voice-command objects) en Win95. Creative Labs integra Procesamiento automático en la mayoría de sus tarjetas soundblaster. Compaq y Pure Speech desarrollan conjuntamente tecnología de voz -
Los científicos se empezaron a enfocar, en desarrollar un sistema de reconocimiento de voz mas complejo. Como primer paso, desarrollaron un aparato que podía usar la conversación discreta, un estimulo verbal puntuado por pausas.
-
Es cuando realmente se desarrollo la tecnología de reconocimiento de voz que no requería que el usuario haga pausas entre palabras.
-
El reconocimiento de voz se favoreció por tres factores: el crecimiento de computadoras personales, el apoyo de ARPA y los costos reducidos de aplicaciones comerciales. También durante esta época hubo grandes avances tecnológicos, ya que se cambió del enfoque basado en reconocimiento de patrones a métodos de modelado probabilísticos, como los Modelos Ocultos de Markov (HMM)
-
Al 1985 un vocabulari de 100 paraules era considerat gran. No obstant al 1986 va haver-hi un de 20000 paraules. També durant aquella època va haver-hi gras avanços tecnològics, ja que es va canviar el enfocament basat en reconeixement de
-
Cap als noranta, els costos de les aplicacions de reconeixement de veu van continuar decreixent i els vocabularis extensos van començar a ser normals. També les aplicacions independents del locutor i del flux continu, van començar a ser mes comuns.
-
AT&T introdujo su Voice Recognition Call Processing System en: 1992 (llamadas por cobrar, por cargo a tarjeta de crédito, cargos a terceros) a finales de 1993 procesaba 50 millones de llamadas al mes.
-
En 1995 teléfonos celulares ya ofrecían servicios de marcado activado por voz.
-
A partir del 2000 els avanços en reconeixement de veu van ser protagonistes. El llançament mes mediàtic va ser l’assistent de veu intel·ligent d’Apple Siri, l’any 2011
-
Mesos mes tard va ser google el que es va sumar a la iniciativa dels assistents de veu intel·ligents, presentant Google now, a principis del 2012. L'assistent va debutar inicialment al maig de 2016 com a part de l'aplicació de missatgeria de Google Allo, i el seu altaveu activat per veu Google Home. Després d'un període d'exclusivitat en els telèfons intel·ligents Píxel i Píxel XL, va començar a implementar-se en altres dispositius Android al febrer de 2017.
-
Paral·lelament Windows el 2013 va presentar el seu assistent Cortana, llançat oficialment el 2015. Cortana és un assistent virtual habilitat per a veu desenvolupat per Microsoft per a ajudar els usuaris de Windows 10 a iniciar sol·licituds. Així com completar tasques i anticipar necessitats futures en presentar dades rellevants en un context personal.
-
Al mateix any que aquest llançament Amazon presenta als Estats units la seva revolucionaria Alexa Echo, que a posteriori es presentaria al mercat europeu, i que avui en dia tenim entre nosaltres.
-
L’últim a sumar-se al negoci dels assistents de veu va ser Samsung, amb l’assistent “Bixby”. Aquest va ser presentat durant l’event de Samsung Galaxy 2017, com l'alternativa llançada per Samsung. Orienta el seu funcionament en els seus mòbils que almenys usin Android 7.0 “Nougat”, televisors i neveres. Van posar a la venda un altaveu intel·ligent, però no va tenir gens d'èxit.
-
Els acadèmics suggereixen que per a fins de la dècada del 2020, el 99% del treball de transcripció serà automàtic. Els humans només intervindran per al control de qualitat i les correccions.