El nivel medio de #Skype en todos los #idiomas aún no amenaza a los #traductores

20160610_3

La capacidad de las máquinas para traducir el lenguaje cotidiano en máquinas aún no se ha logrado, a pesar de llevar 30 años intentándolo. Realmente, es culpa nuestra. Si habláramos con la claridad y precisión de los diplomáticos de Naciones Unidas, entonces las herramientas de inteligencia artificial (IA) trabajarían con patrones bien establecidos. Cuanto más dependamos de palabras o sintaxis desconocidas para expresar nuestros pensamientos, más difícil resulta para el software de traducción acertar sin ayuda adicional.
 
Aun así, Microsoft, Google, Baidu, Facebook, IBM y muchos otros compiten por la supremacía en este complicado campo. Ofrecer un reconocimiento de voz y una traducción de primera categoría puede convertirse en una atractiva tarjeta de visita para asegurarse clientes en muchos otros servicios. Esta capacidad puede ser útil desde en las búsquedas de internet hasta en la computación en la nube, en la que el almacenamiento y el procesamiento de datos se proporcionan mediante servidores remotos y una conexión a internet.
 
El gasto global en infraestructuras y computación en la nube superó los 100.000 millones de euros el año pasado y está creciendo a un ritmo anual del 28%, según Synergy Research. La traducción en tiempo real puede ayudar a las líneas de servicios de computación en la nube de los competidores a destacar en un negocio de productos básicos en el que el elemento diferenciador es el precio. Por ahora, la mayoría de los servicios de traducción son gratuitos, pero puede que surjan alternativas de pago a medida que las empresas internacionales vayan necesitando herramientas de traducción que funcionen aún mejor.
 
Microsoft, en particular, trabaja para que los usuarios de una empresa puedan construir capacidades mayores sobre el básico motor Skype Translator. El objetivo es que los clientes puedan cargar en el sistema miles de términos, documentos, conversaciones de muestra y locuciones peculiares especializadas por adelantado. 
 
El software de traducción funciona mucho mejor si puede aprovecharse de una amplia base de datos de patrones del lenguaje. Esta información incluye aquello que es más posible que sea pronunciado por el orador, según explica el director de estrategia de investigación de Microsoft, Vikram Dendi. Los consultores de gestión pueden emplear términos como "delta" y "granularidad" en contextos que a los demás nos resultan impensables. Los químicos industriales pueden referirse a más de una docena de tipos distintos de ftalatos. Y dentro de cualquier empresa grande, los apodos de los proyectos, procesos y ejecutivos son infinitos.
 
Ofrecer un reconocimiento de voz y una traducción de primera categoría puede convertirse en una atractiva tarjeta de visita para asegurar clientes en muchos otros servicios. 
 
Desde 2011, Microsoft permite que sus grandes clientes suban sus propios glosarios y materiales escritos en las bases de datos de traducción de textos. El objetivo es producir unos resultados más fiables que los del servicio básico Bing de Microsoft, especialmente en densos materiales técnicos. Más de 10.000 usuarios han optado por la personalización, apunta Dendi. Los clientes ocasionales pueden llegar a gastar unos 36 euros al mes, usuarios frecuentes, como Adobe y Twitter, pueden pagar mucho más.
 
Microsoft ha probado una amplia variedad de estrategias para perfeccionar la traducción desde mediados de la década de 1990, cuando el fundador de la empresa, Bill Gates, predijo que el reconocimiento de voz estaría ampliamente disponible en los siguientes 10 años. Los primeros enfoques dependían de categorizar reglas específicas de la gramática y el uso. A partir de 2009, Microsoft amplió su énfasis. Las técnicas estadísticas han sido emparejadas con redes neuronales, sistemas de aprendizaje de máquinas basados en la estructura y la naturaleza autodidacta del cerebro humano.
 
Actualmente, Microsoft emplea cinco capas de redes neuronales para analizar el habla, explica el director de la división de investigaciones de la empresa, Peter Lee. Las primeras capas analizan los sonidos a un nivel tan rudimentario como el que usa el software de análisis de imágenes para detectar bordes y superficies, sin hacer ningún esfuerzo por determinar qué podrían ser los objetos. Al igual que muchos enfoques de inteligencia de máquinas avanzada, existe cierto misterio acerca de cómo funciona, incluso para los investigadores involucrados. "No tiene nada que ver con palabras ni fonemas", afirma Lee. El responsable detalla: "No creo que ninguno de nosotros entienda exactamente qué examina la capa inferior. Pero funciona sorprendentemente bien".
 
Los investigadores de Microsoft también han estado haciendo mayor uso de lo que se conoce como "memoria larga a corto plazo". Cuando reconocen la voz o traducen, las redes neuronales realizan una serie de conjeturas que revisan a medida que adquieren nueva infomación. A veces, un patrón propuesto de repente no funciona. En tales casos, las redes neuronales pueden reagruparse mejor para volver a elaborar las suposiciones que dieron paso a las conjeturas de varias palabras. Mantener un historial más largo de la memoria a corto plazo del sistema permite desandar lo andado y corregir. 
 
Hacen falta al menos 4.000 horas de muestras habladas y millones de palabras escritas para que una red neuronal aprenda un nuevo idioma. El director del equipo de traducción de máquinas de Microsoft, Arul Menezes, esperaba encontrar más dificultades en idiomas como el árabe, en el que los acentos de las personas pueden variar ampliamente. Pero al recopilar muestras de suficientes voces de personas distintas, según Menezes, ha sido posible entrenar al "oído" de Skype Translator frente a diferentes entonaciones hasta tal punto que los acentos regionales ya no representan un problema. Lo mismo sucede con las diferencias entre las voces femeninas y masculinas.
 
Otras variaciones del lenguaje común son más complicadas. Las redes neuronales son muy sensibles a diferencias de micrófono. Las pausas del habla también son problemáticas. Como señala Menezes, "la gente normalmente no hace una pausa al final de una frase. Hace la pausa en otra parte. Las pausas acaban siendo inútiles para detectar cuándo empieza o acaba una frase. Hay que guiarse por las propias palabras".
 
Identificar las traducciones correctas para palabras ambiguas también es un reto infinito, reconoce el responsable. Mientras hablaba en alemán, Ripper emplea a menudo la palabra Sie, que puede significar ella, tú o ellos, en función de la situación. Skype Translator acierta alrededor del 80% del tiempo.
 
Con una leve sonrisa, Menezes señala: "No creo que los traductores profesionales estén temblando de miedo por lo que estamos haciendo. Sus empleos aún estarán asegurados durante bastante tiempo". 
 
Siempre que se hable despacio y se eviten frases largas, los servicios automatizados como Skype Translator pueden resultar muy útiles a la hora de superar barreras lingüísiticas. 
 
 
Si te gustó, compartilo:

Para poder comentar ingrese al sitio

Beneficios Socios

Vinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo SliderVinaora Nivo Slider

Actividades

ico_jiap.png ico_interjiap.png ico_socios.png
ico_ptu.png ico_claustro.png ico_premiogranato.png
ico_aap.png ico_green.png ico_calidad.png

 

Quién esta en línea

Hay 161 invitados y ningún miembro en línea

Síguenos en:

ico_facebook.png ico_twitter.png ico_linkedin.png ico_YT.png  
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE
IMAGE

Un día como hoy