Ir al contenido principal

El desafío de Google: el modelo de IA para 1000 idiomas está cada vez más cerca de ser una realidad




Cynthia Reina, en "Marketing Directo".-

Google está cada vez más cerca de conseguir su objetivo de crear un modelo de inteligencia artificial de 1000 idiomas para destronar a ChatGPT, anunciado en noviembre. La compañía está desarrollando todo tipo de IAs y con esta última, quieren construir un modelo que pueda comprender los 1000 idiomas más hablados del mundo.

Yu Zhang, científico investigador, y James Qin, ingeniero de software, Google Research aseguran en un comunicado que, Universal Speech Model (USM), como se llamará la IA, continúa avanzando.

Ambos describen USM como «una familia de modelos de voz de última generación» con 2 mil millones de parámetros entrenados en 12 millones de horas de voz y 28 mil millones de oraciones en más de 300 idiomas.

Además, aseguran que esta inteligencia artificial de Google ya se usa en YouTube (por ejemplo, para los subtítulos). «Puede realizar el reconocimiento de voz automático (ASR) no solo en los idiomas más hablados, como el inglés y el mandarín, sino también en idiomas de escasos recursos, como el amárico, el cebuano, el asamés, y azerbaiyanos, por nombrar algunos», informan.

De momento, USM admite más de 100 idiomas y sienta las bases para construir un sistema aún más grande.

Google analiza los desafíos del aprendizaje supervisado

La compañía asegura que debemos abordar dos desafíos importantes en el aprendizaje supervisado.

1. Obtener suficientes datos para entrenar modelos de alta calidad: requiere demasiado tiempo y dinero. Algunos idiomas son difíciles de encontrar. El aprendizaje autosupervisado puede aprovechar los datos de solo audio, que están disponibles en cantidades mucho mayores en todos los idiomas.

2. Los modelos deben mejorar de manera computacionalmente eficiente mientras amplían la cobertura y la calidad del idioma.

El enfoque de la compañía: aprendizaje autosupervisado con ajuste fino

Para el primer paso, utilizan BEST-RQ. Aseguran que ha demostrado grandes resultados y ser eficiente cuando se usan cantidades muy abundantes de datos de audio no supervisados.

En el segundo paso del proceso, se utiliza un enfoque de entrenamiento supervisado previo con múltiples objetivos para incorporar conocimientos adicionales de datos de texto. Este modelo incluye un módulo codificador adicional que toma texto como entrada y capas adicionales para combinar la salida de la codificación de voz y texto. El modelo se entrena en datos de voz sin etiquetar, voz etiquetada y texto.

En la última etapa del proceso, el modelo USM se ajusta a las tareas posteriores. El proceso general de entrenamiento se puede ilustrar de manera sencilla. Gracias al conocimiento adquirido durante el entrenamiento previo, los modelos USM logran una alta calidad con solo una pequeña cantidad de datos supervisados en las tareas posteriores.

Google USM
Línea de formación general de USM de Google

Si quieres saber más sobre el comunicado, haz clic aquí.

Comentarios

Entradas populares de este blog

La semana de los Trolls

Por  "laaprendiz " (Bolg propio)     Un troll es la peor pesadilla de un community manager. Si no sabes gestionarlo, te puede arruinar tu reputación profesional y la de la marca que gestionas. Por ese motivo, he decidido dedicar esta semana a esas criaturas que pueblan nuestros territorios y nos amenazan. Así pues, desenvainad las espadas, pulid vuestros yelmos y encomendaros a vuestros dioses.  ¡Bienvenidos a la semana de los trolls! Aspecto de un troll Un troll no debe confundirse, en un primer momento, con un usuario enfadado o molesto con la marca que gestionamos. La principal característica de un troll es que nunca será aplacado con una respuesta satisfactoria en forma de disculpa o solución a un problema . ¡Para nada! Sus principales características son: Provocador. Va a intentar por todos los medios provocar el enfrentamiento con el community manager o con otros usuarios a través de sus comentarios. Y ni que decir tiene que sus

Encuesta exclusiva: los 5 temas que más alimentan la "grieta" en Argentina

  Un estudio analizó la conversación en Twitter en los últimos cinco años. Sólo Brasil supera a nuestro país en polarización. Emilia Vexler, en "Clarín".- El concepto de "grieta" es aplicable a casi todo en Argentina. Hace tiempo que dejó de pertenecer al mundo de la política, ya es parte de la conversación social. Pero en las redes la polarización está en su ecosistema natural. Se mueve como quiere en el discurso público. Se repite. Se multiplica. En un estudio llamado The Hidden Drug (La droga oculta), realizado por la compañía de consultoría de comunicación y marketing digital LLYC, se identifican los temas más calientes y se hace foco en el poder adictivo de la polarización. El informe bucea en las redes sociales para explicar la evolución de este fenómeno en Argentina en los últimos cinco años, al igual que sucede en Brasil, Colombia, Chile, Ecuador, Estados Unidos, España, México, Panamá, Perú, Portugal y República Dominicana. La referencia es la conversación

Radiografía del consumo de medios de los jóvenes en Argentina

Publicado en "TotalMedios" “Los jóvenes, un público exigente”, es el título de la nueva investigación del departamento de research de Anunciar. Entre las conclusiones: son grandes consumidores de internet y televisión. Y utilizan de manera indistinta estos medios para entretenerse e informarse. El departamento de research de  Anunciar  desarrolló una investigación sobre el consumo de medios de los jóvenes en Argentina. Entre las conclusiones: son grandes consumidores de internet y televisión y utilizan de manera indistinta estos medios para entretenerse e informarse. El cuidado del medio ambiente y la equidad de género son temáticas instaladas en la sociedad y los jóvenes no son ajenos a ellos. Se diferencian en el interés por la vida social. Además tienen alta afinidad a las redes sociales y a los servicios de streaming como Netflix y Spotify. Los jóvenes acceden a diarios en busca de información. Los jóvenes son influenciados por la publicidad prin