Ir al contenido principal

El desafío de Google: el modelo de IA para 1000 idiomas está cada vez más cerca de ser una realidad




Cynthia Reina, en "Marketing Directo".-

Google está cada vez más cerca de conseguir su objetivo de crear un modelo de inteligencia artificial de 1000 idiomas para destronar a ChatGPT, anunciado en noviembre. La compañía está desarrollando todo tipo de IAs y con esta última, quieren construir un modelo que pueda comprender los 1000 idiomas más hablados del mundo.

Yu Zhang, científico investigador, y James Qin, ingeniero de software, Google Research aseguran en un comunicado que, Universal Speech Model (USM), como se llamará la IA, continúa avanzando.

Ambos describen USM como «una familia de modelos de voz de última generación» con 2 mil millones de parámetros entrenados en 12 millones de horas de voz y 28 mil millones de oraciones en más de 300 idiomas.

Además, aseguran que esta inteligencia artificial de Google ya se usa en YouTube (por ejemplo, para los subtítulos). «Puede realizar el reconocimiento de voz automático (ASR) no solo en los idiomas más hablados, como el inglés y el mandarín, sino también en idiomas de escasos recursos, como el amárico, el cebuano, el asamés, y azerbaiyanos, por nombrar algunos», informan.

De momento, USM admite más de 100 idiomas y sienta las bases para construir un sistema aún más grande.

Google analiza los desafíos del aprendizaje supervisado

La compañía asegura que debemos abordar dos desafíos importantes en el aprendizaje supervisado.

1. Obtener suficientes datos para entrenar modelos de alta calidad: requiere demasiado tiempo y dinero. Algunos idiomas son difíciles de encontrar. El aprendizaje autosupervisado puede aprovechar los datos de solo audio, que están disponibles en cantidades mucho mayores en todos los idiomas.

2. Los modelos deben mejorar de manera computacionalmente eficiente mientras amplían la cobertura y la calidad del idioma.

El enfoque de la compañía: aprendizaje autosupervisado con ajuste fino

Para el primer paso, utilizan BEST-RQ. Aseguran que ha demostrado grandes resultados y ser eficiente cuando se usan cantidades muy abundantes de datos de audio no supervisados.

En el segundo paso del proceso, se utiliza un enfoque de entrenamiento supervisado previo con múltiples objetivos para incorporar conocimientos adicionales de datos de texto. Este modelo incluye un módulo codificador adicional que toma texto como entrada y capas adicionales para combinar la salida de la codificación de voz y texto. El modelo se entrena en datos de voz sin etiquetar, voz etiquetada y texto.

En la última etapa del proceso, el modelo USM se ajusta a las tareas posteriores. El proceso general de entrenamiento se puede ilustrar de manera sencilla. Gracias al conocimiento adquirido durante el entrenamiento previo, los modelos USM logran una alta calidad con solo una pequeña cantidad de datos supervisados en las tareas posteriores.

Google USM
Línea de formación general de USM de Google

Si quieres saber más sobre el comunicado, haz clic aquí.

Comentarios

Entradas populares de este blog

Arranca la programación 2025 de LN+ con grandes regresos e incorporaciones

Publicado en "TotalMedios".- Este lunes, con una propuesta renovada, la señal de noticias de La Nación estrena su grilla: programas, figuras y horarios. Entre las figuras: Carlos Pagni, José Del Rio, Cristina Pérez, Joaquín Morales Solá, Luis Majul, Horacio Cabak y Juan Pablo Varsky, entre otros. “Estamos donde vos estás”. A partir de esta consigna, LN+ pondrá en marcha el lunes 3 de febrero una programación renovada que suma figuras de gran trayectoria y prestigio a una propuesta ya consolidada de programas, conductores y columnistas. Con estas incorporaciones se refuerza a lo largo de todo el día en la señal una identidad valorada desde hace mucho tiempo por el público y comprometida con el periodismo de calidad, la información precisa, el análisis más riguroso y el encuentro con los grandes protagonistas de la actualidad. Cristina Pérez, Pepe Gil Vidal, Juan Pablo Varsky, Joaquín Morales Solá y Maximiliano Montenegro son las caras nuevas que tendrá la pantalla de LN+ desde...

Más allá de los mitos: lo que la Generación Z quiere realmente del marketing digital

Publicado en "Marketing Digital".- Los  profesionales del marketing  tienden a definir a los miembros de  la  Generación Z   como «adictos» al scroll, que desean que todo el contenido sea corto y fácil de consumir, pero ese no es el caso de una generación realmente compleja. Las etiquetas no son nada nuevo para los «Gen Z», pero si hay una que destaca sobre todas las demás es la de nativos digitales. Como la primera generación que creció completamente inmersa en las posibilidades de la tecnología, los nacidos entre 1995 y 2009, han pasado más tiempo frente a las pantallas que otras generaciones, pero este hecho ha generado un mito: que la Generación Z prioriza la tecnología sobre las experiencias en el mundo real. Pero,  como recogen desde  Ad Age , es todo lo contrario. Los miembros de esta generación están desarrollando  un escepticismo creciente hacia la tecnología  y las redes sociales, lo que se manifiesta de diferentes formas: desde aba...

Sitios digitales: Infobae lideró en febrero de 2025, seguido por La Nación y TN

Publicado en "TotalMedios".- Se mantienen los tres primeros puestos en la categoría “News/Information” de Comscore. Clarín y Cronista completan el Top5. Por primera vez se mete un sitio de “nicho” como Meteored entre los diez primeros (generalistas). Hubo crecimientos de Los Andes, MinutoUno y Crónica. Infobae se mantuvo en febrero como el sitio de noticias más visitado de la Argentina, según los datos de Comscore, alcanzando los 15,4 millones de visitantes únicos. En el segundo lugar se ubicó La Nación con 13,9 millones, mientras que TN completó el podio con 12,6 millones. En total, la categoría de Comscore “News/Information” alcanzó los 33,5 millones de visitantes únicos, lo que representa una leve baja del -0,49% respecto a enero. La audiencia total de internet en Argentina se mantuvo estable, con 37,7 millones de usuarios. Entre los medios que registraron un crecimiento en su audiencia en comparación con enero, se destacaron Accuweather con una suba del 54,65%, Los Andes ...