Ir al contenido principal

El desafío de Google: el modelo de IA para 1000 idiomas está cada vez más cerca de ser una realidad




Cynthia Reina, en "Marketing Directo".-

Google está cada vez más cerca de conseguir su objetivo de crear un modelo de inteligencia artificial de 1000 idiomas para destronar a ChatGPT, anunciado en noviembre. La compañía está desarrollando todo tipo de IAs y con esta última, quieren construir un modelo que pueda comprender los 1000 idiomas más hablados del mundo.

Yu Zhang, científico investigador, y James Qin, ingeniero de software, Google Research aseguran en un comunicado que, Universal Speech Model (USM), como se llamará la IA, continúa avanzando.

Ambos describen USM como «una familia de modelos de voz de última generación» con 2 mil millones de parámetros entrenados en 12 millones de horas de voz y 28 mil millones de oraciones en más de 300 idiomas.

Además, aseguran que esta inteligencia artificial de Google ya se usa en YouTube (por ejemplo, para los subtítulos). «Puede realizar el reconocimiento de voz automático (ASR) no solo en los idiomas más hablados, como el inglés y el mandarín, sino también en idiomas de escasos recursos, como el amárico, el cebuano, el asamés, y azerbaiyanos, por nombrar algunos», informan.

De momento, USM admite más de 100 idiomas y sienta las bases para construir un sistema aún más grande.

Google analiza los desafíos del aprendizaje supervisado

La compañía asegura que debemos abordar dos desafíos importantes en el aprendizaje supervisado.

1. Obtener suficientes datos para entrenar modelos de alta calidad: requiere demasiado tiempo y dinero. Algunos idiomas son difíciles de encontrar. El aprendizaje autosupervisado puede aprovechar los datos de solo audio, que están disponibles en cantidades mucho mayores en todos los idiomas.

2. Los modelos deben mejorar de manera computacionalmente eficiente mientras amplían la cobertura y la calidad del idioma.

El enfoque de la compañía: aprendizaje autosupervisado con ajuste fino

Para el primer paso, utilizan BEST-RQ. Aseguran que ha demostrado grandes resultados y ser eficiente cuando se usan cantidades muy abundantes de datos de audio no supervisados.

En el segundo paso del proceso, se utiliza un enfoque de entrenamiento supervisado previo con múltiples objetivos para incorporar conocimientos adicionales de datos de texto. Este modelo incluye un módulo codificador adicional que toma texto como entrada y capas adicionales para combinar la salida de la codificación de voz y texto. El modelo se entrena en datos de voz sin etiquetar, voz etiquetada y texto.

En la última etapa del proceso, el modelo USM se ajusta a las tareas posteriores. El proceso general de entrenamiento se puede ilustrar de manera sencilla. Gracias al conocimiento adquirido durante el entrenamiento previo, los modelos USM logran una alta calidad con solo una pequeña cantidad de datos supervisados en las tareas posteriores.

Google USM
Línea de formación general de USM de Google

Si quieres saber más sobre el comunicado, haz clic aquí.

Comentarios

Entradas populares de este blog

Sitios digitales: Infobae lideró en febrero de 2025, seguido por La Nación y TN

Publicado en "TotalMedios".- Se mantienen los tres primeros puestos en la categoría “News/Information” de Comscore. Clarín y Cronista completan el Top5. Por primera vez se mete un sitio de “nicho” como Meteored entre los diez primeros (generalistas). Hubo crecimientos de Los Andes, MinutoUno y Crónica. Infobae se mantuvo en febrero como el sitio de noticias más visitado de la Argentina, según los datos de Comscore, alcanzando los 15,4 millones de visitantes únicos. En el segundo lugar se ubicó La Nación con 13,9 millones, mientras que TN completó el podio con 12,6 millones. En total, la categoría de Comscore “News/Information” alcanzó los 33,5 millones de visitantes únicos, lo que representa una leve baja del -0,49% respecto a enero. La audiencia total de internet en Argentina se mantuvo estable, con 37,7 millones de usuarios. Entre los medios que registraron un crecimiento en su audiencia en comparación con enero, se destacaron Accuweather con una suba del 54,65%, Los Andes ...

Arranca la programación 2025 de LN+ con grandes regresos e incorporaciones

Publicado en "TotalMedios".- Este lunes, con una propuesta renovada, la señal de noticias de La Nación estrena su grilla: programas, figuras y horarios. Entre las figuras: Carlos Pagni, José Del Rio, Cristina Pérez, Joaquín Morales Solá, Luis Majul, Horacio Cabak y Juan Pablo Varsky, entre otros. “Estamos donde vos estás”. A partir de esta consigna, LN+ pondrá en marcha el lunes 3 de febrero una programación renovada que suma figuras de gran trayectoria y prestigio a una propuesta ya consolidada de programas, conductores y columnistas. Con estas incorporaciones se refuerza a lo largo de todo el día en la señal una identidad valorada desde hace mucho tiempo por el público y comprometida con el periodismo de calidad, la información precisa, el análisis más riguroso y el encuentro con los grandes protagonistas de la actualidad. Cristina Pérez, Pepe Gil Vidal, Juan Pablo Varsky, Joaquín Morales Solá y Maximiliano Montenegro son las caras nuevas que tendrá la pantalla de LN+ desde...

IP Noticias presenta su nueva programación y su innovación tecnológica

Publicado en "TotalMedios".- La señal de noticias IP presenta su nueva programación con grandes figuras que se suman a las ya conocidas del canal. El lanzamiento incluye inversión en tecnología y digitalización de los procesos. Los nuevos programas arrancan el próximo lunes. La señal de noticias IP presenta su nueva programación con grandes figuras que se suman a las ya conocidas del canal, en un lanzamiento completo que incluye inversión en tecnología y digitalización de los procesos. “IP es una señal de noticias que estamos lanzando con un esfuerzo muy grande. No le vamos a decir a nadie lo que tiene que pensar, vamos a informar absolutamente. Vamos a estar 24hs al aire con corresponsales en todas las provincias, en todos los ámbitos públicos, y en la calle. Siempre hay espacio para que el ciudadano, la población, el televidente pueda elegir donde informarse” dijo Alfredo Scoccimarro, Director General de IP. A partir del lunes 17 de febrero, toda la programación de IP estar...