Ir al contenido principal

El desafío de Google: el modelo de IA para 1000 idiomas está cada vez más cerca de ser una realidad




Cynthia Reina, en "Marketing Directo".-

Google está cada vez más cerca de conseguir su objetivo de crear un modelo de inteligencia artificial de 1000 idiomas para destronar a ChatGPT, anunciado en noviembre. La compañía está desarrollando todo tipo de IAs y con esta última, quieren construir un modelo que pueda comprender los 1000 idiomas más hablados del mundo.

Yu Zhang, científico investigador, y James Qin, ingeniero de software, Google Research aseguran en un comunicado que, Universal Speech Model (USM), como se llamará la IA, continúa avanzando.

Ambos describen USM como «una familia de modelos de voz de última generación» con 2 mil millones de parámetros entrenados en 12 millones de horas de voz y 28 mil millones de oraciones en más de 300 idiomas.

Además, aseguran que esta inteligencia artificial de Google ya se usa en YouTube (por ejemplo, para los subtítulos). «Puede realizar el reconocimiento de voz automático (ASR) no solo en los idiomas más hablados, como el inglés y el mandarín, sino también en idiomas de escasos recursos, como el amárico, el cebuano, el asamés, y azerbaiyanos, por nombrar algunos», informan.

De momento, USM admite más de 100 idiomas y sienta las bases para construir un sistema aún más grande.

Google analiza los desafíos del aprendizaje supervisado

La compañía asegura que debemos abordar dos desafíos importantes en el aprendizaje supervisado.

1. Obtener suficientes datos para entrenar modelos de alta calidad: requiere demasiado tiempo y dinero. Algunos idiomas son difíciles de encontrar. El aprendizaje autosupervisado puede aprovechar los datos de solo audio, que están disponibles en cantidades mucho mayores en todos los idiomas.

2. Los modelos deben mejorar de manera computacionalmente eficiente mientras amplían la cobertura y la calidad del idioma.

El enfoque de la compañía: aprendizaje autosupervisado con ajuste fino

Para el primer paso, utilizan BEST-RQ. Aseguran que ha demostrado grandes resultados y ser eficiente cuando se usan cantidades muy abundantes de datos de audio no supervisados.

En el segundo paso del proceso, se utiliza un enfoque de entrenamiento supervisado previo con múltiples objetivos para incorporar conocimientos adicionales de datos de texto. Este modelo incluye un módulo codificador adicional que toma texto como entrada y capas adicionales para combinar la salida de la codificación de voz y texto. El modelo se entrena en datos de voz sin etiquetar, voz etiquetada y texto.

En la última etapa del proceso, el modelo USM se ajusta a las tareas posteriores. El proceso general de entrenamiento se puede ilustrar de manera sencilla. Gracias al conocimiento adquirido durante el entrenamiento previo, los modelos USM logran una alta calidad con solo una pequeña cantidad de datos supervisados en las tareas posteriores.

Google USM
Línea de formación general de USM de Google

Si quieres saber más sobre el comunicado, haz clic aquí.

Comentarios

Entradas populares de este blog

La semana de los Trolls

Por  "laaprendiz " (Bolg propio)     Un troll es la peor pesadilla de un community manager. Si no sabes gestionarlo, te puede arruinar tu reputación profesional y la de la marca que gestionas. Por ese motivo, he decidido dedicar esta semana a esas criaturas que pueblan nuestros territorios y nos amenazan. Así pues, desenvainad las espadas, pulid vuestros yelmos y encomendaros a vuestros dioses.  ¡Bienvenidos a la semana de los trolls! Aspecto de un troll Un troll no debe confundirse, en un primer momento, con un usuario enfadado o molesto con la marca que gestionamos. La principal característica de un troll es que nunca será aplacado con una respuesta satisfactoria en forma de disculpa o solución a un problema . ¡Para nada! Sus principales características son: Provocador. Va a intentar por todos los medios provocar el enfrentamiento con el community manager o con otros usuarios a través de sus comentarios. Y ni que decir tiene que sus

Más allá de los mitos: lo que la Generación Z quiere realmente del marketing digital

Publicado en "Marketing Digital".- Los  profesionales del marketing  tienden a definir a los miembros de  la  Generación Z   como «adictos» al scroll, que desean que todo el contenido sea corto y fácil de consumir, pero ese no es el caso de una generación realmente compleja. Las etiquetas no son nada nuevo para los «Gen Z», pero si hay una que destaca sobre todas las demás es la de nativos digitales. Como la primera generación que creció completamente inmersa en las posibilidades de la tecnología, los nacidos entre 1995 y 2009, han pasado más tiempo frente a las pantallas que otras generaciones, pero este hecho ha generado un mito: que la Generación Z prioriza la tecnología sobre las experiencias en el mundo real. Pero,  como recogen desde  Ad Age , es todo lo contrario. Los miembros de esta generación están desarrollando  un escepticismo creciente hacia la tecnología  y las redes sociales, lo que se manifiesta de diferentes formas: desde abandonar sus dispositivos móviles a

Jóvenes de Latinoamérica compartieron sus opiniones de la experiencia en línea de TikTok

Publicado en "TotalMedios".- Durante los meses de abril y mayo de 2024, TikTok y Chicos.net, una organización civil sin fines de lucro con sede en Buenos Aires que promueve los derechos de la juventud en entornos digitales, unieron esfuerzos para abrir espacios de discusión y diálogo con los adolescentes de Latinoamérica. Este espacio permitió escuchar sus recomendaciones, preocupaciones y nuevas ideas sobre temas como la seguridad juvenil, el bienestar y la salud mental con el objetivo de mejorar la plataforma, así como la experiencia en línea. Esta iniciativa impulsada por TikTok tuvo como propósito promover la participación de los jóvenes y fomentar su rol como ciudadanos digitales. Se convocaron participantes provenientes de Argentina, Chile, Colombia, El Salvador, Honduras y Perú de entre 14 y 19 años usuarios de la plataforma y a adolescentes que forman parte de organizaciones juveniles. Por medio de cinco sesiones dinámicas y a través de videos, frases y ejemplos, TikT