La Curva de Aprendizaje, parte 5: Superar las diferencias multiculturales y multilingües
Samsung Research en Brasil es parte de una serie sobre las personas y las innovaciones detrás de la democratización de la IA móvil.
Mientras Samsung continúa siendo pionero en experiencias premium de IA móvil, visitamos los centros de investigación de Samsung en todo el mundo para conocer cómo Galaxy AI permite que más usuarios maximicen su potencial. Galaxy AI ahora admite 16 idiomas, por lo que más personas pueden ampliar sus capacidades lingüísticas, incluso sin conexión, gracias a la traducción en el dispositivo con funciones como Traducción simultánea, Interprete, Asistente de notas y Asistente de Navegación. Pero ¿qué implica realmente el desarrollo del lenguaje de la IA? La última vez visitamos China para conocer la importancia de asociarnos con otros líderes en IA. Esta vez, estamos en Brasil para explorar cómo trabajan los equipos a través de culturas y fronteras para llevar Galaxy AI a más personas.
Brasil, un país diverso con más de 203 millones de habitantes que encarna una amplia gama de culturas y tradiciones, utiliza el portugués brasileño como idioma oficial. Mientras tanto, 22 países vecinos utilizan el español latinoamericano.
Aunque el portugués brasileño y el español latinoamericano se hablan ampliamente, las intrincadas variaciones de ambos idiomas presentaron varios desafíos al enseñar a la Galaxy AI a discernir y distinguir las diferencias regionales. Es por eso que el Instituto de Investigación y Desarrollo de Samsung Brasil (SRBR) colaboró con expertos de Samsung de México, así como con aliados externos como los institutos de ciencia y tecnología SiDi y Sidia, para formar un equipo multidisciplinario y altamente capacitado que pudiera enfrentar esta tarea.
Menos barreras, más comprensión
El equipo utilizó miles de fuentes y una combinación de aprendizaje automático y lenguaje para mejorar el reconocimiento del habla, los textos escritos y las variaciones regionales del modelo de IA. Pero la jerga local y los nombres de figuras famosas (incluidos equipos deportivos, celebridades y bandas) varían mucho entre regiones. Además, el mismo significado puede expresarse con palabras diferentes. Si bien los modelos lingüísticos necesitan datos localizados para obtener una comprensión integral de los diferentes idiomas para traducir, tales variaciones inevitablemente presentan obstáculos.
Por ejemplo, piscina es “alberca” en México, pero es “pileta” en Argentina, Paraguay y Uruguay. Mientras tanto, en Colombia, Bolivia y Venezuela la piscina es “piscina”, así como también en Brasil, pero con una ligera diferencia tonal. Y mientras que los colombianos dicen «chévere» para referirse a algo interesante, los mexicanos dicen «padre».
Estas diferencias representan enormes desafíos para la comprensión y el aprendizaje del lenguaje de la IA, pero el equipo los superó construyendo modelos de lenguaje más amplios, perfeccionando las herramientas de procesamiento y colaborando a través de fronteras y zonas horarias.
«Tuvimos que considerar la jerga local y diferentes formas de hablar antes de adaptar y probar el modelo respectivo, lo que requirió una estrecha colaboración entre el equipo de control de calidad (QA) de SRBR y los equipos de desarrollo«, dice Mateus Pedroso, gerente senior y jefe del Laboratorio de Calidad de Software en SRBR. “Dado que SRBR está tres horas adelantado del equipo de control de calidad en México y 12 horas atrasado del equipo de gestión en Corea, tuvimos que crear nuevos canales y procesos de comunicación para alinear resultados y compartir progresos. Esta colaboración multicultural generó un festival de ideas y soluciones para la Galaxy AI”.
Comunicando el éxito
La filosofía de colaboración abierta de Samsung cobró vida durante este proyecto regional, ya que fue un proceso iterativo que aprovechó la evolución de la tecnología a escala global. Para superar las barreras lingüísticas y culturales, el equipo de SRBR necesitaba recopilar, gestionar y desarrollar cantidades masivas de datos, refinando y mejorando continuamente las fuentes de audio y texto.
Los equipos crearon áreas clave de responsabilidad para garantizar que todos pudieran beneficiarse de las habilidades colectivas en las oficinas latinoamericanas de la empresa. El equipo de desarrollo de SRBR actuó como parte intermediaria del proyecto, recibió instrucciones de la sede de Samsung y desarrolló nuevas actualizaciones para mejorar el modelo de IA mientras realizaba pruebas para varios tipos de uso.
«La fase de prueba requirió una amplia comunicación y colaboración con los equipos de control de calidad para optimizar la experiencia del usuario, y cada ajuste requirió pruebas y revisiones adicionales«, dice Leandro Flores de Moura, Gerente de Desarrollo de Software de SiDi. «El éxito de las capacidades lingüísticas de la Galaxy AI se basa tanto en la comunicación y la colaboración como en la experiencia técnica«, añade Nathan Castro, desarrollador de pruebas de control de calidad en SiDi.
Una hoja de ruta para la cultura
Lo que hace que Galaxy AI sea particularmente interesante para todos los involucrados es el hecho de que no se trataba simplemente de un proyecto de lenguaje. Para ellos, el idioma es una guía cultural que proporciona información valiosa sobre la herencia y la identidad de las personas.
«Para el equipo de control de calidad de SiDi, este fue un esfuerzo que cambiará el mundo al permitir que las culturas se unan y superen la dificultad de comunicarse en diferentes idiomas«, agrega Estefanía Castro Suárez, desarrolladora de pruebas de SiDi. “Saber que fuimos parte de esto nos llena de orgullo y motivación”.
“La forma en que colaboró el equipo de SRBR ejemplifica lo que Galaxy AI se propone lograr: hacer del mundo un lugar más cercano mediante la comunicación, el intercambio y la interacción con personas, incluso con aquellas que hablan diferentes idiomas”, concluye Pedroso. «Esta capacidad solo crecerá a medida que se incorporen más idiomas a Galaxy AI».
En el próximo episodio de La Curva de Aprendizaje, nos dirigiremos a la India para conocer cómo Galaxy AI permite que más usuarios maximicen su potencial.