martes, 27 de julio de 2021

LA LINGÜÍSTICA, CIENCIA INDISPENSABLE PARA EL DESARROLLO TECNOLÓGICO

Detrás del desarrollo de la inteligencia artificial, robots, celulares, asistentes de voz y más, hay un trabajo multidisciplinario. Seguramente las primeras disciplinas que se te vienen a la mente al hablar del desarrollo de esta tecnología son la robótica, mecatrónica, programación, por mencionar algunas. Sin embargo, qué hay de otras disciplinas como la psicología, la filosofía, y de la que hablaremos en este artículo; la lingüística.

Cuando interactúas con algún dispositivo normalmente lo haces por voz o por texto, ¿cierto?, y la facilidad con la que lo haces es gracias al desarrollo que se ha hecho en algo que los lingüistas llamamos lingüística computacional.

Que entre otras muchas cosas es una herramienta fundamental en el desarrollo de la tecnología.

Lo que nos hace especiales a los seres humanos 

Todas las especies animales tienen una manera de comunicarse, pero solo los seres humanos tenemos algo que se llama el lenguaje natural.

Entre otras características que lo hace único, nuestras lenguas (idiomas) están formadas por 5 niveles:

La fonética: el estudio del sonido.

La morfología: el estudio de la estructura interna de las palabras.

La sintaxis: el estudio de la relación palabra-frase.

La semántica: el estudio del significado.

La pragmática: el estudio de las expresiones lingüísticas y su relación con el mundo exterior.

Ninguna otra especie posee en su lenguaje estas características, pero si hay algo que hoy en día se le puede acercar.

El Procesamiento del Lenguaje Natural (NPL/PLN) o Lingüística Computacional como le llamamos los lingüistas, es la rama encargada de implementar estos niveles en las computadoras (por englobar a las máquinas o inteligencias que procesan nuestro lenguaje).

¿Qué hay de complejo en el hablar?

Si bien las máquinas e inteligencias artificiales “dominan” partes de los 5 niveles de un lenguaje natural, aún sigue existiendo una gran brecha entre esto y un lenguaje artificial.

Por cada nivel de los mencionados arriba, el PLN puede enfrentar muchos retos en los que aún queda un largo camino por recorrer. Y tal vez te preguntes, ¿qué tipo de problemas?

Pues para nosotros el comunicarnos es tan necesario y natural como el respirar; pero justamente en ello recae su complejidad. 

¿Te ha pasado que le pides a tu dispositivo que te busque alguna información y te entienda mil cosas diferentes a lo que necesitas? A mí me ha pasado muchas veces, la última fue cuando le pedí a mi Alexa que me buscara “casas a la venta” y ella me respondió con lugares para comprar “gasas”; nada que ver, ¿cierto?

Bueno, esto también puede pasarnos a los humanos, pero lo que para mí dispositivo representa 5 fonemas (cuatro sonidos g.a.s.a.s).

Para cualquier persona representa 5 fonemas más una representación gráfica mental que nos permite diferenciar y corregir la información que escuchamos mal y deducir el mensaje correctamente.

Algunos problemas

Otro problema muy común, es la diferenciación de fonemas de con diferentes realizaciones acústicas de una misma lengua. Un asistente de voz podría diferenciar muy bien el sonido estándar “ch” del español, pero resulta que para lo que un hablante de la ciudad de Lima es “chancla” para un hablante de la selva podría ser “shancla”.

Parecería un problema muy mínimo, pero esto es un solo fonema comparado en dos variantes del español de Perú; pero si lo multiplicamos por la cantidad de países en las que se habla el español y cuantas variedades hay en cada uno de ellos, el reto es realmente abrumador. 

Ahora, piensa en esto: para una persona resulta fácil entender esta oración, “Vi a mi primo caminando en el coche”, es obvio que quien iba en el coche fue quien vio a su primo, más no que el primo iba caminando en el auto.

Sin embargo, para un lenguaje artificial identificar estas ambigüedades resulta aún más complicado por más frecuencias que se les enseñe a estos.

Además, esto sin contar que el léxico de una lengua está formado por un número infinito de palabras y de significados; por ejemplo, la palabra “gato” puede tener al menos tres significados distintos, y aunque parezca sencilla la solución de programar al lenguaje con un diccionario donde estén contenidas estos significados.

¿Dónde queda aquel léxico que no está registrado en los corpus? 

Podríamos seguir enlistando un sinfín de problemas a los que se enfrenta esta área que es tan crucial para el desarrollo de la Inteligencia Artificial, pero sin duda no nos alcanzarían los artículos. Pero podemos despedirnos con una reflexión.

El conocimiento y el lenguaje son entes vivos debido a que los seres humanos somos seres en constante cambio y movimiento; nos adaptamos fácil a ello porque somos el agente de estos cambios y los experimentamos en tiempo real.

Día con día aprendemos de infinidad de información que se codifica en el lenguaje, ¿cómo hará la inteligencia artificial para simular esto?

Seguramente quedan muchas dudas aún y a la vez los expertos en el tema trabajan para resolverlas, sin embargo, queda claro que la capacidad de abstracción humana del lenguaje es sumamente compleja y muy difícil de imitar

(*) Oly Alcántara de la Cruz

No hay comentarios:

Publicar un comentario