Detrás del desarrollo de la inteligencia artificial, robots, celulares, asistentes de voz y más, hay un trabajo multidisciplinario. Seguramente las primeras disciplinas que se te vienen a la mente al hablar del desarrollo de esta tecnología son la robótica, mecatrónica, programación, por mencionar algunas. Sin embargo, qué hay de otras disciplinas como la psicología, la filosofía, y de la que hablaremos en este artículo; la lingüística.
Cuando interactúas con
algún dispositivo normalmente lo haces por voz o por texto, ¿cierto?, y la
facilidad con la que lo haces es gracias al desarrollo que se ha hecho en algo
que los lingüistas llamamos lingüística computacional.
Que entre otras muchas cosas es una herramienta fundamental en el desarrollo de la tecnología.
Lo que nos hace
especiales a los seres humanos
Todas las especies
animales tienen una manera de comunicarse, pero solo los seres humanos tenemos
algo que se llama el lenguaje natural.
Entre otras
características que lo hace único, nuestras lenguas (idiomas) están
formadas por 5 niveles:
La fonética: el
estudio del sonido.
La morfología: el
estudio de la estructura interna de las palabras.
La sintaxis: el
estudio de la relación palabra-frase.
La semántica: el
estudio del significado.
La pragmática: el
estudio de las expresiones lingüísticas y su relación con el mundo exterior.
Ninguna otra especie
posee en su lenguaje estas características, pero si hay algo que hoy en día se
le puede acercar.
El Procesamiento del Lenguaje Natural (NPL/PLN) o Lingüística Computacional como le llamamos los lingüistas, es la rama encargada de implementar estos niveles en las computadoras (por englobar a las máquinas o inteligencias que procesan nuestro lenguaje).
¿Qué hay de complejo
en el hablar?
Si bien las máquinas e
inteligencias artificiales “dominan” partes de los 5 niveles de un lenguaje
natural, aún sigue existiendo una gran brecha entre esto y un lenguaje
artificial.
Por cada nivel de los
mencionados arriba, el PLN puede enfrentar muchos retos en los que aún queda un
largo camino por recorrer. Y tal vez te preguntes, ¿qué tipo de problemas?
Pues para nosotros el
comunicarnos es tan necesario y natural como el respirar; pero justamente
en ello recae su complejidad.
¿Te ha pasado que le
pides a tu dispositivo que te busque alguna información y te entienda mil cosas
diferentes a lo que necesitas? A mí me ha pasado muchas veces, la
última fue cuando le pedí a mi Alexa que me buscara “casas
a la venta” y ella me respondió con lugares para comprar “gasas”;
nada que ver, ¿cierto?
Bueno, esto también
puede pasarnos a los humanos, pero lo que para mí dispositivo representa 5
fonemas (cuatro sonidos g.a.s.a.s).
Para cualquier persona representa 5 fonemas más una representación gráfica mental que nos permite diferenciar y corregir la información que escuchamos mal y deducir el mensaje correctamente.
Algunos problemas
Otro problema muy
común, es la diferenciación de fonemas de con diferentes realizaciones acústicas
de una misma lengua. Un asistente de voz podría diferenciar muy bien el sonido
estándar “ch” del español, pero resulta que para lo que un hablante de la
ciudad de Lima es “chancla” para un hablante de la selva podría ser “shancla”.
Parecería un problema
muy mínimo, pero esto es un solo fonema comparado en dos variantes del español
de Perú; pero si lo multiplicamos por la cantidad de países en las que se habla
el español y cuantas variedades hay en cada uno de ellos, el reto es realmente
abrumador.
Ahora, piensa en esto:
para una persona resulta fácil entender esta oración, “Vi a mi primo
caminando en el coche”, es obvio que quien iba en el coche fue quien vio a su
primo, más no que el primo iba caminando en el auto.
Sin embargo, para un lenguaje
artificial identificar estas ambigüedades resulta aún más complicado por más
frecuencias que se les enseñe a estos.
Además, esto sin contar que el léxico de una lengua está formado por un número infinito de palabras y de significados; por ejemplo, la palabra “gato” puede tener al menos tres significados distintos, y aunque parezca sencilla la solución de programar al lenguaje con un diccionario donde estén contenidas estos significados.
¿Dónde queda aquel
léxico que no está registrado en los corpus?
Podríamos seguir
enlistando un sinfín de problemas a los que se enfrenta esta área que es tan
crucial para el desarrollo de la Inteligencia Artificial, pero sin duda no
nos alcanzarían los artículos. Pero podemos despedirnos con una reflexión.
El conocimiento y el
lenguaje son entes vivos debido a que los seres humanos somos seres en
constante cambio y movimiento; nos adaptamos fácil a ello porque somos el
agente de estos cambios y los experimentamos en tiempo real.
Día con día aprendemos
de infinidad de información que se codifica en el lenguaje, ¿cómo hará la
inteligencia artificial para simular esto?
Seguramente quedan muchas dudas aún y a la vez los expertos en el tema trabajan para resolverlas, sin embargo, queda claro que la capacidad de abstracción humana del lenguaje es sumamente compleja y muy difícil de imitar.
(*) Oly Alcántara de la Cruz
No hay comentarios:
Publicar un comentario