Detrás del desarrollo de la inteligencia artificial, robots, celulares, asistentes de voz y más, hay un trabajo multidisciplinario. Seguramente las primeras disciplinas que se te vienen a la mente al hablar del desarrollo de esta tecnología son la robótica, mecatrónica, programación, por mencionar algunas. Sin embargo, qué hay de otras disciplinas como la psicología, la filosofía, y de la que hablaremos en este artículo; la lingüística.
Cuando
interactúas con algún dispositivo normalmente lo haces por voz o por texto,
¿cierto?, y la facilidad con la que lo haces es gracias al desarrollo que se ha
hecho en algo que los lingüistas llamamos lingüística computacional.
Que entre otras muchas cosas es una herramienta fundamental en el desarrollo de la tecnología.
Lo que nos
hace especiales a los seres humanos
Todas
las especies animales tienen una manera de comunicarse, pero solo los seres
humanos tenemos algo que se llama el lenguaje natural.
Entre
otras características que lo hace único, nuestras lenguas (idiomas) están
formadas por 5 niveles:
La
fonética: el estudio del sonido.
La
morfología: el estudio de la estructura interna de las palabras.
La
sintaxis: el estudio de la relación palabra-frase.
La
semántica: el estudio del significado.
La
pragmática: el estudio de las expresiones lingüísticas y su relación con
el mundo exterior.
Ninguna
otra especie posee en su lenguaje estas características, pero si hay algo que
hoy en día se le puede acercar.
El Procesamiento del Lenguaje Natural (NPL/PLN) o Lingüística Computacional como le llamamos los lingüistas, es la rama encargada de implementar estos niveles en las computadoras (por englobar a las máquinas o inteligencias que procesan nuestro lenguaje).
¿Qué hay de
complejo en el hablar?
Si
bien las máquinas e inteligencias artificiales “dominan” partes de los 5
niveles de un lenguaje natural, aún sigue existiendo una gran brecha entre esto
y un lenguaje artificial.
Por
cada nivel de los mencionados arriba, el PLN puede enfrentar muchos retos en
los que aún queda un largo camino por recorrer. Y tal vez te
preguntes, ¿qué tipo de problemas?
Pues
para nosotros el comunicarnos es tan necesario y natural como el respirar;
pero justamente en ello recae su complejidad.
¿Te ha
pasado que le pides a tu dispositivo que te busque alguna información y te
entienda mil cosas diferentes a lo que necesitas? A mí me ha pasado muchas
veces, la última fue cuando le pedí a mi Alexa que me
buscara “casas a la venta” y ella me respondió con lugares para
comprar “gasas”; nada que ver, ¿cierto?
Bueno,
esto también puede pasarnos a los humanos, pero lo que para mí dispositivo
representa 5 fonemas (cuatro sonidos g.a.s.a.s).
Para cualquier persona representa 5 fonemas más una representación gráfica mental que nos permite diferenciar y corregir la información que escuchamos mal y deducir el mensaje correctamente.
Algunos
problemas
Otro
problema muy común, es la diferenciación de fonemas de con diferentes
realizaciones acústicas de una misma lengua. Un asistente de voz podría
diferenciar muy bien el sonido estándar “ch” del español, pero resulta que para
lo que un hablante de la ciudad de Lima es “chancla” para un hablante de la
selva podría ser “shancla”.
Parecería
un problema muy mínimo, pero esto es un solo fonema comparado en dos variantes
del español de Perú; pero si lo multiplicamos por la cantidad de países en las
que se habla el español y cuantas variedades hay en cada uno de ellos, el reto
es realmente abrumador.
Ahora,
piensa en esto: para una persona resulta fácil entender esta oración, “Vi
a mi primo caminando en el coche”, es obvio que quien iba en el coche fue quien
vio a su primo, más no que el primo iba caminando en el auto.
Sin
embargo, para un lenguaje artificial identificar estas ambigüedades resulta aún
más complicado por más frecuencias que se les enseñe a estos.
Además, esto sin contar que el léxico de una lengua está formado por un número infinito de palabras y de significados; por ejemplo, la palabra “gato” puede tener al menos tres significados distintos, y aunque parezca sencilla la solución de programar al lenguaje con un diccionario donde estén contenidas estos significados.
¿Dónde queda
aquel léxico que no está registrado en los corpus?
Podríamos
seguir enlistando un sinfín de problemas a los que se enfrenta esta área que es
tan crucial para el desarrollo de la Inteligencia Artificial, pero sin
duda no nos alcanzarían los artículos. Pero podemos despedirnos con una
reflexión.
El
conocimiento y el lenguaje son entes vivos debido a que los seres
humanos somos seres en constante cambio y movimiento; nos adaptamos fácil
a ello porque somos el agente de estos cambios y los experimentamos en
tiempo real.
Día
con día aprendemos de infinidad de información que se codifica en el
lenguaje, ¿cómo hará la inteligencia artificial para simular esto?
Seguramente quedan muchas dudas aún y a la vez los expertos en el tema trabajan para resolverlas, sin embargo, queda claro que la capacidad de abstracción humana del lenguaje es sumamente compleja y muy difícil de imitar.
(*) Oly Alcántara de la Cruz
No hay comentarios:
Publicar un comentario