Gana proyecto de científicos del INAOE concurso en España

El Laboratorio de Lingüística Forense de la Universidad Pompeu Fabra de Barcelona, España, otorgó un premio al equipo de científicos del Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE), por un proyecto de inteligencia artificial para determinar el perfil de los usuarios de una red social.

María Guadalupe Rivera Loy, Jefa del Departamento de Difusión Científica del INAOE, dio a conocer que el premio se dio en el marco de la CLEF 2013 (Conference and Labs of the Evaluation Forum) que se realizó en Valencia hace algunas semanas.

Los galardonados fueron los doctores Manuel Montes, Luis Villaseñor y Hugo Escalante, investigadores del Instituto Nacional de Astrofísica, Óptica y Electrónica, y por Adrián Pastor López Monroy, estudiante de doctorado del INAOE.

En breve entrevista, el doctor Manuel Montes y Gómez comentó que este Laboratorio, fundado en 2002, se dedica a la investigación y al desarrollo de métodos que manipulen el lenguaje humano en su forma escrita y oral para distintas aplicaciones como sistemas de resúmenes automáticos y de búsqueda de información, y aplicaciones forenses.

Agregó que entre 2004 y 2008 el Laboratorio trabajó arduamente en el desarrollo de sistemas de información que dan respuesta a preguntas muy puntuales de los usuarios, distinto a lo que hace Google, y desde hace tres años sus miembros se han dedicado a resolver problemas de clasificación no temática.

"La idea -aclaró el investigador de la Coordinación de Ciencias Computacionales del INAOE- es clasificar documentos no por su tema, sino por su estilo. Con esto podemos saber el sexo del autor o podemos construir los perfiles de los usuarios de una red social", señaló.

"Un trabajo que hicimos hace un año en colaboración con la UAM fue la detección de acosadores sexuales en chats y nuestro sistema ganó en una competencia internacional porque arrojó los mejores resultados a la hora de detectar posibles pederastas en redes sociales", refirió el especialista.

Ahora, la idea es determinar a partir de lo que escribe una persona en la red su edad, sexo, nacionalidad, e incluso nivel de estudios, lo que es importante para detectar personas que pueden tener malas intenciones o incluso puede ayudar a las empresas para efectos de publicidad. También se puede utilizar para filtrar opiniones en el monitoreo de campañas políticas.

A su vez, Adrián Pastor López Monroy explicó que en el concurso que ganaron se les asignó una tarea que consistió en determinar, dado un conjunto de datos de usuarios, si son hombres o mujeres, y su rango de edad, que iba de los 10 a 17, los 20 y de 30 y mayores.

"Se hace procesamiento de texto, se limpian documentos y se extraen las características textuales que se pueden utilizar como atributos que después son reconocidos como patrones por un algoritmo de computación. Estas características son principalmente de estilo", dijo.

Como ejemplo, indicó que el uso de pronombres personales y preposiciones, la riqueza del vocabulario y la longitud, complejidad y construcción sintáctica de las oraciones delatan a las personas.

"Lo primero fue definir algunas características que podían ser útiles, y luego hacer métodos de cómo medirlas y después usamos algunos métodos probabilistas basados en el Teorema de Bayes, que calculaban un valor para decir de qué tipo era una persona. También detectamos el uso del lenguaje más nuevo, como el slang o los emoticones que usan los más jóvenes, como LOL", expuso.

Por su parte, Hugo Jair Escalante expresó que en esta competencia hay expertos en la temática de plagio y atribución de autoría, quienes formulan un problema, en este caso fue identificación de perfiles, y reúnen datos, lo cual se hizo con una empresa que se dedica realizar este tipo de cosas.

En este caso se inscribieron más de 60 equipos y sólo 20 completaron el reto. Los equipos finalistas escriben un artículo y lo presentan en la conferencia, donde se discuten los distintos métodos utilizados para resolver el problema planteado originalmente.

El premio otorgado por la Universidad Pompeu Fabra es en memoria de la Dra. M. Teresa Turell i Julia, fundadora y directora de su Laboratorio de Lingüística Forense.