Una nueva herramienta informática analiza el lenguaje usado por los usuarios de las redes sociales aplicando técnicas de análisis lingüístico computacional y permite determinar la edad y sexo del autor y detectar perfiles falsos, amenazas de seguridad o posibles casos de pederastia.

La herramienta, desarrollada por investigadores de la Universitat Politècnica de Valencia (UPV) y la empresa Autoritas Consulting, también es valiosa para que las empresas puedan conocer la dinámica y segmentación del mercado y enfocar así sus acciones de mercadotecnia.

Paolo Rosso, del Centro de Investigación Pattern Recognition and Human Language Technology de la UPV, afirma que la información sobre sexo y edad de los usuarios de las redes sociales "no siempre es accesible ni está explícita".

Por ello, la herramienta desarrollada por los investigadores permite descifrar esta información, aplicando para ello técnicas de análisis lingüistico por ordenador.

Para inferir la información deseada, la herramienta analiza el lenguaje utilizado por los usuarios de las redes, aplicando para ello la teoría de grafos y diferentes algoritmos.

Analiza tiempos verbales empleados, categorías gramaticales más repetidas, estructura del discurso, tipología de expresiones utilizadas y el peso de las emociones.

A partir de estos datos, es posible saber si detrás de un texto anónimo se encuentra un hombre o una mujer, y si es adolescente, joven o adulto

"Tenemos un texto, de ahí extraemos las categorías gramaticales y construimos un grafo. Este se enriquece con las emociones expresadas, la polaridad de las palabras, los tipos de verbo y los tipos de sustantivo", ha explicado Rosso.

Según el investigador, luego se aplica la teoría de grafos para calcular la importancia de cada categoría y, ante cada caso nuevo, utilizando un algoritmo de aprendizaje, se extrae su grafo y se da una predicción.

La herramienta, incluida dentro de la aplicación Cosmos de Autoritas y en la que los investigadores trabajan desde el año 2013, ya ha sido utilizada en casos de investigación policial de amenazas de bomba.

La policía vigila en las redes expresiones o "palabras disparadoras" como bomba o pistola, entre otras, aunque en ocasiones son utilizadas de modo coloquial y no suponen una amenaza real.

También se intenta detectar el idioma nativo del autor del mensaje en las redes sociales, ya que aunque lo escriba en inglés puede ser de cualquier nacionalidad.

En estos casos, según Francisco Rangel, director tecnológico de Autoritas Consulting, ha asegurado a EFE que en estos casos, "interesa hacer un seguimiento de esas cuentas, para ver de qué hablan, ver qué perfil tienen, porque la herramienta ayuda también a captar perfiles falsos".

Respecto al tiempo verbal que se usa en las redes sociales, Rangel ha explicado que mientras los jóvenes tienen tendencia a hablar en tiempo pasado, con recuerdos de los días anteriores, los más adultos "hablan más de proyectos de futuro".

En el campo de las emociones, las mujeres tienden a expresar más emociones negativas y a usar mas verbos relativos a la emoción que los hombres, que utilizan formas verbales más relacionadas con la comunicación.

Para detecta un perfil falso, aquella persona que se intenta pasar por lo que no es, se pueden aplicar unos indicadores que te permiten inferir que esa persona no es un adolescente, sino que ronda la treintena de años.

En estos casos, normalmente se utiliza el nombre un hombre, ya que es "raro que se haga pasar por una mujer", y las estructuras del lenguaje son "muy homogéneas, neutras, o en algunos casos muy extremas que no se corresponde con el perfil que está intentando dar".

El trabajo fue publicado el pasado mes de junio en la revista Information Processing & Management.