Una nueva herramienta informática analiza el lenguaje usado por los usuarios de las redes sociales aplicando técnicas de análisis lingüístico computacional y permite determinar la edad y sexo del autor y detectar perfiles falsos, amenazas de seguridad o posibles casos de pederastia.

El programa ha sido desarrollado por investigadores de la Universitat Politècnica de Valencia (UPV) y la empresa Autoritas Consulting, y sus responsables defienden que también «es valiosa para que las empresas puedan conocer la dinámica y segmentación del mercado y enfocar así sus acciones de mercadotecnia».

Paolo Rosso, del Centro de Investigación Pattern Recognition and Human Language Technology de la UPV, afirma que la información sobre sexo y edad de los usuarios de las redes sociales «no siempre es accesible ni está explícita». Por ello, la herramienta desarrollada por los investigadores permite descifrar esta información, aplicando para ello técnicas de análisis lingüístico por ordenador. Para inferir la información deseada, el programa analiza el lenguaje utilizado por los usuarios de las redes, aplicando para ello la teoría de grafos y diferentes algoritmos. Analiza tiempos verbales empleados, categorías gramaticales más repetidas, estructura del discurso, tipología de expresiones utilizadas y el peso de las emociones. A partir de estos datos, es posible saber si detrás de un texto anónimo se encuentra un hombre o una mujer, y si es adolescente, joven o adulto. «Tenemos un texto, de ahí extraemos las categorías gramaticales y construimos un grafo. Este se enriquece con las emociones expresadas, la polaridad de las palabras, los tipos de verbo y sustantivos», explicó Paolo Rosso.

La herramienta, en la que los investigadores trabajan desde 2013, ya ha sido utilizada en casos de investigación policial de amenazas de bomba. Para detecta un perfil falso se pueden aplicar unos indicadores que te permiten inferir la edad del usuario.