Objetivo principal

El objetivo principal de este proyecto consiste en la investigación y desarrollo de T2KNOW, una plataforma avanzada de análisis de texto basada en tecnologías de Procesamiento de Lenguaje Natural (PLN), para la extracción y representación de perfiles semánticos de entidades digitales e identificación de tendencias de investigación a partir del análisis documentos científico-técnicos automatizados. 

Partiendo de este objetivo general, en el proyecto se plantean los siguientes objetivos específicos: 

  • Diseñar y desarrollar una arquitectura tecnológica flexible, escalable y robusta (Big Data) para la gestión y procesamiento de grandes volúmenes de datos no estructurados (texto) como base necesaria para la realización de análisis avanzados.
  • Investigar y desarrollar algoritmos avanzados de análisis avanzado de texto, con técnicas PLN, que permitan la extracción de conocimiento y la exploración semántica de contenidos para la detección de tendencias en la investigación. 
  • Desarrollar tecnologías de visualización de datos para descubrir y representar gráficamente la evolución de líneas de investigación, temas y tecnologías emergentes que permitan la identificación de tendencias en la investigación.
  • Diseñar y ejecutar una prueba piloto para validar las tecnologías desarrolladas en un ámbito clave como el sanitario, extendiendo su validación hacia otros sectores como el industrial (plástico) o el TIC, con la confección de corpus específicos de publicaciones científicas