La empresa
gallega 3.14 Financial Contents está desarrollando una herramienta que facilite
la búsqueda y extracción de información bursátil de Internet, en colaboración
con el grupo COLE de investigación en inteligencia artificial de las universidades
de Vigo y A Coruña. Este proyecto cuenta además con el apoyo económico de
la Dirección Xeral de I+D de la Consellería de Innovación, Industria e Comercio.
El sector bursátil se trata
de un campo en el que la recogida de información y su análisis exigen gran
rapidez y habilidad. Si a esto añadimos que la información sobre el mercado
financiero es básicamente información numérica y, por lo tanto, fácilmente
procesable a través de herramientas informáticas, estamos ante el entorno
idóneo para la aplicación de sistemas automáticos de recuperación de información,
basados en la inteligencia artificial. Proyecto pionero
En este contexto, la empresa ferrolana 3.14 Financial Contents, especializada
en formación e información sobre mercados financieros, está desarrollando
un producto pionero que les proporcione a los inversores y analistas una
visión rápida y fiable sobre las empresas que cotizan. El proyecto consiste
en el desarrollo de un entorno de extracción de datos que, trabajando sobre
textos en lenguaje natural que contienen información bursátil y económica
de carácter general, permita medir la orientación del mercado en un momento
preciso. Aunque existen iniciativas
semejantes, como las de la Universidad de Durham y del Center for Intelligent
Information Retrieval, que fueron aprovechadas para este proyecto, la aplicación
desarrollada por 3.14 y el grupo COLE es totalmente novedosa. El sistema está preparado
para analizar todo tipo de textos electrónicos, desde periódicos especializados
hasta el comentario de una persona en un foro, para extraer la información
requerida. El usuario introduce una consulta del tipo "dime el PIB de Alemania
del año 1999'' o bien "¿cuál es el estado de opinión de Linux frente a Microsoft
al día de hoy?''. Manuel Míguez Porto, director del producto, apunta que
para responder a una pregunta de este tipo, una persona tendría que leer
toda la información que apareció desde el nacimiento de las dos empresas
e invertir mucho tiempo, sin embargo, con este motor de búsqueda, podría
disponer de esta información en pocos segundos. Para ello hay que realizar
varios análisis previos de la información económica: un análisis sintáctico,
lógico-filosófico, estadístico de la posición de las palabras dentro de cada
frase y, por último, léxico-semántico. Esta labor permite localizar términos
relevantes para el usuario. Víctor Darriba, miembro
del grupo de investigación en inteligencia artificial de la Universidad de
Vigo, explica cómo funciona esta herramienta: " Se introduce el documento
en sistema, éste elimina el formato html y se queda únicamente con el texto
en el que busca matrices de palabras que tenemos almacenados en base de datos.
A continuación, ponderamos la posición de las palabras entre ellas, su localización
dentro del texto y el sistema ordena eses términos mediante técnicas estadísticas.
Así se hace una primera clasificación general, después en una segunda fase
se procesa la información mediante técnicas de lenguaje y de esta forma obtenemos
una información mucho más precisa y rica en matices''. Utilidades
Una ventaja que ofrece este sistema es que permite comparar información
de distintos países y fechas e incluso mostrar esa información de diferentes
modos (gráfico, dato, etc). Además, guarda las sesiones en la memoria y detecta
posibles errores de escritura. La herramienta está pensada
para facilitar información sobre mercados financieros a aquellas personas
que no son profesionales y no saben mucho sobre el tema, así como para proporcionar
a analistas e inversores cierta información de una forma mucho más ágil.
Este producto podrá aplicarse a muchos otros campos, como aquellos ámbitos
en los que se maneja mucha información cuantitativa, que varíe constantemente
y en los que se precise leer mucha documentación. Este proyecto nació en 1999
y esperan que esté disponible en el 2005 en inglés y castellano. Ahora el
grupo de investigación COLE se encarga del procesamiento del lenguaje natural,
la recuperación estadística y el análisis lógico. |