O investigador Mario Barcala presentou na UDC o traballo, que enche un oco no campo dos corpus baseados nas novas tecnoloxías.
O investigador Mario Barcala presentou este venres na Universidade da Coruña a súa tese de doutoramento, na que investigou sobre o Corpus de Referencia do Galego Actual (CORGA) do Centro Ramón Piñeiro.
A tese, de Enxeñaría Informática, non se centra na lingüística, senón
que aproveitou a experiencia dese recurso para extrapolala e poder
aplicala noutros proxectos.
Segundo explicou Barcala, o
obxectivo é, por unha banda, "definir unha metodoloxía xenérica para
estruturar corpus. Partimos do CORGA para extrapolar esa metodoloxía a
outros proxectos". Unha segunda parte da tese trata da "análise das
tecnoloxías para buscadores lingüísticos".
O investigador
considera que a metodoloxía recollida na tese é moi importante, porque
"os últimos traballos deste tipo datan dos anos 70, con corpus baseados
en tecnoloxías obsoletas". O seu traballo adapta esas ideas "ás novas
tecnoloxías", usando como modelo o CORGA. "Hai moi poucos traballos que
traten este tema", afirma.
A outra aplicación da tese é que
propón "métodos de construción de sistemas de busca para estes corpus",
de gran tamaño: "analizar cal sería a mellor tecnoloxía" para atopar
información dentro deses corpus.
Barcala recalcou que o estudo
non é estritamente lingüístico, senón que pretende aproveitar a
ferramenta do Centro Ramón Piñeiro para desenvolver unha metodoloxía
que se poida aplicar noutros proxectos de consulta de corpus de
calquera campo. Até o momento había moi pouca información ao respecto.
Falades do dicionário Estravis, talvez?