O secretario xeral de Política Lingüística asegurou que apostará pola presenza do galego nas novas tecnoloxías.
O Centro Ramón Piñeiro presentou esta quinta feira unha nova versión do Corpus de Referencia do Galego Actual (Corga),
unha base de datos representativa do uso do idioma que recompila textos
publicados a partir de 1975. A nova versión do Corga, a 1.4, inclúe xa
25 millóns de formas ortográficas, o que, segundo o director do
proxecto, Guillermo Rojo, "constitúe un enorme avance".
A
principal novidade, ademais da ampliación das fontes, é a incorporación
dun etiquetador-lematizador de galego, capaz de determinar, cunha taxa
de erro "aceptábel", a categoría gramatical e a forma das palabras dun
determinado texto, o que supón unha importante mellora con respecto ao
corpus anterior. Este etiquetador, denominado Xiada, pódese probar na páxina do Centro Ramón Piñeiro.
O corpus etiquetado,
tamén dispoñíbel na web, distingue case 260 mil formas gráficas e máis
de 300 mil elementos gramaticais. Está previsto que se libere a comezos
de setembro, o que resultará de interese para todas as persoas
estudosas da lingua. Xa se pode descargar, por exemplo, a listaxe
completa de frecuencias do Corga mediante unha licenza libre, a LGPL. As buscas son tamén libres, aínda que é preciso rexistrarse e obter un contrasinal.
Apoio ás novas tecnoloxías
No acto de presentación interviu o secretario xeral de Política Lingüística,
Anxo Lorenzo, que comezou a súa intervención saudando a súa antecesora
no cargo, Marisol López, que asistiu como espectadora. Lorenzo comparou
o labor do Centro Ramón Piñeiro cunha das prioridades do seu
departamento, que será "ofrecer produtos e servizos electrónicos en
lingua galega". Nesa liña, lembrou o seu apoio á asociación PuntoGal e a necesidade de que o galego debe ter unha "presenza destacada" no ámbito das novas tecnoloxías.