Sunday 20 June 2010

alia tekstaro


Dankon al Edmund Grimley Evans pro tio, ke li atentigis pri alia Esperanto-tekstaro (korpuso), kiun mi antaŭe ne konis. Temas pri corpus-eye, serĉebla tekstaro plurlingva. La tekstlingvoj estas la dana, la angla, la franca, la germana, la itala, la norvega, la portugala, la hispana, Esperanto, la rumana, kaj la sveda, plus eksperimente la islanda kaj la feroa.

Kompare kun la pure esperanta tekstaro.com, ĝi proponas pli da materialo (ĉ 24 milionoj da vortoj, kompare kun la preskaŭ 5 milionoj de tekstaro.com). Sed ĝia fasado estas en la angla, por la trovoj ĝi ne donas informon pri la aŭtoro kaj verko, kaj ĝi ŝajne ne havas la kapablon ignori gramatikajn finaĵojn k.s. Cetere ĝiaj rezultoj (por juĝi laŭ mia ankoraŭ tre limigita esplorado) ofte ripetas la saman citaĵon plurajn fojojn.

Ĝi ne akceptas supersignitajn literojn en la serĉesprimo, nur x-surogatojn. (Do ekzemple oni serĉu ne “ĝuebla” sed “gxuebla”.)

Ĉu iu leganto pli detale esploris tiun riĉfonton?

No comments:

Post a Comment