tas en: home » corpus eslema

testu

pero non

en

autor títulu

fecha

ente   calendario  y   calendario

macroxéneru

canal




toes delles

acentos

non

tema


variedá xeográfica

variedá socioestilística







busca cenciella           ayuda

Un eslema ye una marca nuna piedra (...) indicando qu’había un tesoru, o qu’había lo que fuera.*conocer más



(nun relatu oral, apudJesús Suárez López, Tesoros, ayalgas y chalgueiros. La fiebre del oro en Asturias, Xixón [Muséu del Pueblu d’Asturies], 2000, páx. 184)


Un corpus de la llingua asturiana

El Proyectu Eslema mira a ellaborar un Corpus llingüísticu: una colección de testos orales y/o escritos d'una llingua, en soporte electrónicu que se manden como amuesa representativa pal so estudiu sistemáticu.

Propónse, con éses, un corpus modular que pueda dir construyéndose en distintes fases, siempres a espenses de les fontes de financiación o les posibilidaes organizatives, ensin renunciar por ello a la eficiencia y al algame de llogros más o menos inmediatos.

El nuesu compromisu

Eslema respe por dar esos primeros pasos estableciendo un corpus llingüísticu col que la llingua asturiana entre nel selectivu grupu de llingües en disposición de valise plenamente de les virtualidaes ufiertaes poles nueves tecnoloxíes.

Pente medies d'un corpus etiquetáu de más de 10.000.000 de palabres aspírase a un tratamientu informáticu básicu de los testos col envís d’algamar un sistema potente de cata d’información, disponible parcialmente en Internet dende 2006.

La tecnoloxía XML al algame del corpus

En casu del corpus principal, el marcaxe al traviés d’etiquetes XML va faese dende’l nivel léxicu (raíces léxiques, locuciones, perífrasis y frases), hasta el morfolóxicu (afixos y morfemes verbales y nominales) y gramatical (especificación de categoríes).

Con eses bases puede entamase la ellaboración d' aplicaciones informátiques empuestes tanto al ámbitu investigador como a la normalización llingüística, casu del Traductor.

Universidá d'Uviéu
© Copyright | Mapa web | W3C XHTML Validation | W3C CSS Validation | Creative Commons License