(nun relatu oral, apudJesús Suárez López, Tesoros, ayalgas y chalgueiros. La fiebre del oro en Asturias, Xixón [Muséu del Pueblu d’Asturies], 2000, páx. 184)
El Proyectu Eslema mira a ellaborar un Corpus llingüísticu: una colección de testos orales y/o escritos d'una llingua, en soporte electrónicu que se manden como amuesa representativa pal so estudiu sistemáticu.
Propónse, con éses, un corpus modular que pueda dir construyéndose en distintes fases, siempres a espenses de les fontes de financiación o les posibilidaes organizatives, ensin renunciar por ello a la eficiencia y al algame de llogros más o menos inmediatos.
Eslema respe por dar esos primeros pasos estableciendo un corpus llingüísticu col que la llingua asturiana entre nel selectivu grupu de llingües en disposición de valise plenamente de les virtualidaes ufiertaes poles nueves tecnoloxíes.
Pente medies d'un corpus etiquetáu de más de 10.000.000 de palabres aspírase a un tratamientu informáticu básicu de los testos col envís d’algamar un sistema potente de cata d’información, disponible parcialmente en Internet dende 2006.
En casu del corpus principal, el marcaxe al traviés d’etiquetes XML va faese dende’l nivel léxicu (raíces léxiques, locuciones, perífrasis y frases), hasta el morfolóxicu (afixos y morfemes verbales y nominales) y gramatical (especificación de categoríes).
Con eses bases puede entamase la ellaboración d' aplicaciones informátiques empuestes tanto al ámbitu investigador como a la normalización llingüística, casu del Traductor.