CLANES

CLANES es un corpus comparable formado por casi siete sub-corpus relacionados con la comida y la bebida. Considerando ambos lenguajes, contiene aproximadamente 1.5 millones de palabras y está anotado gramatical y semánticamente. La anotación pragmática está en estado de pruebas y su desarrollo habrá finalizado dentro de poco. CLANES está siendo utilizado para diseñar materiales de soporte para autorías y como base para el CLANES drafter-type CNL. Esta tabla muestra la composición del corpus:

NameNumber of words (EN)Number of words (ES)Contents
BiTeX: Culinary recipes307,161275,115https://actres.unileon.es/web/es/corpus0_BiTeXcook.html
C-FITECVI: Wine technical sheets and C- FIVI: Wine tasting notes124,446220,061https://actres.unileon.es/web/es/corpus0_C-FITECVI.html

https://actres.unileon.es/web/es/corpus0_FIVI.html
C-GDQ: Cheese descriptions135,213145,254https://actres.unileon.es/web/es/corpus0_C-GDQ.html
ACTEaS_Promo: Promotional texts for herbal teas130,046125,218https://actres.unileon.es/web/es/corpus0_ACTEaS_Promo.html
C-GEFEM: Sausages and cured meats97,07850,181https://actres.unileon.es/web/es/corpus0_C-GEFEM.html
C-BakedGoods: Bakery and pastry descriptions111,14399,511https://actres.unileon.es/web/es/corpus0_C-BakedGoods.html
TOTAL905,087915,340

OTROS CORPUS COMPARABLES

NameNumber of words (EN)Number of words (ES)Contents
C-GDPE: Electronic products32,51946,878https://actres.unileon.es/web/es/corpus0_ElectronicProducts.html
C-GITEC: Technical reports28,84454,940https://actres.unileon.es/web/es/corpus0_GITEC.html
C-GIT: Appliance instruction manuals174,134206,669https://actres.unileon.es/web/es/corpus0_GIT.html
C-GARE: Meeting minutes 139,919174,347https://actres.unileon.es/web/es/corpus0_GARE.html
C-AuRs: Audit reports 90,105117,082Unavailable on confidentiality grounds.
C-FMR: Football match reports 30,98630,153https://actres.unileon.es/web/es/corpus0_FMR.html
C-OPRES: opinion articles1,007,4141,007,384https://actres.unileon.es/web/es/corpus0_OPRES.html
C-GAC: biomedical abstracts15,11314,484https://actres.unileon.es/web/es/corpus0_BioABSTRACTS_C-ACTRES.html
C-CT: Clinical trials 80,80889,129https://actres.unileon.es/web/es/corpus0_CT.html