CLANES
CLANES es un corpus comparable formado por casi siete sub-corpus relacionados con la comida y la bebida. Considerando ambos lenguajes, contiene aproximadamente 1.5 millones de palabras y está anotado gramatical y semánticamente. La anotación pragmática está en estado de pruebas y su desarrollo habrá finalizado dentro de poco. CLANES está siendo utilizado para diseñar materiales de soporte para autorías y como base para el CLANES drafter-type CNL. Esta tabla muestra la composición del corpus:
Name | Number of words (EN) | Number of words (ES) | Contents |
---|---|---|---|
Word count | 704,451 | 712,334 | |
C- FIVI: Wine tasting notes | 52,413 | 54,408 | https://actres.unileon.es/web/es/corpus0_FIVI.html |
BiTeX: Culinary recipes | 227,294 | 251,218 | https://actres.unileon.es/web/es/corpus0_BiTeXcook.html |
C-FITECVI: Wine technical sheets | 118,846 | 118,760 | https://actres.unileon.es/web/es/corpus0_C-FITECVI.html |
C-GDQ: Cheese descriptions | 121,461 | 111,871 | https://actres.unileon.es/web/es/corpus0_C-GDQ.html |
ACTEaS_Promo: Promotional texts for herbal teas | 100,288 | 45,313 | https://actres.unileon.es/web/es/corpus0_ACTEaS_Promo.html |
C-GEFEM: Sausages and cured meats | 34,681 | 70,994 | https://actres.unileon.es/web/es/corpus0_C-GEFEM.html |
C-BakedGoods: Bakery and pastry descriptions | 49,468 | 59,770 | https://actres.unileon.es/web/es/corpus0_C-BakedGoods.html |
TOTAL | 1,416,785 |
OTROS CORPUS COMPARABLES
Name | Number of words (EN) | Number of words (ES) | Contents |
---|---|---|---|
C-GDPE: Electronic products | 32,519 | 46,878 | https://actres.unileon.es/web/es/corpus0_ElectronicProducts.html |
C-GITEC: Technical reports | 28,844 | 54,940 | https://actres.unileon.es/web/es/corpus0_GITEC.html |
C-GIT: Appliance instruction manuals | 174,134 | 206,669 | https://actres.unileon.es/web/es/corpus0_GIT.html |
C-GARE: Meeting minutes | 139,919 | 174,347 | https://actres.unileon.es/web/es/corpus0_GARE.html |
C-AuRs: Audit reports | 90,105 | 117,082 | Unavailable on confidentiality grounds. |
C-FMR: Football match reports | 30,986 | 30,153 | https://actres.unileon.es/web/es/corpus0_FMR.html |
C-OPRES: opinion articles | 1,007,414 | 1,007,384 | https://actres.unileon.es/web/es/corpus0_OPRES.html |
C-GAC: biomedical abstracts | 15,113 | 14,484 | https://actres.unileon.es/web/es/corpus0_BioABSTRACTS_C-ACTRES.html |
C-CT: Clinical trials | 80,808 | 89,129 | https://actres.unileon.es/web/es/corpus0_CT.html |