Corpus Paralelo

El Corpus Paralelo ACTRES (P-ACTRES 2.0) es un corpus bidireccional compuesto por textos originales en inglés y sus traducciones al español, (el antiguo P-ACTRES 1.0), así como textos originales en español y sus traducciones al inglés. En estos momentos (diciembre 2013) contiene algo más de 4 millones de palabras entre las dos direcciones, distribuidas en los siguientes subcorpus:

Inglés Español Total
EN→ES
P-ACTRES 2.0 Total
ES→EN
Español Ingles
396.462 421.065 817.527 Libros – ficción
2.374.226
1.556.699 766.796 789.903
481.056 538.813 1.019.869 Libros – no ficción
1.048.142
28.273 15.068 13.205
115.502 137.202 252.704 Artículos de periódicos
252.704
169.840 174.314 344.154 Artículos de revistas
415.006
70.852 37.027 33.825
40.178 49.026 89.204 Miscelánea
89.204
2.523.458 palabras TOTAL Corpus
4.179.282 palabras
1.655.824 palabras
P-ACTRES EN→ES
Contiene algo más de 2,5 millones de palabras distribuidas en cinco sub-corpus o categorías distintos: libros de ficción, libros de no ficción, artículos de periódicos, artículos de revista y un último sub-corpus compuesto por una miscelánea de textos cuyo género no está definido. En los dos primeros sub-corpus se han incluido fragmentos de libros con una extensión media de 15,000 palabras, no libros enteros. En lo que respecta a los otros sub-corpus, sí se trata de artículos de periódicos –en concreto de opinión o editoriales- y de revistas enteros, dado que no son muy extensos de por sí. Lo mismo ocurre con el material que compone el sub-corpus de miscelánea.
P-ACTRES ES→EN

Contiene textos originales en español y su traducción al inglés y se encuentra en proceso de construcción de manera que su composición refleje la de P-ACTRES EN→ES. El repertorio de pares textuales español-inglés suma casi 1,7 millones de palabras, la mayoría de las cuales pertenecen al sub-corpus de libros de ficción.

P-ACTRES 2.0
Es una herramienta de investigación de gran utilidad para realizar estudios contrastivos y estudios descriptivos de traducción ya sea de forma independiente ya sea de forma conjunta. Dichos estudios se llevan a cabo fundamentalmente a nivel léxico-gramatical y retórico. En lo que respecta a la explotación del corpus, el buscador que se utiliza en P-ACTRES 2.0 es una modificación del Corpus Web Bench (CWB) realizada por Knut Hofland (Universidad de Bergen, Noruega) Para hacer posible las búsquedas en ambas, dicha versión del CWB ha sido a su vez modificada por Hugo Sanjurjo-González (ULE) en colaboración con Knut Hofland.
P-Annual-Accounts-EN-ES
Corpus paralelo especializado (de español a inglés) de informes anuales y manuales universitarios sobre marketing, macroeconomía, microeconomía y organización. Contiene aproximadamente 2.000.000 palabras en inglés y otras 2.000.000 en español. Proporciona material para estudios que comparan inglés original con inglés traducido a nivel terminológico, gramatical y textual.
P-Business-News-EN-ES
Corpus paralelo especializado (de inglés a español) de artículos de la revista The Economist traducidos y publicados en Actualidad Económica. Contiene 49.421 palabras en inglés y 32.334 palabras en español. Se utiliza en estudios contrastivos retóricos que comparan español original y español traducido.