Concepto

Corpus es un término de origen latino (‘cuerpo’); el plural suele expresarse con la misma forma. En las ciencias del lenguaje, corpus designa un cuerpo o conjunto organizado de textos que se utiliza tanto para la investigación lingüística y literaria como para la enseñanza específica de la lengua (primera o segunda) y de la literatura. Pero además de nombrar el material, corpus indica la metodología de trabajo. Efectivamente, en un sentido general, un corpus es un conjunto de como mínimo dos textos reunidos por el especialista, con criterios metodológicos a partir de algunas características que esos textos presenten compartidas y en función de los objetivos de la investigación o de los objetivos didácticos que hayan sido establecidos previamente.

Debido a esta amplitud en el uso del término, se hace necesario tener en cuenta la tarea y el marco disciplinar en los que se emplea, para poder precisar el concepto en relación con los distintos objetos de trabajo.

En el campo de los estudios lingüísticos, hay una larga tradición en investigación sobre la base de la confección y el análisis del corpus, pero desde la entrada del ordenador como herramienta clave en su tratamiento se ha pasado a una nueva etapa; actualmente se discute si la llamada lingüística de corpus (LC) consiste en una metodología o se ha vuelto ya una línea teórica específica.

En el campo de los estudios literarios, el corpus se vincula con dos aspectos simultáneamente: el específicamente crítico, que atañe a aquello que se pretende estudiar, y el profesional, que corresponde a cuáles son los tipos de corpus que la Academia legitima o no en distintos momentos y circuitos; en este último sentido, corpus se solapa en alguna medida con canon.

Análisis

Lingüística de corpus

Actualmente se debate sobre si la denominada LC es una teoría o una metodología. Ya sea en favor de una u otra postura, los especialistas coinciden en que la LC supone un aporte fundamental para el estudio de las lenguas en lo que respecta al enfoque empírico, puesto que plantea el trabajo sobre colecciones extensas de textos naturales y permite focalizar datos observables a modo de evidencia científica. En efecto, provee posibilidades tanto para el análisis como para la enseñanza de distintos tipos de discursos, ya que ofrece una base para la elaboración de gramáticas, diccionarios y materiales didácticos (Parodi, 2007). En la LC se trabaja, generalmente, con progra- mas computacionales; los criterios y procedimientos para la confección de un corpus son muy rigurosos y es esto lo que lo hace confiable respecto de la validez de sus resultados. En este campo se investiga sobre patrones de uso lingüístico en los textos; por ejemplo, los que atañen a comportamientos diferentes de estructuras similares en distintos contextos. Uno de los principios básicos de la LC es que los textos constituyen el medio primario de creación y transmisión de significado; no obstante, se destaca la diferencia entre considerar los textos de manera independiente o en su interrelación y confrontación a través de la metodología del corpus. Giovanni Parodi aclara: «un corpus busca entregar datos acerca de la lengua en una proyección mayor que la que busca un texto como instancia de habla» (Parodi, 2008).En consonancia con su concepción de la LC como una suma de principios metodológicos, Parodi define corpus como «conjunto amplio de textos digitales de naturaleza específica y que cuenta con una organización predeterminada en torno a categorías identificables para la descripción y análisis de una variedad de lengua», y agrega que un corpus «debe mostrar, de preferencia, accesibilidad desde entornos computacionales y visibilidad de modo que se posibilite su uso en diversas investigaciones con el fin de asegurar acumulación de conocimientos e integración de la investigación de una lengua particular o en comparación con otra» (Parodi, 2008). Por otra parte, en varios trabajos sobre descripción y comparación de géneros propios del discurso académico atentos a diseñar tipologías con fundamento lingüístico, se apela a esta metodología y se digitalizan los textos para su tratamiento automatizado. Así, por ejemplo, Inés Kuguel indica la digitalización del corpus que ha conformado con objeto de analizarlo mediante el TACT (Sistema de Tratamiento Automatizado de Corpus Textuales), programa de análisis de textos asistido por computadora. Este programa fue desarrollado por la Universidad de Toronto y permite relevar frecuencias y concordancias de textos digitalizados y codificados previamente (Kuguel, 2009).

Literatura

Teniendo en cuenta los posibles críticos, Miguel Dalmaroni distingue algunos tipos de corpus literarios.

• El posible filosófico compone en un corpus construido algo que no está dado antes de la misma intervención crítica; aquí, la historicidad del corpus se reduce al sentido que le otorga desde su presente la operación del crítico. Dalmaroni lo ejemplifica con El cuerpo del delito. Un manual (1999), de Josefina Ludmer.

• El posible histórico, en cambio, indaga qué habría sucedido en un determinado momento en la historia de la literatura y se interroga sobre los sentidos que tendría para el presente aquello que sucedió. Con respecto a este posible, Dalmaroni reconoce distintos niveles de historicidad en distintos corpus: la historicidad que corresponde a la categoría autor aglutinante de los textos reconocidos bajo una firma como corpus de autor; la historicidad del corpus de época, propia de una periodización preestablecida (literatura criollista argentina, por ejemplo) y la historicidad del corpus histórico emergente. Este último es, explica Dalmaroni, aquel que descubre en las temporalidades superpuestas de un texto literario o de un conjunto de ellos la presencia de lo que Raymond Williams denomina, en Marxism and Literature (1977), una «estructura del sentir». Esta configuración anuncia o indica un pasaje, un cambio, un punto de inflexión que explica un estado de cosas en relación con lo que vendrá, por la presencia textual de lo que Williams denomina elementos emergentes. Dalmaroni ejemplifica con un corpus que él mismo descubre: el caso «Buenos Aires 1969». Efectivamente, en ese año se publicaron varios textos (Cicatrices de Juan José Saer, Boquitas pintadas de Manuel Puig, El fiord de Osvaldo Lamborghini, Los poemas de Sydney West de Juan Gelman, Quién mató a Rosendo de Rodolfo Walsh, Fuego en Casabindo de Héctor Tizón), que pondrían de manifiesto que estaba surgiendo en Buenos Aires la tradición posborgiana dominante de la literatura argentina a partir de los años ochenta. Dalmaroni explica que su perspectiva analítica «apunta a los aspectos literarios (narrativos, textuales, ficcionales, artísticos) del tema […] o mejor, a lo que el estudio de esos aspectos nos diría acerca de la historia literaria y de la particularidad histórica de sus conexiones con la historia social» (Dalmaroni, 2005; subrayado nuestro).

Por otra parte, Jorge Panesi (2005) advierte sobre el carácter profesional de las confecciones de corpus, ya que los criterios que les corresponden inciden en el modo de concebir la tarea de la crítica literaria y de validar o no las bases de trabajos de investigación, como son las tesis doctorales. En este sentido, Panesi observa que la obsolescencia del llamado corpus de autor está determinada en el ámbito académico norteamericano e incide en los modos de pensar y hacer crítica en ámbitos académicos periféricos. Asimismo, Panesi señala que el problema de la confección del corpus atañe a la consideración misma de qué es una literatura nacional, es decir, que el corpus es tanto una cuestión de política académica como de política crítica.

 

Implicaciones

La enseñanza de la literatura puede apelar a la confección de corpus con la intención general de promover un tipo de lectura basada en la confrontación de textos, en la medida en que esta operación permitiría que los estudiantes fueran construyendo y ampliando de manera más sistemática una competencia literaria. Desde este lugar, López Casanova (en prensa) propone el diseño de corpus articulados en torno a cuestiones formales, orientados a dos objetivos didácticos no excluyentes: favorecer la adquisición y el desarrollo de estrategias lectoras atentas a las dimensiones lingüístico-retóricas del texto literario y construir un sistema de referencias culturales y literarias que los alumnos puedan activar en la lectura de otros textos, dentro y fuera del ámbito educativo.

Referencias

Dalmaroni, M. (2005), «Historia literaria y
corpus crítico», Boletín 12 del Centro de
Estudios de Teoría y Crítica Literaria, pp.
109-128, Rosario: Facultad de Humanidades
y Artes de la Universidad Nacional de
Rosario.

Kuguel, I. (2009), «Géneros académicos y
grados de especialización», en Ciapuscio,
G. (ed.), De la palabra al texto. Estudios
lingüísticos del español, Buenos Aires:
Eudeba.

López Casanova, M. (coord.) (2011), Los textos
y el mundo. Una propuesta integral
para talleres de escritura y lectura, Buenos
Aires: Universidad Nacional General
Sarmiento.

López Casanova, M. (2012), «Posibilidades
didácticas de distintos corpus para la
enseñanza de la literatura», Glotodidacta,
n.° 1, Ayacucho: Instituto de Estudios
Mijail Bajtín.

Panesi, J. (2005), «Discusión con varias voces:
el cuerpo de la crítica», Boletín 12 del
Centro de Estudios de Teoría y Crítica
Literaria, pp. 129-140, Rosario: Facultad
de Humanidades y Artes de la Universidad
Nacional de Rosario.

Parodi, G. (ed.) (2007), Lingüística de corpus y
discursos especializados: puntos de mira,
Valparaíso: Ediciones Universitarias de
Valparaíso.

Parodi, G. (2008), «Lingüística de corpus:
una introducción al ámbito», RLA,
Revista de Lingüística Teórica y Aplicada,
46 (1), pp. 93-119, http://www.scielo.cl/scielo.php?pid=S0718-48832008000100006&script=sci_arttext 

Fecha de ultima modificación: 2014-03-25