Literature Review
3.3.3 Model Development
3.3.3.1 Obsolescence Assessment Tool (OAT)
El trabajo con corpus preexistentes agiliza la obtención de resultados, sobre todo si están transcritos y anotados, por lo que es conveniente valorar su utilidad. Existen corpus orales transcritos en español accesibles en la red (Subcorpus Oral del CREA, que
110
Labov (1972) basó su metodología en la cuantificación, por lo que muchos estudios sociolingüísticos utilizan métodos estadísticos. Existe cierto debate dentro de la Sociolingüística sobre qué perspectiva es más adecuada, la cualitativa o la cuantitativa; aunque esto depende totalmente de los objetivos de investigación. La crítica que se le ha hecho a la cuantificación es la tendencia a la simplificación de la realidad hasta llegar a patrones generalizables que no recogen el significado real de las prácticas estilísticas (Coupland, 2007: 9). No obstante, incluso autores implicados con la noción dinámica del estilo han encontrado formas de equilibrar la perspectiva cuantitativa con una interpretación de la variación en términos de práctica estilística (Eckert, 2000, 2005, 2010). Como se observará más adelante, este estudio se basa de hecho en una metodología mixta.
incluye el ACUAH, el ALFAL, el COVJA, el CSC y el UAM111; Corpus de conversación coloquial - Grupo Val.Es.Co112; COLA113; PRESEEA114; etc.), muy útiles para todo tipo de búsquedas. No obstante, tras evaluar las posibilidades ofrecidas por estos corpus, detecté tres limitaciones importantes por los que decidí descartarlos.
Uno de los criterios que Labov estableció para que una variable lingüística fuese adecuada (cap. I) fue el de los datos suficientes; esto es, que la variable estudiada apareciese abundantemente en el discurso. Hasta la fecha, no existen corpus sobre sexualidad exclusivamente, y su presencia en los corpus disponibles no es abundante, notablemente en su función referencial. La presencia de palabras tabú de base sexual (coño, joder, puta, maricón, etc.) en los corpus conversacionales (COLA, Val.Es.Co) da una sensación ficticia de que los conceptos sexuales son abundantes, pero la mayoría de las expresiones son insultos o interjecciones (Stenström, 2006), no verdaderas variantes conceptuales, y por tanto no coinciden con mi objeto de estudio.
De la valoración inicial de los corpus emerge otro problema. Las exploraciones automáticas requieren introducir elementos concretos con base léxica. Esto implica partir de una lista de palabras seleccionadas de antemano. Para un estudio onomasiológico conceptual, como este, en el que la variable es el concepto sexual, este
111
Los corpus mencionados se componen de muestras de lengua española hablada en España y han sido cedidos a CREA oral, que los ha adaptado a sus normas de transcripción. Se trata específicamente de los corpus: “ACUAH: Análisis de la conversación de la Universidad de Alcalá de Henares. Cedido por la Universidad de Alcalá de Henares, Madrid. ALFAL: Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico. Cedido por la Asociación de Lingüística y Filología de América Latina. […] COVJA: Corpus oral de la variedad juvenil universitaria del español hablado en Alicante. Cedido por el Instituto de Cultura Juan Gil-Albert de la Diputación Provincial de Alicante. CSC: Corpus para el estudio del español hablado en Santiago de Compostela. Cedido por la Universidad de Santiago de Compostela. UAM: Corpus oral de referencia del español contemporáneo. Cedido por la Universidad Autónoma de Madrid.” En http://www.rae.es/rae/gestores/gespub000019.nsf/voTodosporId/F651954693D3AC5EC125716 400426004?OpenDocument. (Consulta: 19/07/2013) El CREA oral está compuesto además por otros corpus de lengua española hablada fuera de España y por grabaciones transcritas de radio y televisión.
112
Val.Es.Co está preparando una actualización de su corpus, publicado en formato papel (Briz Gómez, 2002), a un entorno virtual. En Web: http://www.uv.es/corpusvalesco/index.html. (Consulta: 19/07/2013).
113
El COLA (Corpus Oral de Lenguaje Adolescente) está disponible en línea, bajo petición. Disponible en Web: http://www.colam.org/. (Consulta: 19/07/2013).
114
El portal de PRESEEA permite el acceso a sus materiales bajo registro previo. Disponible en Web: http://www.linguas.net/Inicio/tabid/441/language/es-ES/Default.aspx. Los materiales de Valencia están disponibles sin registro (http://www.uv.es/preseval/ppal.htm). (Consulta: 19/07/2013).
tipo de búsqueda pierde gran cantidad de variantes, especialmente porque su tendencia a la variación los hace altamente impredecibles. Como se verá en los estudios de caso, las variantes encontradas a veces son muy vagas (hacerlo, eso, ahí…) e imposibles de extraer automáticamente, debido a su variabilidad semasiológica. También se perderían así variantes creativas, más o menos idiosincrásicas, como palabras inventadas (burrutear), metafóricas (morcillona) o metonímicas (bultos).
Ante la dificultad de trabajar con corpus orales transcritos, valoré la posibilidad de grabar muestras no elicitadas o de transcribir materiales audiovisuales disponibles. Ambas opciones resultaron inadecuadas. La primera opción plantea problemas de ética científica. En las consultas ginecológicas, de planificación familiar o sexológicas, surgen conceptos sexuales en abundancia, y además se obtiene en ellas abundante información social de los participantes. El acceso a este ámbito sería una forma rápida de conseguir material, pero es inviable obtener los permisos necesarios para grabar dentro de un espacio con una política de confidencialidad estricta, al menos, para un trabajo de tesis. Por otra parte, las situaciones comunes en las que más se habla de sexo no son fácilmente accesibles a la investigación; se suelen dar entre amigos o en pareja115, pero no de forma continua, por lo que incurren en el problema de los datos no suficientes. Algunos programas de televisión o radio con un formato de consultorio sexual proveen una inmensa cantidad de las variables sexuales, pero tienen la desventaja de que no se obtiene suficiente información social de los informantes. Este formato puede ser muy útil para trabajar exclusivamente con categorías microsociológicas construidas en el discurso, pero no cuando se pretende trabajar con ambas.
Ante estas limitaciones (la escasa presencia de conceptos tabú en corpus orales, la heterogeneidad e imprevisibilidad de las formas, la confidencialidad de las consultas relacionadas con la sexualidad y la falta de información social en medios audiovisuales), consideré necesario recoger materiales propios para poder estudiar el fenómeno del tabú. A pesar de las dificultades que expondré a continuación, la elaboración de un corpus propio tiene una ventaja fundamental: el trabajo de campo y la
115
A estos contextos se accede a través de grabaciones secretas, con o sin autorización posterior, lo que plantea problemas de ética científica. Aunque sociolingüistas como Milroy las utilizaron (Milroy, 1987: 87 y ss.), hoy en día no se recomienda hacerlo. En las universidades en las que los proyectos de tesis deben pasar un comité de ética, no se admiten este tipo de métodos.
experiencia directa con los datos proporcionan una visión más profunda y personal que, finalmente, redunda en una comprensión más completa del significado de la variación.