Hanks (en prensa: 9) explica la teoría de normas y explotaciones como una respuesta a la pregunta «How people use words to make meanings?». Esa misma pregunta, como él mismo indica, se ha intentado contestar desde Platón (Cratilo) o Aristóteles (Categorías,
Metafísica22) hasta nuestros días.
Este último filósofo fue el primero de nuestra tradición en interesarse por el establecimiento de una ontología o conjunto jerárquico de ontos o «seres», de todo lo existente (Hanks 2008b: 39). Según Labov (19732008: 377), el motivo por el que la lingüística moderna, hasta hace poco, no ha atendido la semántica tanto como otros aspectos de la lengua –como la fonética, la morfología o la sintaxis– es «the difficulty of the problem, and its inaccessibility to the most popular methods on inquiry». El significado de las palabras, pues, parece recaer en el
contenido del signo lingüístico saussureano (Saussure 1916), mucho
más intangible que la forma en que este se encuentra. Por ello, resulta a Labov dificultosa la tarea, ya que los métodos de investigación de su
22 Entre otras obras citadas por Hanks (2008b), que pondera, por ejemplo, el afán del autor griego por la clasificación semántica en «ontologías», expuesta en su
época aún eran previos al desarrollo de las nuevas herramientas tecnológicas. En el capítulo anterior se observó que los diccionarios son una muestra de esta dificultad: por un lado, ningún diccionario describió igual los verbos analizados, pero por el otro, ninguno de ellos podía considerarse completamente errado; el problema, por tanto, no consiste en que unos realizan acertadas descripciones científicas y otros se equivocan, de forma maniquea. El significado de las palabras está muy unido al modo como una sociedad concibe el mundo, lo cual afecta a su descripción (Lara 1997).
En el mencionado trabajo, Labov (19732008: 378) explica que se han probado distintos métodos para dilucidar el significado de las palabras, como la introspección, la experimentación con sujetos o el estudio de textos. También Sinclair (1991: 37-51) indica lo mismo, pero al tener la perspectiva lexicográfica añade el empleo de diccionarios, describiendo una situación de «endogamia» muy típica en lexicografía. Pero también la introspección fue y sigue siendo muy frecuente en la práctica lexicográfica. En cuanto a la experimentación con sujetos, es frecuentemente empleada por la psicología, la sociolingüística o la lingüística cognitiva (vale como ejemplo el propio trabajo de Labov sobre el concepto de ‘taza’ o el estudio de Rosch: 1975 sobre la representación cognitiva de las categorías semánticas), y el «análisis de textos» es la opción que toma la lingüística de corpus y los enfoques que se adhieren a ella. La TNE se suma a estas corrientes dedicadas al estudio del significado de las palabras desde esta tercera perspectiva, centrándose en las palabras en su contexto lingüístico: sigue, por tanto, la máxima «trust the text» (Sinclair 2004), heredando y, al mismo tiempo, sistematizando el «ferocious empiricism» (Hanks 1997) de este pionero de la lingüística de corpus. La intención de Hanks es crear una teoría sujeta a los datos empíricos, y emplear un método de análisis (el CPA) para observar estos datos de forma sistemática. Más modernamente que los autores citados en las líneas anteriores, existen diversas aproximaciones que han propuesto maneras de sistematizar el análisis del léxico, a menudo impulsadas por las necesidades –y ayudadas por las oportunidades– de la lingüística computacional. Así, de manera similar a la pregunta de Hanks, Pustejovsky (1995; v. también De Miguel 2009c) se interesa en el modo como el conocimiento se representa en el lexicón, y en sistematizar el análisis de dicha representación. Su teoría del lexicón generativo ofrece una descripción más desmenuzada de la rica semántica de las unidades léxicas, por medio del establecimiento de
una estructura de qualia23, que son aspectos diversos del significado de
una palabra. Considerando esto, se puede formalizar el análisis semántico de las categorías empleadas para definir el léxico, pues un cambio en la estructura de qualia conlleva un cambio semántico. A la vez, este enfoque se aleja de los postulados que defienden el significado como un bloque cerrado e inflexible. Así pues, todo el enfoque de Pustejovsky sirve de base para la elaboración del CPA y la TNE de Hanks, que colaboró con el primer autor al comienzo del proyecto CPA. Una de las maneras de ver este método es, pues, como una aplicación práctica de la teoría del lexicón generativo, que más adelante se desglosa en una nueva teoría, la TNE. En efecto, uno de los primeros trabajos del PDEV (Hanks y Pustejovsky 2005) definía este como «a pattern dictionary for natural language processing», en línea con el interés de Pustejovsky por hace teoría dentro del marco de la lingüística computacional.
Los trabajos de Levin pueden considerarse también muy relevantes para el estudio sistemático del léxico. En Levin (1993) se ofrece una tipología muy detallada de las alternancias de los verbos ingleses, aportando una clasificación pormenorizada, complementada por un gran número de unidades verbales como ejemplo. Dicha clasificación es la base para el establecimiento de una serie de clases verbales cuyos miembros siguen un mismo comportamiento con respecto al sistema de alternancias. Con respecto a nuestras necesidades, consideramos que, desde la perspectiva de la lingüística de corpus y de la lexicografía, se trata de un enfoque no suficientemente basado en datos concretos de uso; por ejemplo, Levin menciona verbos y clases de verbos, pero no sus patrones de uso (es decir, que los verbos de una clase como la de
put −por ejemplo− podrían tener, en realidad, patrones de uso muy
diversos) e, igualmente, la documentación acerca del uso real de dichas alternancias o dichas clases verbales no parece mostrarse de una forma transparente.
Por último, el trabajo de Hunston y Francis (2000) sobre los patrones de uso del léxico inglés constituyen un esfuerzo de sistematización del análisis sintáctico de las unidades léxicas en su contexto real, pues se trata de un enfoque basado en corpus, cuyo objetivo, tal como ellas anuncian, es ofrecer una pattern grammar con fines didácticos, como complemento del diccionario COBUILD. En Hunston y Francis (1998) se explica este trasvase de la información gramatical del COBUILD a
23 El quale constitutivo explica qué son o de qué están formadas las cosas; el quale formal ofrece sus características formales, como el color o el tamaño; el quale télico explica la función de las cosas; y el quale agentivo explica quién las produce o crea. Desde el punto de vista lexicográfico, se trata de categorías muy útiles –aunque de límites imprecisos– para las definiciones sobre todo de los nombres.
la gramática de patrones. Algunos ejemplos de usos verbales analizados según esta aproximación serían los siguientes (Hunston y Francis 1998: 65): wonder wh think V of n as n/-ing worry V about n mean V that treated V n as n
Consideramos esta aproximación muy útil y clara para comprender la estructura general de un verbo, pero, como puede comprobarse, no sirve para nuestro propósito, que es el de discriminar significados a través del contexto sintáctico y semántico. Un verbo polisémico como
treat puede emplear la misma estructura para significados diferentes
(comp. acepciones 1 y 2 del Longman Dictionary of Contemporary
English, versión en línea:
http://www.ldoceonline.com/dictionary/treat_1; consulta:
10/09/2012). Consideramos que al enfoque de Hunston y Francis le falta la información semántica para que pueda servir al objetivo de la tesis.
Así pues, la TNE se incorpora a la larga tradición de ideas filosóficas y lingüísticas que han descrito el significado y cómo este se expresa en el lenguaje, y a enfoques que pretenden describir con mayor exactitud la semántica o la sintaxis de las palabras. En concreto, la TNE se incluye entre las propuestas empíricas de análisis de patrones en corpus. Para cerrar esta pequeña introducción sobre el contexto en que surge la TNE, volvamos a la Antigüedad clásica, que ya distinguió entre las palabras contempladas aisladamente y en combinación con otras; Aristóteles, en las Categorías, dice:
De las cosas que se dicen, unas se dicen en combinación y otras sin combinar. Así, pues, unas van en combinación, v. g.: un hombre corre, un hombre triunfa; y otras sin combinar, v. g.: hombre, buey, corre, triunfa.
(v. Tratados de lógica (órganon), 1994, p. 31) Así, si tomamos como ejemplo esta afirmación del Estagirita, observamos que, frente a la unidad léxica aislada, cuya morfología y semántica es independiente del contexto, están las unidades en combinación sintáctica. En el segundo listado marcado con cursiva, pese a que la mayoría de los hablantes atribuye un significado
principal a cada una de las palabras24 (por ejemplo, en la mayoría de mentes que leen buey está el ‘animal rumiante’), todas ellas pueden significar otras cosas (así, el buey es también un ‘marisco’). En cambio, el contexto restringe el significado, reduciendo la posibilidad de ambigüedad semántica: un hombre corre restringe el significado de
correr, de modo que no pueda interpretarse este verbo en los sentidos
que observamos en el aire corre, el tiempo corre o el rumor corre, todos ellos diferentes entre sí25.
Del mismo modo que se observa esta restricción semántica según el contexto, se observa también, en estas frases, un segundo aspecto: todas ellas son iguales sintácticamente. Las frases un hombre corre, el
aire corre, el tiempo corre o el rumor corre tienen un sujeto más un
verbo. Por lo tanto, la sintaxis no es suficiente para determinar el significado.
Así pues, ¿en qué consiste dicho contexto26? Observemos, para redundar en la cuestión, los siguientes ejemplos, que servirán además para ilustrar como los usos pronominales necesitan de una descripción tanto sintáctica como semántica:
(52)
a. El buen samaritano [...] se compadece DE los que sufren. (SWC) b. ...un ambiente agresivo, que no se compadece CON la tradicional
hospitalidad granadina. (SWC) (53)
a. Varios edificios de ladrillo se derrumbaron. (IULA50) b. El acusado se derrumbó y confesó todo. (IULA50)
Observamos como, en (52a y 52b), la estructura sintáctica se asocia claramente con el significado: compadecerse de alguien es ‘sentir compasión por él’, mientras que compadecerse una cosa con otra es ‘estar acordes’. Sin embargo, la estructura sintáctica es idéntica en las dos frases de (53), mientras que el significado ha cambiado con la
24 Lara (1990: 195-212) llama significado estereotípico a este significado principal, cuyos rasgos son difíciles de limitar; aun así, expone (Lara 1990: 196): «Estas primeras acepciones de los diccionarios [las que contienen el significado estereotípico] corresponden a la primera idea que tiene una persona, un miembro de una comunidad lingüística cuando escucha estas palabras en aislamiento».
25 Véase, p. ej., el DUE para un análisis de correr (s. v.). En este diccionario, el primer significado (un hombre corre), corresponde a la acepción 1; y el resto, respectivamente, corresponden a las acepciones 11, 12 y 13.
26 Usamos contexto para referirnos al eje sintagmático, no al contexto discursivo, y en concreto, cuando decimos contexto damos por sentado que se ha extraído de corpus, es decir, del uso real.
misma claridad que en (52): un edificio se derrumba cuando ‘cae’ (53a), y una persona que ha cometido una falta se derrumba cuando ‘confiesa’ (53b). Ello lleva a concluir que el significado se extrae de la sintaxis pero también de la combinatoria de los argumentos: es la selección de varios edificios en posición de sujeto lo que determina el significado de (53a), e igualmente la selección de el acusado en (53b). En (52a), el hecho de que el significado requiera siempre sujeto humano es también un rasgo semántico que se añade a la distinción que cabe hacer con respecto a (52b), que requiere que el sujeto sean nociones abstractas. En el sistema de Hanks, estos cuatro ejemplos corresponderían a cuatro patrones diferentes (v. nuestro análisis de ambos verbos en el DAELE, s. v.).