Tal vez sea éste el aspecto más controvertido de la investigación. Si todo proceso reductivo siempre origina controversias, no podía quedar ajeno el campo de la disponibilidad léxica. Se trata de una de las cuestiones de mayor complejidad, pues junto a las diferentes denominaciones que ha recibido esta tarea: estandarización de los
76
Para Mackey (1971b) el número óptimo es veinte.
77
La encuesta se ha aplicado de acuerdo con las directrices estipuladas: cumplimentar el cuestionario de forma escrita, dar instrucciones sobre cómo han de cumplimentar la primera hoja del cuestionario, producir listas abiertas en cada centro de interés y un tiempo límite de dos minutos, que controla el tiempo de reacción de los informantes.
datos (Alba, 1995a; Galloso, 2002a), edición de los materiales (Samper, 1998a; Carcedo, 2001; González, 2002), pautas de unificación (Mateo, 1998), edición y codificación de los materiales (López Morales, 1999a), etc., se encuentran los diversos objetivos particulares que los investigadores persiguen en su trabajo empírico78.
La unidad sobre la que opera la estadística léxica es el lema, término que suele usarse como sinónimo de vocablo. Los lemas son los elementos resultantes de un proceso que reduce a una forma léxica única todas las posibilidades paradigmáticas de un término. Con otras palabras, la lematización consiste en reagrupar las formas heterogéneas de un mismo vocablo, así como separar las formas homógrafas que responden a vocablos diferentes. Como señala Muller (1973: 242), una de las tareas más importantes es expurgar las listas tras establecer las normas de despojo cuantitativo de la producción aportada por el informante. Estas normas o principios generales han de ser estables y suponen un compromiso para los investigadores lingüistas y, solamente, si se han despojado diferentes listados con las mismas normas, reglas o convenciones serán útiles las conclusiones de una comparación de resultados.
Un inventario lematizado es aquel que contiene como unidad la unidad léxica y las formas flexivas que la representan se consideran parte de la misma en los cómputos principales (así, ‘bueno’ incluye ‘bueno, buena, buenos, buenas’). Las listas lematizadas son las más provechosas para los trabajos descriptivos, tengan o no propósitos pedagógicos. Los fenómenos a los cuales hay que hacer frente para conseguir estas listas son:
• Polisemia y homografía. La homografía léxica (o radical para otros autores) es un fenómeno semántico que altera la identificación de las unidades. Resultaría útil que la teoría semántica ofreciera algo así como una jerarquía de la ‘relevancia’ de los rasgos semánticos. La mayoría de los autores prestan más atención a los homógrafos sintácticos y morfológicos que a los de tipo léxico y eso produce, en la mayoría de las ocasiones, un peso excesivo de la distinción gramatical en detrimento de la de tipo semántico.
• División y agrupación de cadenas gráficas. Es harto conocido que la identificación de las unidades lingüísticas es una cuestión de grado y que se aplican diversas soluciones, dependiendo de las diferentes interpretaciones (peso pluma Æ peso, pluma; cuchara de madera Æ cuchara, madera). En nuestro caso ya se ha argumentado la importancia de la unidad léxica.
78
A veces, los criterios adoptados en los diversos protocolos de edición son bastante dispares; ello es lógico pues se trata de algo convencional que cada investigador decide en función de sus intereses: dialectales, interlingüísticos, cognitivistas, planificación de la adquisición léxica, ...
• Asignación de palabras a clases. Esta tarea, aunque de vital importancia, es muy compleja. Se trata de separar las palabras gramaticales de las de tipo léxico; pero cualquier decisión que se tome, deja siempre insatisfechos a un gran número de lectores entendidos. Más adelante, al tratar los criterios particulares de cada centro de interés, se indican las soluciones adoptadas.
El despojo lexical se realiza en la etapa previa a la codificación de los datos, pero aun asumiendo la necesidad de lematizar con el fin de unificar variantes de una misma unidad léxica para proceder a los cotejos dialectales, hemos de tener en cuenta que el despojo no puede registrarlo todo y que solo ha de establecer distinciones muy netas; por eso, como apunta Muller (1973: 259) es bueno adoptar una norma práctica, sin grandes pretensiones científicas. Es cierto que los objetivos centrales del proyecto panhispánico son, de un lado, elaborar un diccionario de léxico disponible del español general y, de otro, posibilitar estudios comparativos entre los léxicos disponibles de diferentes áreas y países hispanohablantes79; de ahí la necesidad de lematizar con el fin de unificar variantes de una misma unidad léxica para proceder a los cotejos dialectales. Con objeto de que nuestra investigación pueda contribuir a dicho proyecto se han aplicado, mayoritariamente, los criterios comunes de edición sugeridos por Samper80 (1998a) para el procesamiento de los datos que los informantes han actualizado en las encuestas. No obstante, y dadas las diferencias observadas en la edición final de varios trabajos consultados, se han mantenido algunas variaciones con respecto a las sugerencias generales, especialmente, aquellas formas que reflejan lo peculiar o característico de la comunidad estudiada; todo ello se justificará posteriormente.
Asumimos que cualquier decisión personal que se adopte, como subjetiva que es, presenta ventajas e inconvenientes; en nuestro caso, respetando los objetivos esenciales de los estudios de disponibilidad léxica, hemos fundamentado la decisión particular en dos principios: fidelidad al corpus versus estandarización y lematización versus conceptualización. La aplicación de estos dos principios ha supuesto una serie de filtrados procesados en sucesivas ediciones: tras la rectificación ortográfica, los primeros listados contienen los datos recogidos respetando las distintas denominaciones usadas (bungalow, whisky, ping-pong, ...), así como las diferentes entradas que han evocado los informantes, especialmente, en los diminutivos (mesita – mesilla – mesita de noche – mesilla de noche – mesita de teléfono – mesilla de teléfono); los listados
79
Para Mackey (1971a: 109-110) el objetivo principal de los estudios de disponibilidad léxica era establecer comparaciones entre las distintas modalidades diatópicas del francés. También Samper (1998a: 311) señala que uno de los principios que debe guiar el trabajo de edición de los materiales de cada zona es facilitar, en la mayor medida posible, el cotejo dialectal.
80
Conviene señalar que los criterios establecidos por Samper siguen, en sus líneas básicas, las sugerencias de Muller (1973: 253-258).
definitivos que aquí presentamos, aunque ello suponga cierta pérdida de información, recogen los préstamos estandarizados (güisqui, biquini, pimpón, bungaló, ...) y la reducción de unidades léxicas diferentes para el mismo concepto mental, por ejemplo: mesita de teléfono y mesilla de teléfono Æ mesita de teléfono, mesita de noche y mesilla de noche Æ mesita de noche. En los demás casos en que palabras diferentes denotan el mismo concepto mental –sinónimos que aluden al mismo referente- se han mantenido las diversas entradas: televisor – televisión, mama – pechos – seno – teta, testículo – cojón – huevo. Así pues, el repertorio léxico que aparece editado en este trabajo corresponde a los listados definitivos81; es cierto que plantea cierta reducción sobre la información inicial, pero respeta los presupuestos metodológicos esenciales de los estudios de disponibilidad léxica. En nuestra opinión, tanto el rigor y objetividad del proyecto panhispánico de léxico disponible como la fiabilidad de los datos requiere que los integrantes de dicho proyecto nos replanteemos algunos criterios y se concrete de forma precisa la lematización del corpus, dado que la unidad sobre la que opera la estadística léxica es el lema como elemento resultante de un proceso que reduce a una forma léxica única todas las posibilidades paradigmáticas de un término (vocablo, type, unidad léxica).
A continuación se exponen las pautas generales empleadas en la edición de estos materiales y, posteriormente, se presentará un comentario detallado por centro de interés de las soluciones particulares adoptadas ante la casuística que presenta el léxico disponible de la provincia de Valencia:
• Eliminación de términos repetidos. En la preparación de los datos para su procesamiento informático se ha respetado el orden de aparición y se han eliminado los términos repetidos por cada informante dentro del mismo centro de interés. Cuando se han encontrado dos palabras en la misma línea, se han tratado como si la segunda estuviera detrás de la primera en el orden de aparición.
• Ortografía. Ante las numerosas anomalías gráficas, tanto generales como derivadas del uso oral predominante de la lengua y de la fonética autóctona, se ha procedido a la corrección ortográfica de todas ellas: grafías, tildes, pérdida –d- intervocálica, ... En cuanto al uso de mayúsculas, sólo se mantienen en las siglas (A.V.E., D.U.E., A.T.S., W.C.) y en los nombres propios (Capitanía General).
• Referente a la unificación ortográfica, la solución adoptada es la siguiente:
- si la norma (DRAE, 1992) autoriza dos formas, aunque Samper (1998a: 314) señala que “debe elegirse una de las dos formas para que no aparezcan entradas distintas”, hemos mantenido ambas puesto que pueden reflejar la
81
Tras aplicar el programa Lexidisp a los diferentes listados sucesivos de cada centro de interés, y en algunos casos se han realizado cinco filtrados, las decisiones particulares finales adoptadas han tomado como referencia los índices de disponibilidad y aparición obtenidos en cada caso.
influencia de la otra lengua en contacto; por ejemplo: mahonesa – mayonesa, en valenciano, maionesa;
- en el caso de neologismos y extranjerismos, se ha uniformado el vocablo con grafía extranjera al término adoptado por el DRAE o por otros diccionarios (TERMCAT82, Diccionari Valencià); así: biquini, cruasán, güisqui, niqui, póquer, sinfonier, ... Si el vocablo no se halla registrado en alguno de estos diccionarios, se adopta la forma recogida en el DEA83 o en el CREA (gayumbo, mangui), se mantiene con la grafía de la lengua original o como la han escrito los informantes (rayolar84);
- la unificación no afecta, sin embargo, a aquellos casos en que junto a la forma extranjera aparece la correspondiente voz española; así: parking – aparcamiento, fútbol – balompié, voleibol – balonvolea. En nuestro caso, dada la situación de lenguas en contacto (catalán-español), se han mantenido las dos variantes siempre que han aparecido: pierna – cama, rodilla – genoll, muslo – cuixa.
• Marcas comerciales. Todas adoptan su estandarización bajo la forma de minúscula y asterisco al final de la palabra. Aunque Samper (1998a: 317) sugiere admitir solo aquellas que ya están totalmente lexicalizadas, resulta difícil, en varias ocasiones, discernir el grado de lexicalización de algunas de ellas; de ahí que se hayan incluido todas las que aparecen sin restricción alguna, tal y como han hecho Mateo (1998) y Galloso (2002a). Además, se ha podido comprobar cómo el informante ha evocado como léxico disponible, en muchos casos, la marca (zippo*, tupperware*, tippex*) y no el producto genérico, aunque tenga almacenados en su lexicón mental ambos términos. En nuestra opinión, la aportación de los estudios de disponibilidad léxica para conocer el grado y proceso de lexicalización de las marcas comerciales en una comunidad de habla es palmaria. El listado definitivo ofrece una visión clarificadora sobre el uso preferente del término referido a un producto concreto o al de diferentes marcas relacionadas con el mismo, especialmente, en los jóvenes.
• Neutralización de variantes meramente flexivas. Las diversas variantes morfológicas de un mismo vocablo se han reducido a la forma no marcada del paradigma. Los sustantivos y adjetivos aparecen en singular y, si presentan variación de género, en masculino. No obstante, esta reducción cuenta con excepciones fácilmente explicables en diversos centros de interés; así, en ‘Animales’: caballo – yegua, gallo – gallina, mulo – mula; en ‘Juegos y distracciones’: indios y vaqueros, cartas, soldaditos; en ‘Profesiones y oficios’: azafata, costurera; y también cuando los
82
Centre de Terminologia Catalana (http://www.termcat.net).
83
Diccionario del español actual (Seco et alii, 1999).
84
Briz (1985: 45) explica, al tratar del léxico de la vid, que ‘rayolar’ es eliminar los brotes que nacen junto a las hojas con el fin de que no chupen de los sarmientos y resten fuerzas a éstos y al fruto.
vocablos se han utilizado como complementos de un verbo o de otro sustantivo (coger flores, arrancar malas hierbas, cortar hierbas).
Junto a las excepciones anteriores, nosotros hemos preferido tratar, además, algunas variantes flexivas de forma diferente; por ejemplo, en el caso de variación en género y número de sustantivos y adjetivos, si se han producido ambas formas, se unifican en una, la señalada arriba, pero si los informantes solo han producido una variante, ésta se mantiene (trituradora, recreativos, pollito inglés...). También se mantienen las variantes basadas en una oposición semántica (cesto – cesta, pimiento – pimienta, secador - secadora).
En cuanto a las formas verbales se han reducido al infinitivo las diversas formas flexivas, salvo en el centro ‘Juegos y distracciones’ (veo veo, corre que te pillo). No obstante, queremos señalar que en el centro ‘Medios de transporte’ los informantes han utilizado mucho más el gerundio (corriendo, andando) que el infinitivo correspondiente (correr, andar).
• Formas derivadas. Los derivados regulares que no suponen alteración de significado se han unificado bajo el mismo lema; así, se han reducido a su forma básica los diminutivos y aumentativos (flor, florecilla Æ flor; caballo de mar, caballito de mar Æ caballo de mar; coche, cochazo Æ coche), pero no se han reducido cuando la diferencia morfológica tiene pertinencia semántica (horno –hornillo, ensalada – ensaladilla, manteca – mantequilla, cuchara – cucharilla – cucharón, fútbol - futbito, coche-cochecito de bebé).
• Uso del paréntesis. Se han unificado las formas plenas y los acortamientos de varias palabras o unidades léxicas del corpus, tanto en los casos de apócope y aféresis como en aquellos casos en que una de las palabras de la unidad léxica puede omitirse: bolí(grafo), (auto)bús, columna (vertebral), (cuarto de) baño, (perro) pequinés, ingeniero de teleco(municaciones). La interpretación del paréntesis es la siguiente: unos informantes han actualizado solo la forma completa: bolígrafo, cuarto de baño, ... y otros solo han producido la forma que no lleva paréntesis: columna, baño, bus, boli, pequinés.
• Compuestos sintagmáticos. Dadas las diferentes entradas que para algunos de los compuestos han indicado los informantes (tenedor de / para la carne, cuchillo de / para el pescado) se han unificado en la entrada que contaba con mayor índice de disponibilidad en los listados iniciales.
• Omisión. Se han omitido todos los artículos en las entradas, incluso en los nombres propios (gallina ciega, Miguelete, Lonja). También se han excluido del listado definitivo los lexemas ajenos al centro de interés. Es cierto que esta ‘limpieza’
puede beneficiar ciertos estudios comparativos pero también perjudica porque anula ciertas asociaciones cognitivas subjetivas que pudieran resultar interesantes85.
• Por último, dada la situación de contacto lingüístico, queremos señalar que junto a voces procedentes de otros idiomas hay una proporción interesante de entradas en valenciano86; estas variantes nos permitirán conocer el grado de dominio o el tipo de bilingüismo de los informantes en sus actuaciones léxicas. En muchos informantes bilingües aparece el doblete castellano – valenciano (muslo – cuixa), pero en otros solo aparece el término en valenciano, lo que puede indicar una transferencia léxica o una sustitución de código, code-shifting, al no recordar el informante el vocablo en castellano. Para las entradas en valenciano hemos adoptado la unificación ortográfica con los mismos criterios que en castellano.
A pesar del detalle bastante minucioso que acabamos de enumerar para la edición de los listados definitivos, son muchos los problemas puntuales que han ido surgiendo en los distintos centros de interés. Así, al igual que en la zona del interior de la provincia encontramos aragonesismos en los castellanohablantes, en la zona próxima a la costa, mayoritariamente bilingüe o valencianohablante, también aparecen determinados vocablos que son préstamos en vías de integración procedentes del valenciano (paradeta por quiosco o puesto de venta ambulante) y otras variantes valencianas (espardenya, panxa, peüc), aunque estas unidades léxicas suelen presentar índices de disponibilidad muy bajos. Todo ello ha quedado registrado de acuerdo con uno de los principios asumidos: fidelidad al corpus versus estandarización. Pasamos, pues, a señalar las pautas particulares de cada centro de interés: