• No results found

CHAPTER 5: RESEARCH METHODOLOGY

5.5 Phase 1: The Qualitative Study

5.5.1 Sampling strategy

Carlos Jones

[email protected]

Soraya Ochoviet

[email protected]

Fundación Comillas

Montevideo – URUGUAY

Resumen

Este trabajo integra una investigación más amplia sobre la enseñanza-aprendizaje del español lengua materna en el mundo hispánico, promovida por la Fundación Comillas (Cantabria, España). El objetivo fue obtener una visión de conjunto, dado que las numerosas investigaciones anteriores, sumamente valiosas, se han realizado con alcance limitado y empleando variedad de metodologías y marcos teóricos. Esta visión de conjunto permite comparar los resultados a fin de extraer conclusiones y sugerir recomendaciones que sean válidas globalmente.

Si bien el proyecto de la Fundación Comillas no está cerrado, el trabajo de campo realizado permite hacer algún estudio comparativo no previsto inicialmente, como el que presentamos en esta oportunidad, y adelantar algunos comentarios.

Las pruebas se efectuaron en instituciones públicas de primaria y secundaria, de dos niveles de rendimiento académico, en las capitales de Hispanoamérica y de España. En total se realizaron cinco pruebas concernientes al léxico, a la sintaxis y al discurso.

De todas ellas, se seleccionó, para este capítulo, la de riqueza léxica. Dicha prueba permite describir el vocabulario activo de un corpus textual en forma cuantitativa, lo cual permite, a su vez, realizar comparaciones entre los alumnos, entre los centros y entre las diversas sintopías consideradas en la investigación.

Para nuestro trabajo, seleccionamos cuatro sintopías: Asunción, Buenos Aires, Córdoba y Montevideo. Debe señalarse que, si bien Córdoba no es capital nacional, se la incluyó porque en ella se aplicaron las mismas pruebas con idéntica metodología, lo cual hizo posible realizar una lectura de los materiales, con iguales criterios.

De todos los países participantes en la investigación de la Fundación Comillas, hemos seleccionado tres, fundamentalmente por razones afectivas. La investigadora responsable de Argentina fue la doctora Magdalena Viramonte de Ávalos y la de Paraguay, la magíster Limpia Concepción Esteche, a quienes les agradecemos muy especialmente la gentileza de habernos facilitado los materiales y las informaciones complementarias para nuestra labor.

Léxico en el aula y didáctica

Dentro de los materiales utilizados en el proyecto Comillas, hemos seleccionado para este artículo los referidos a riqueza léxica. Esta opción tiene su fundamento en el hecho de que nuestra experiencia –tanto de estudiosos como de docentes– nos lleva a pensar que el léxico no es tema prioritario a la hora de hablar de la enseñanza-aprendizaje del español como lengua materna. Esto sucede –por lo menos en el Uruguay– tanto en materiales teóricos y de investigación como en manuales y textos empleados en las aulas, pasando por los programas de la asignatura. Lo dicho se advierte, también, en la formación que, tradicionalmente, la mayoría de los docentes hemos recibido y aun en obras dedicadas a la didáctica del español, en las cuales se jerarquizan otros temas –como la gramática– en detrimento de aquellos referidos al léxico. Es más, parecería existir una generalizada opinión: el léxico se adquiere espontáneamente, se trae de la casa y de la calle y, por lo tanto, no tiene por qué figurar entre las preocupaciones de la escuela. No es el momento de profundizar en esta cuestión, pero sí de destacar que estudios relativos al aprendizaje del español como lengua extranjera señalan que ni la edad ni la lengua de origen tienen un correlato con los índices de riqueza léxica, lo cual revela que el vocabulario se adquiere mediante el estudio sistemático. Y si esto es así para el español como lengua extranjera, ¿no lo será también para el español lengua escolarizada frente al español exterior al sistema educativo?

En tal sentido, como dice Soprano (2011), la organización semántica es de tal complejidad que solo se logra a través de una serie de paulatinas adaptaciones entre el niño y el mundo que lo rodea, ya que la percepción de la realidad se va enriqueciendo gracias al desarrollo cognitivo, a las experiencias y a los modelos transmitidos por el ambiente social, principalmente en el lenguaje. Y lo dicho para el niño, nos permitimos extenderlo al adolescente, en el que es notorio que se da –o debería darse– un aumento del léxico especializado y abstracto, y aun del figurado.

Además, compartimos lo expresado por López Ornat (1994), en el sentido de que el léxico, al crecer, se va convirtiendo en el material –“masa crítica”– a partir del cual se estructura la morfología y la sintaxis.

Sentadas estas bases, adentrémonos en nuestro tema. Evaluación del léxico

La evaluación del léxico –en un estudiante, en un grupo, en un nivel– puede encararse desde dos ópticas claramente opuestas. Una, en la que se tome en cuenta la calidad y se estudie, por ejemplo, el tipo de palabras empleadas (simples o derivadas, concretas o abstractas), las relaciones lexicales entre ellas (presencia de sinónimos o hiperónimos), la proporción de significados directos y figurados, los términos empleados erróneamente. Otra óptica posible es aquella en la que se haga hincapié en la cantidad. Siguiendo este camino, pueden observarse otros aspectos: el intervalo de aparición de palabras léxicas en un texto, la relación entre palabras diferentes y las repeticiones, la proporción de palabras con contenido nocional frente a las meramente gramaticales, por ejemplo. Los estudios de disponibilidad y de riqueza léxicas, realizados en el marco del proyecto Comillas, se ubican en este segundo grupo, es decir, que se hacen desde una óptica cuantitativa y, por tratarse de estudios cuantitativos, se realizan mediante la aplicación de fórmulas. Para el tratamiento de los datos de disponibilidad se requiere de programas informáticos especialmente diseñados. Por este motivo, preferimos, para esta oportunidad, dedicarnos al estudio de la riqueza léxica.

Su objetivo principal consiste en lograr expresar el índice de riqueza mediante un número, de tal manera que puedan realizarse comparaciones variadas: entre individuos, entre grupos de una institución, de instituciones entre sí o, incluso, en una misma institución en distintos momentos.

La riqueza léxica

Como dijimos, este trabajo se basa en los materiales recogidos en el transcurso del proyecto Comillas. En él, se acordó, como concepto de riqueza léxica, considerar la proporción de palabras con contenido semántico en relación con el total de palabras de los textos de los estudiantes. Con el propósito de enriquecer lo hecho para Comillas y para contar con otros términos de comparación, nos permitimos tomar los datos con que contábamos para cada sintopía y les aplicamos nuevas fórmulas. De esta manera, aquel proyecto nos abrió otras vías de investigación, algunos de cuyos resultados mostramos en esta oportunidad.

Debe tenerse en cuenta que riqueza léxica es una expresión polisémica: no todos los autores ni todos los trabajos la emplean con exacto significado. Así, los matices responden no solo a diversas posturas teóricas sino también a que los investigadores, a lo largo de su tarea, sienten la necesidad de acuñar nuevos conceptos tomando como base el camino recorrido por otros con el propósito de perfeccionar las fórmulas y mejorar el grado de fidelidad de los resultados.

En nuestro caso, consideramos válido el punto de vista de Menard (1983), expresado con carácter pionero hace tres décadas. Según este autor, la riqueza léxica es una noción de naturaleza cuantitativa, que mide el vocabulario activo y que ha de entenderse como un lugar de comparación entre dos o más textos, en función de la cantidad total de palabras y del número de palabras diferentes. Y porque requiere un análisis cuantitativo, debe basarse en modelos estadísticos.

Puesto que el interés está centrado en el número de palabras “léxicas”, esto es, en aquellas que efectivamente “significan” algo, debió realizarse un análisis previo de los materiales obtenidos en las pruebas. Para esto se siguió un protocolo meticuloso, que permitió preparar cada texto para los cálculos definitivos de la riqueza léxica. Por ejemplo, se eliminaron los numerales, los días de la semana, los nombres propios. Luego se realizó la unión de los elementos que funcionan en bloque, como las perífrasis verbales y las locuciones, así como la separación de aquellos que aparecen gráficamente unidos, pero que constituyen términos diferentes, como es el caso de los verbos con los pronombres enclíticos. El paso siguiente fue hacer una clasificación de las palabras restantes en dos grupos: las que presentan significado nocional y las que poseen un contenido fundamentalmente gramatical. Se obtuvo, entonces, un conjunto conformado por sustantivos, adjetivos, verbos y adverbios (señalados en la Imagen 3 con color celeste), y otro constituido por pronombres, artículos, preposiciones, conjunciones (señalados con amarillo).

Para el conteo, se tomó en cuenta únicamente la primera aparición de cada vocablo. Con esto, hemos incorporado en nuestro trabajo los conceptos de “palabra”, como elemento gráfico entre dos espacios blancos, y “vocablo”, como palabra no repetida, incluyéndose en este concepto tanto las de contenido nocional como las de contenido gramatical.

Es importante aclarar que, independientemente de la extensión original, se trabajó solamente con las primeras cien palabras de cada producción, con lo cual quedaron emparejados los textos en cuanto a su extensión. Esta decisión se fundamenta en el hecho de que, según diversas investigaciones, a mayor extensión de un texto, más riesgo se corre de distorsión de los índices.

Densidad y variación léxicas

Bajo el título de riqueza léxica, vamos a trabajar con dos parámetros: densidad léxica y variación léxica. Por densidad entendemos el porcentaje de vocablos léxicos contenidos en un texto y por variación, el número de vocablos empleados, incluyendo en ellos tanto los léxicos como los gramaticales.

Para cada parámetro se aplicó una fórmula diferente:

A cada texto, en consecuencia, se le asignaron dos índices: uno para la densidad léxica y otro para la variación léxica. Finalmente, se hizo un promedio de ambos valores, con lo que obtuvimos un índice de riqueza léxica por cada trabajo y, por tanto, por cada estudiante. Este índice es el que vamos a manejar en los siguientes cuadros y gráficos.

Por cada grupo, se tabularon los promedios de riqueza de cada estudiante y se agruparon los que tenían el mismo índice. A partir de allí, se armaron gráficas como las que pueden verse aquí, por sintopía, por nivel, por estrato, etc. para poder hacer las comparaciones pertinentes.

Comparación de los promedios

Al comparar todas las sintopías de primaria, se observa que cada una muestra índices con alto grado de disparidad. Montevideo aparece más compacto, lo cual indica resultados más homogéneos con respecto al resto. La amplitud de resultados, es decir, la diferencia entre el valor más alto y el más bajo, es de 20 para Montevideo, mientras que Asunción llega a 29, casi un 50 % más.

Con el fin de poder mostrar nuevos elementos de comparación, se elaboró un gráfico donde estos mismos datos se presentan de manera unidimensional.

El espectro de índices de riqueza para cada sintopía figura con una línea roja y aparecen señalados con un triángulo azul los promedios de cada una.

Si comparamos los promedios, llama la atención que sean prácticamente los mismos para todas las sintopías. Oscilan entre 44 y 46, correspondiendo el más bajo a Buenos Aires, con 44, y el más alto a Montevideo, con 46. A pesar de los referidos datos, que dejarían a Buenos Aires con cierta desventaja virtual, es esta la sintopía que tiene la producción de textos con el índice mayor: 60, frente a 58 que parece funcionar, para las demás sintopías, como tope en este nivel de enseñanza.

Frente a la relativa homogeneidad que muestran las líneas rojas en el extremo derecho, que corresponden a los índices más altos, se opone, hacia el extremo izquierdo, un panorama más diverso, donde Asunción presenta la producción con el índice menor: 29.

Veamos ahora cómo se presenta el panorama de la riqueza en el nivel secundario, para lo cual se elaboró un gráfico similar al de primaria.

Los índices relativamente homogéneos del primer nivel de enseñanza dan paso a diferencias más marcadas entre las sintopías. Montevideo se sigue mostrando como el grupo más compacto. En oposición, el grupo más disperso, en este nivel, es Córdoba cuyos resultados oscilan desde 39 hasta 82 (que quedaría fuera del gráfico): 43 puntos separan el índice más bajo del más alto, frente a 18 que es la amplitud de los datos de Montevideo.

Esta dispersión en los datos de Córdoba se debe, básicamente, a que muchas de las producciones de los estudiantes de secundaria no solo no llegaron a las 100 palabras a las que hacíamos referencia anteriormente, sino a que casi el 25 % del total no logró escribir ni siquiera 50. A menor extensión de los textos, como ya dijimos, puede corresponder un mayor índice de riqueza. Esta situación de textos inferiores a las 100 palabras afecta exclusivamente a la secundaria baja de Córdoba, lo cual distorsiona los resultados generales de esta sintopía.

Al comparar los promedios de la primaria con respecto a la secundaria, se observa que estos mejoraron en todas las sintopías, producto de cinco años más de escolarización. El mayor avance se da en Buenos Aires. Por el contrario, Asunción, que se encontraba en el nivel primario con valores similares al resto de las sintopías, quedó bastante por debajo; aumentó apenas dos puntos, es decir, uno más que la primaria de Montevideo. Llama la atención el caso de Asunción, pero quizás deba tenerse en cuenta que allí se vive una situación muy particular desde el punto de vista lingüístico: la cooficialidad del español y del guaraní, cuestión con la que no se enfrenta ninguna de las otras sintopías y cuyo estudio tendría que dar paso a otras investigaciones.

Comparación de los promedios según estratos

A continuación, separamos los promedios de cada nivel educativo, de acuerdo con los estratos alto y bajo, señalados en la Gráfica 4 con verde y rojo respectivamente.

Al comparar la distancia que separa uno y otro promedio, se observa que Asunción y Buenos Aires son las sintopías que muestran con más claridad la diferencia entre ambos estratos.

Si recurrimos a las gráficas iniciales, vemos que, al confrontar las de Asunción, resultan prácticamente simétricas. Al tomar en cuenta un eje imaginario central, la mayoría de los datos queda a uno y otro lado de este, dependiendo del nivel considerado.

Por el contrario, como puede observarse en la Gráfica 4, en las otras dos sintopías el estrato parece no incidir en la riqueza léxica: el promedio varía apenas unos décimos.

Si quisiéramos generalizar, podríamos deducir que esta variable no afecta radicalmente los valores de riqueza.

Esta relación laxa, unas veces próxima y otras lejana, entre el nivel sociocultural y la riqueza ha sido observada por investigadores de ambos lados del Atlántico. Algunos relativizan su incidencia por el hecho de influir solo en algunos componentes de la riqueza pero no en todos; otros observan que puede incidir pero no en todas las edades con la misma intensidad; por último, hay quienes encuentran resultados contradictorios en muestras diferentes, por lo que no logran llegar a conclusiones contundentes con respecto a este tema.

En el análisis de secundaria, se repiten algunas consideraciones de las expuestas para primaria.

Nuevamente, no parece haber una correlación entre estratos y riqueza léxica. En algunos casos son iguales los promedios para cada nivel; en otros, los índices favorecen al nivel superior y, en otros, sucede lo contrario. La secundaria baja de Córdoba, por ejemplo, muestra índices superiores que la de secundaria alta. Como ya se explicó, esto se debe no precisamente a un mejor dominio del léxico, sino a que varios de los textos de esa muestra no llegan a cubrir el 50 % del número mínimo de palabras requerido para procesar los textos. Esta situación de algún modo anómala favoreció la presencia de índices altos. Por el testimonio de los colegas investigadores se sabe que en algún caso, se debe, entre otros, a una cuestión actitudinal, mientras que en Montevideo esto no sucedió.

Incidencia de la escolarización en los componentes de la riqueza

Si descomponemos cada promedio en los valores que incluye: densidad y variación léxicas, se observan otros aspectos de la riqueza.

Al comparar la secundaria con la primaria del mismo estrato, se observa un ascenso en la mayoría de las sintopías. Esto responde, como ya dijimos, a cinco años más de escolarización que, en mayor o menor grado, inciden en la incorporación del léxico. Donde ocurre un aumento menor es en Montevideo. Es muy probable que esto se deba a que allí, al momento de aplicación de las pruebas, los cursos de Español se extendían solo hasta el segundo grado de educación secundaria. Recién en el año 2008 se incorporaron dos horas de la asignatura en 3º grado y dos horas extracurriculares en 4º, en las que los alumnos optan por Informática o por Idioma Español.

Contrariamente al resto de las sintopías, Asunción es la única donde no se verifica aumento de los índices de densidad y de variación en el estrato alto, a pesar de los cinco años que separan un nivel y otro de enseñanza: la densidad desciende apenas y no se registran cambios en cuanto a la variación. ¿Por qué ocurre esto cuando en los estratos bajos sí se observan ascensos? ¿Será que los esfuerzos de la educación están enfocados en esta sintopía al estrato bajo con la idea de que no es necesario hacer hincapié en mejorar el vocabulario de los estudiantes del estrato alto puesto que ya traen desde el hogar un bagaje léxico más importante?

Incidencia de los estratos en los componentes de la riqueza

Parece haber un comportamiento independiente de la riqueza, en función de esta variable. En el caso de primaria, tanto en densidad como en variación, los índices permanecen igual o tienden a la baja. Incluso aparecen notoriamente descendidos en la primaria baja de Asunción. En Montevideo los índices se mantienen iguales, mostrándose como la sintopía en que quizás la educación, al menos en el área de la riqueza léxica, cumpla con su misión niveladora, de achicar las distancias entre estratos altos y bajos. Recordemos, de todos modos, que esta investigación está restringida al vocabulario activo del estudiante. Tal vez a nivel del vocabulario pasivo (es decir, aquel que el hablante comprende pero no emplea) las diferencias sean más evidentes.

Al analizar la secundaria, se observa que los índices se comportan en forma aleatoria. Algunos quedan constantes, otros bajan y otros ascienden. Recordemos el caso de Córdoba, en que la menor extensión de los textos favoreció índices mayores. Llama la atención el caso de Asunción en que las secundarias quedan en desventaja, incluso si las comparamos con la primaria alta de la misma sintopía. En esos casos parecen no haber sido fructíferos, a nivel del léxico, esos cinco años que los estudiantes llevan de ventaja sobre la primaria. Esta situación nos lleva a plantearnos diversas interrogantes, como la posibilidad de que los contenidos curriculares de los cursos de Literatura queden priorizados frente a los de Lengua.

Correlación entre densidad y variación léxicas

Al igual que en otras investigaciones parece haber una correlación entre la densidad y la variación, como puede observarse en la siguiente tabla.