El umbral de palabras conocidas de un texto, los saberes previos y la comprensión lectora
“Lo que me preocupa es que la pobreza léxica suele degenerar en pobreza cognitiva» (José Carlos Ruiz, filósofo)
En nuestro país, un 34,6% de la población infantil está en riesgo de pobreza o exclusión social, según UNICEF. Las carencias de vocabulario y de conocimientos de los niños que viven en esta situación son críticas para su desarrollo lector y académico.
En este desarrollo, la habilidad de comprensión lectora está fuertemente determinada por el nivel de “cobertura léxica”, definida como la proporción de palabras que el escolar conoce de un texto. En general, se puede llegar a comprender cualquier muestra de discurso hablado o escrito si contiene algunas palabras desconocidas, por lo que no es necesario una cobertura del 100%. Sin embargo, la comprensión lectora no es un fenómeno de todo o nada, sino una habilidad de naturaleza lingüístico-cognitiva compleja que se desarrolla gradualmente, y que se fortalece cuando se mejoran mediante procesos de retroalimentación el vocabulario y los conocimientos o saberes previos construidos. Tales procesos mentales se activan cuando se estimula la capacidad de los niños para elaborar los conceptos que las palabras representan y sus correspondientes ideas.
La hipótesis del umbral léxico
La “hipótesis del umbral léxico”, un constructo teórico central para cualquier teoría de comprensión lectora, establece que la comprensión de un texto se incrementa más rápidamente a partir de un cierto nivel de cobertura textual (Hu y Nation, 2000
1; Laufer, 1989
2; 1997
3; Schmitt et al., 2011
4).
El umbral léxico representa un punto crítico del desarrollo lector, a partir del que los escolares comienzan a fortalecer su habilidad para relacionar los conceptos de las palabras que conocen del texto, con la intención de realizar inferencias sobre el significado de las que desconocen, para tratar de construir una representación coherente sobre el significado de lo que leen. Las evidencias sobre el umbral léxico sitúan un rango porcentual de cobertura entre el 95 y el 98 de palabras conocidas para la comprensión idónea de un texto. De otro modo, un lector puede llegar a comprender un texto que contenga entre un 2% y un 5% de palabras desconocidas.
Un estudio pionero como el de Laufer (1989) evaluó el porcentaje mínimo de palabras conocidas de un texto informativo que garantizase una puntuación mínima del 55% de respuestas positivas exigible en una prueba de comprensión lectora, para que algunos estudiantes fueran admitidos en la Universidad de Haifa. La tarea inicial que esta investigadora les planteó consistió en subrayar los términos que no entendían del texto. Posteriormente, les pidió que respondieran a preguntas que requerían obtener e interpretar información fáctica y la comprensión de las ideas principales, entre las que había algunas que invitaban a aclarar el significado de determinadas palabras mediante la elaboración de inferencias. Los resultados observaron dos grupos de estudiantes: (a) uno, formado por aquellos que demostraron conocer el 95% o más del vocabulario del texto, al que denominó como “lectores”, que consiguieron dicho porcentaje mínimo del 55% de respuestas positivas en la prueba de comprensión lectora; y (b), otro, que conociendo menos del 95% de las palabras del texto leído, puntuaron en la prueba de comprensión lectora por debajo del 55% de respuestas positivas, y fueron considerados como “no lectores”.
En sus conclusiones, Laufer considera y valora la función compensatoria de mejora de la comprensión si los estudiantes hubieran dispuesto de conocimientos previos sobre el contenido del texto, incluso para aquellos con un umbral léxico inferior al 95%. Un conocimiento que hubiera remediado sus carencias de vocabulario:
“La comprensión lectora de la prosa académica se vea afectada por el conocimiento léxico que se tenga sobre un texto. La posibilidad de convertirse en “lector” es significativamente más alta si la amplitud de vocabulario conocido alcanza al 95% o más de las palabras de un texto, aunque otros factores como el conocimiento de las pistas gramaticales, de la organización textual, y del tópico que el texto aborde puedan facilitar la comprensión de algunos lectores que presenten un léxico limitado». (Laufer, 1989: 319)
Casi diez años después, Laufer (1997) amplió sus conclusiones con un nuevo estudio, indicando que para poder elaborar inferencias contextuales precisas de una palabra desconocida, el lector debería conocer como mínimo el 98% de las palabras de un texto informativo.
Otros investigadores han profundizado en la relación umbral de conocimiento léxico/comprensión lectora, incidiendo igualmente sobre la incidencia que en esta relación tienen los conocimientos previos. Así, con una muestra de 66 adultos y utilizando ahora un texto narrativo, Hu y Nation (2000) evidenciaron que con un 80% de palabras conocidas, es decir, 20 de cada 100 desconocidas (1 de cada 5), ningún estudiante consiguió un nivel satisfactorio de comprensión. Cuando dicho porcentaje se situó en el 90% de palabras conocidas, un pequeño número de ellos obtuvo un cierto nivel de comprensión del texto. Si ese porcentaje alcanzaba el 95%, es decir, 1 palabra desconocida de cada 20, un aún escaso número de estudiantes mejoró su comprensión lectora. Sin embargo, aunque con el 100% de las palabras conocidas la mayoría de los sujetos obtuvo un buen nivel de comprensión, el análisis de regresión utilizado mostró que el 98% de palabras conocidas de un texto (1 desconocida de cada 50 conocidas) era el umbral necesario para que los estudiantes lograran un adecuado nivel de comprensión de la narración. Nation argumentó que estar familiarizado con el 98% del vocabulario de un texto permite al lector leer con fluidez y desarrollar su habilidad para inferir por el contexto el significado de palabras desconocidas.
Más reciente, Schmitt y otros (2011) analizaron la congruencia del umbral léxico que se establece dentro del rango porcentual entre el 95% y el 100% de palabras conocidas, utilizando como materiales de lectura dos textos informativos (uno sobre el clima y otro sobre circuitos de entrenamiento de ratones de laboratorios). Para estos investigadores la relación entre porcentaje de vocabulario mínimo conocido y comprensión lectora de un texto es de naturaleza lineal, dependiente de la dificultad del texto y del nivel requerido para superar cualquier test de comprensión lectora, de tal modo que cuanto mayor sea el número de palabras conocidas, mayor será el grado de comprensión que se alcance. Sus datos mostraron que se daba un incremento del rendimiento en comprensión lectora, definido por las respuestas correctas del test utilizado para evaluar esta habilidad, que se situaban entre el 60% y el 75% y que equivalía a un conocimiento de las palabras de los textos leídos entre el 95% y el 100%. Así, si se demandaba un 60% de respuesta correctas en el test de comprensión lectora el porcentaje mínimo necesario de conocimiento de palabras se situaba en el 95%, mientras que si el logro exigido en comprensión era del 70%, el conocimiento de palabras requerido se ubicaba entre el 98% y el 99%. Finalmente, si el objetivo de comprensión se situaba en el 75% de respuestas pertinentes, los datos mostraron que era necesario conocer el 100% de las palabras de los textos.
El umbral léxico y los conocimientos previos del lector
Al contrastar sus resultados con los de Laufer y Hu & Nation, Schmitt y sus colaboradores comprobaron que un nivel alto de palabras conocidas no aseguraba que todos los estudiantes alcanzaran una buena comprensión. Incluso niveles entre el 98% y el 100% no garantizaron resultados altos en comprensión lectora, lo que explica que el vocabulario es una condición previa necesaria, pero no suficiente para comprender textos informativos. Un análisis más fino de los resultados destacó que la mayor parte del efecto en comprensión lectora se dio en los resultados del alumnado cuyo vocabulario conocido se situaba por encima del 98% y, a la vez, disponían de un buen nivel de conocimientos previos; es decir, de estudiantes que habían construido un lexicón mental cualitativamente profundo. Eran estos estudiantes los que, apoyándose en sus esquemas o marcos mentales de conocimiento, se mostraron más capaces de inferir las palabras que desconocían, no así aquellos que disponían de un lexicón más empobrecido sobre los tópicos que leyeron:
“Una conclusión específica de nuestro estudio es que una alta cobertura de vocabulario es una condición necesaria, pero no suficiente para comprender un texto. Incluso altos niveles de umbral léxico no llevan a un 100% de comprensión. Aunque parece que los lectores necesitan un alto nivel de conocimiento del vocabulario para tener una buena comprensión de los textos académicos usados en este estudio, otros factores como los conocimientos previos son necesarios. Si se supone que la mayoría del profesorado aspira a que el alumnado adquiera un logro en comprensión cercano al 60%, el umbral de conocimiento léxico del 98% es probablemente necesario. De ese modo, el alto umbral del 98% sugerido por Hu & Nation (2000) y Nation (2006) parecen objetivos más razonables que los datos previos estimados del 95%, en especial en casos en donde los estudiantes lean textos informativos”. (Schmitt et al., 2011:39)
Andrés Calero
- y Nation ( 2000 ). Densidad de vocabulario desconocido y comprensión lectora . Lectura en una lengua extranjera , 13 ( 1 ), 403-430 . https://nflrc.hawaii.edu/rfl/item/43 ↵
- Laufer, B. (1989). What percentage of text-lexis is essential for comprehension? En C. Lauren & M. Nordman (Eds.). Special Language: From Humans to Thinking Machines, 316-323. Multilingual Matters. ↵
- Laufer, B. (1997). What´s in a word that makes it hard or easy. Some intralexical factors that affect the learning of words. En N. Smitt & M. McCarthy (Eds.), Vocabulary: Descriptions, acquisition and pedagogy ,140-155. Cambridge University Press. ↵
- Schmitt, N., Xiangying, J. & Grabe, W. (2011). The percentage of words known in a text and reading comprehension. The Modern Language Journal, 95(i), 26-43. doi: 10.1111/j.1540-4781.2011.01146.x. ↵

Sin comentarios