Práctica 7. Análisis con Voyant tools

Para la realización de esta práctica hemos seleccionado tres obras, cuyos textos están digitalizados, para analizar con la herramienta Voyant Tools: La casa de Asterión, de Jorge Luis Borges; Nos han dado la tierra, de Juan Rulfo, y Continuidad de los parques, de Julio Cortázar. Así, a partir de los resultados que nos ha dado esta herramienta, sacamos las siguientes conclusiones.

En primer lugar, este es el resultado que nos da el panel “Cirrus”:



En esta nube de palabras destacamos que las que tienen mayor tamaño son “me”, “llano”, “nada”, “tierra”, “hay”, “a”, “no”, “eso”.  Esta representación visual no solo señala la frecuencia de aparición de cada término, sino que también permite intuir cuáles son los focos temáticos principales que atraviesan los relatos analizados. Nos ha parecido interesante destacar que el hecho de que aparezcan formas como “ni”, “él”, “dice”, lo que sugiere una presencia del yo narrativo y de textos en los que la subjetividad y, sobre todo, la perspectiva del personaje, tienen un papel importante. También aparecen en paralelo las palabras “tierra”, “llano”, “aquí”, “desde” o “pueblo”, algo que nos remite a un entorno concreto, algo coherente, por ejemplo, en cuanto al relato de Rulfo.

El análisis de esta nube no solo permite una lectura rápida de los términos dominantes, sino también la formulación de hipótesis interpretativas sobre los relatos seleccionados. Así, aunque se trate de una visualización basada en datos cuantitativos, su lectura puede abrir nuevas vías para la comprensión temática, simbólica y estilística de los textos.

En segundo lugar, “Sumario” ha dado los siguientes resultados que mostramos en la imagen:

Según estos datos, podemos destacar el número total de palabras del corpus, que es extenso (2627), así como el de palabras únicas (924), lo que indica una riqueza léxica considerable si tenemos en cuenta que se trata de solo tres textos y, además, cortos. El relato más extenso es Nos han dado la tierra, con 1576 palabras, algo esperable teniendo en cuenta su estilo más descriptivo y reflexivo, mientras que La casa de Asterión es el más breve, con apenas 509 palabras.

En cuanto a la densidad del vocabulario, la que más tiene es Continuidad de los parques, (0.520), seguida de La casa de Asterión, con un valor intermedio, mientras que Nos han dado la tierra es el relato con menor densidad (0.355), lo que no implica una pobreza léxica, sino más bien un estilo más oral que el de los textos anteriores, ligado a la voz de personajes populares.

Respecto al promedio de palabras por oración, sigue siendo la ganadora Continuidad de los parques, con una media de 20,1 palabras por oración. En el extremo opuesto, está Nos han dado la tierra, con una media de solo 11,1 palabras por oración, lo cual puede deberse al tono fragmentario y a veces abrupto del narrador de Rulfo.

Por otro lado, el índice de legibilidad (“Readability Index”) más alto lo sigue liderando Continuidad de los parques (10,438), lo que confirma que se trata del texto más elaborado gramaticalmente hablando. Nos han dado la tierra es el más accesible en cuanto a lectura, con un índice de 4,541.

Respecto a las palabras más frecuentes en el corpus, observamos que la más repetida es la preposición “a” (72 veces), seguida de “no” (51), “me” (19), “le” (16) y “nada” (14), lo que nos da pista acerca del tono de los textos. Por ejemplo, la alta presencia de “me” nos dice que el yo narrativo tiene una gran presencia en los textos. Asimismo, en la siguiente imagen tenemos los datos de cada obra individualmente:

Por otro lado, nos gustaría destacar varias cosas del panel "Tendencias". A continuación, podemos ver una imagen de los resultados de este panel:

En este gráfico se analizan las frecuencias relativas de las palabras “a”, “no”, “me”, “le” y “nada” a lo largo de los tres documentos. Por una parte, la palabra “a” se mantiene como la más frecuente; “me” y “le” aumentan progresivamente y “no” tiene un pico en el segundo documento, posiblemente reflejando un cambio en el tono o una intensificación del discurso negativo. Finalmente, “nada”, aunque poco frecuente en los primeros textos, crece en el tercero, lo que podría marcar un cierre más rotundo o pesimista. El gráfico permite observar cómo varía el estilo o el enfoque del texto en distintos momentos.

En cuanto al panel “Contextos”, estos son los resultados que nos ha proporcionado la herramienta Voyant Tools:

En la imagen correspondiente, se observan fragmentos donde la preposición “a”  aparece entre distintos elementos del discurso. La mayoría de los ejemplos pertenecen al documento titulado “Continuidad…” y algunos a “La casa…”. La palabra “a” se usa, sobre todo, para introducir complementos verbales o circunstanciales y se asocia con acciones, lugares y tiempos: “a leer”, “a la puerta”, “a la sombra”, “a esa hora”. Esto refuerza su alta frecuencia en el corpus y su función estructural en la narración.

Finalmente, nos ha parecido de vital importancia destacar el apartado “Líneas de burbuja”, una forma un poco más visual de destacar las palabras que se utilizan con más frecuencia:



Comentarios

Entradas populares