Cómo no usar una nube de palabras. El discurso de Pedro Castillo

Hoy Pedro Castillo ha sido proclamado presidente de Perú y en las redes ya han aparecido las nubes de palabras resumiendo su discurso. ¿Qué son? ¿Cómo se usan? ¿Sirven para algo?

Las nubes de palabras son una forma de visualización de datos (en este caso, las palabras de un texto son los datos). Para hacer una nube, es necesario contar las palabras usando algún programa de computadora: las palabras que se repiten más veces tienen un mayor tamaño dentro de la nube; las palabras que se repiten menos probablemente no aparecen o no son visibles.

Las nubes ofrecen un resumen visual del texto, el cual es fácil y rápido de entender. Pero no proponen un análisis, porque no explican el contexto. Y como sabemos los investigadores literarios, no se puede analizar un libro en el vacío: el texto se explica por sus relaciones con los hechos sociales, las tendencias culturales u otros textos. Por ejemplo, en el caso del mensaje presidencial de Castillo, las palabras más repetidas son ‘nacional’, ‘salud’, ‘país’, ‘Perú’, ‘pueblo’ y ‘gobierno’: términos previsibles en un mensaje presidencial, un tipo de discurso bastante fijo que gira sobre los mismos temas cada año.

Imagen tomada de https://twitter.com/50mas1/status/1420451828848812037

En otras palabras, las nubes de palabras en este caso no dicen mucho o no dicen nada.

* * *

Voy a hacer algunos cambios a la visualización para realizar un verdadero análisis del discurso. Sigo usando un enfoque cuantitativo (el análisis se basa en contar las palabras), pero ubico el mensaje de Castillo en contexto: lo comparo con los primeros mensajes presidenciales de Toledo, García, Humala y Kuczynski (todos ellos presidentes peruanos como resultado de elecciones democráticas). Utilizo el programa en línea Voyant y, si quieren reproducir el análisis, pueden descargar los textos aquí.

Antes del análisis, un paso fundamental es eliminar las palabras que no tienen significado, como conectores o preposiciones, para no obtener un gráfico como este:

Imagen tomada de http://utero.pe/2021/07/28/los-anuncios-mas-importantes-del-discurso-del-bicentenario-de-pedro-castillo/

Esta nube de palabras nos dice que la palabra más repetida es ‘del’. Sin comentarios. (No siempre es necesario eliminar esos términos: se puede entender el estilo de un escritor por cómo usa los conectores; pero esa es otra historia).

Cuando analizamos los 5 discursos, Voyant cuenta las palabras en cada texto, pero no compara la cantidad de repeticiones, porque esto no explicaría la relevancia de los términos.

Imaginemos que ‘libertad’ aparece 20 veces en Texto 1; mientras la misma palabra aparece 40 veces en Texto 2. Nuestra primera intuición dice que ‘libertad’ es más relevante en Texto 2, e imaginaríamos explicaciones para este hecho: el texto se preocupa por la libertad; el texto tiene un enfoque humanista; el texto busca la liberación de los pueblos oprimidos; etcétera. Error de errores.

La relevancia de un término en el discurso solo se puede determinar cuando se conoce la extensión del texto (la cantidad total de palabras). Texto 1 es un discurso corto de 100 palabras, por lo que ‘libertad’ se repite frecuentemente; en cambio, Texto 2 tiene 1000 palabras: en proporción, ‘libertad’ aparece menos veces y se pierde en el conjunto de los otros términos. Este factor tiene el nombre de Frecuencia Relativa: ‘libertad’ tiene una frecuencia de 0.2 en Texto 1 (20/100) y una frecuencia de 0.04 en Texto 2 (40/1000). En palabras sencillas, el término es en realidad más relevante en Texto 1 que en Texto 2 (se obtiene el resultado opuesto si equivocadamente consideramos solo la cantidad de veces que aparece una palabra).

Toda la estadística que he intentado explicar en los párrafos anteriores, se entiende mucho mejor si observamos el siguiente gráfico:

En la imagen, se visualiza la utilización de las palabras ‘país’, ‘todos’ y ‘pueblo’ en los mensajes presidenciales. A la izquierda (el eje Y), se encuentra la Frecuencia Relativa del término; los 5 discursos están ordenados cronológicamente en la parte inferior (el eje X).

En redes, he visto las críticas al discurso de Castillo por su uso constante de la palabra ‘pueblo’ (críticas sin sentido, por cierto). En perspectiva, el término es una constante en los mensajes presidenciales, con cierta relevancia en el caso de Alan García y Ollanta Humala (es simbólico que Kuczynski sea quien menos usa la palabra). Sin embargo, los presidentes han preferido utilizar ‘país’ y ‘todos’ para referirse al conjunto de la población peruana, mientras que los 3 términos confluyen y se igualan en el caso de Castillo. Esto revela el público a quien dirige su discurso, así como una estrategia retórica.

Un término que resalta en las nubes de palabras sobre el discurso de Castillo es ‘salud’, lo cual tiene sentido por el contexto de la pandemia. Cuando lo comparamos con otros mensajes presidenciales, se entiende que la salud es tan o más importante que la economía para los gobiernos. Esto también es retórico, en el sentido de vacío o falto de contenido, ya que la pandemia reveló lo poco que se avanzó en un servicio de salud pública, universal y equitativo. La frecuencia superlativa de la palabra en el discurso de Kuczynski se explica por la influencia de su padre, el médico Maxime Kuczynski.

* * *

La mejor forma de resumir un mensaje presidencial y, al mismo tiempo, visualizar las propuestas que lo diferencian de otros discursos es enfocarse en las Palabras Diferenciadas, los términos que distinguen un texto de los otros.  

Por ejemplo, la palabra ‘protección’ revela la función que tendrá el estado durante el gobierno de Castillo, una función propia de un ideario de izquierda. Asimismo, ‘constituyente’ llama la atención sobre la principal propuesta del presidente: una nueva constitución a través de una asamblea constituyente. Finalmente, me niego a analizar por qué ‘amigas’ tiene un lugar tan importante en el discurso de Toledo.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s