Pues verán. En algún sitio leí que en Estados Unidos acaba de aparecer un libro titulado Nabokov’s Favorite Word Is Mauve, firmado por Ben Blatt.
¿De dónde saca el señor Blatt que la palabra favorita de Nabokov fuera “malva”? Evidentemente, de un estudio. El autor, periodista a la vez que estadístico, o viceversa, ha repasado el canon literario anglosajón sirviéndose del Big Data para desmenuzar el estilo de escritores de renombre. Y señala, por ejemplo, que mientras la primera frase de la mitad de las novelas de Daniele Steel refiere una observación meteorológica, tal circunstancia se da sólo en el 26% de las obras de John Steinbeck. Que frente a quienes prefieren empezar con frases largas (Salman Rushdie o Edith Wharton), otros (Toni Morrison, Margaret Atwood o Mark Twain) son casi siempre partidarios de una frase lapidaria. Y que si bien Hemingway era parco en adverbios (colocaba 80 cada 10.000 palabras), Virginia Woolf recurría a ellos con enorme frecuencia (116/10.000).
El libro de Blatt empieza recuperando un enigma histórico: ¿quién escribió The Federalist Papers? Durante décadas, los historiadores debatieron la identidad del autor, que si Madison, que si Hamilton, hasta que en 1963 unos estadísticos, Mosteller y Wallace, decidieron abordar la cuestión con método y sin prejuicios. Lo hicieron determinando con cuánta frecuencia utilizaban los posibles autores determinadas palabras que sí eran habituales en obras cuya autoría estaba fuera de duda; contando cuántas veces aparecían esas mismas palabras en los ensayos en disputa, y comparando. Al cabo, confirmaron a Madison como autor.
Busco en España
La información sobre el citado trabajo me hizo preguntarme si alguien se habrá ocupado aquí de averiguar cuál es la palabra favorita de Marías. O de Delibes (por si sirve: ando leyendo una novela suya en la que usa abundantemente la palabra “fetén” y la expresión “la fetén”). O de Galdós… ¿Hay un Blatt en la sala de la literatura española?
La respuesta corta es “no”. Lo cual no quiere decir que no se hayan realizado estudios que podrían estar emparentados, porque la estadística estilística no es algo raro por estos lares. Recordemos que, en la polémica sobre la autoría de La Celestina, Menéndez Pidal defendió su tesis diciendo: “Es una arbitrariedad hipercrítica seguir hoy negando la diversidad de autor para el primer auto, cuando está declarada en el prólogo de Rojas, cuando se halla confirmada por un experto en estilos tan fino como Juan de Valdés, contemporáneo y coterráneo de Rojas, y cuando se ve reafirmada modernamente por el examen comparativo de las fuentes literarias y del lenguaje”. Y ese tipo de cuestiones le interesaban mucho a Cándido Pérez Gállego, me dice el catedrático y crítico Santos Sanz Villanueva, quien además me recuerda que el párrafo fue motivo de interés entre los novelistas de comienzos del pasado siglo, quienes se pelearon sobre si mejor corto o largo y sobre los efectos de una u otra opción.
Así, pidiendo ayuda y googleando, llegué a un trabajo titulado Estudios de literatura española de los siglos XIX y XX: homenaje a Juan María Díez Taboada, alguno de cuyos contenidos me dio pistas. Me dirigí a quien firma la presentación, Miguel Ángel Garrido Gallardo, a la sazón director de la Revista de Literatura del Consejo Superior de Investigaciones Científicas (CSIC), quien me puso sobre la pista del profesor de literatura española en la Universidad de Granada, desgraciadamente fallecido, muy interesado por estas cuestiones.
Vicente Sabido, se llamaba, y de él vine a descubrir que fue creador de algo bautizado como LEXI, “una herramienta para el análisis del crecimiento del vocabulario en textos escritos en caracteres ASCII (o sea, los caracteres de las lenguas occidentales o no cuya transcripción se ajuste al código ASCII extendido)”, según explicó el propio Sabido en un trabajo.
No estaba sólo, con él colaboró un colega del departamento de Lenguajes y Sistemas Informáticos de esa misma universidad José María Guirao. “De LEXI hace ya muchos, muchos años, y el programa se perdería –me comenta Guirao–. Hacía un estudio estadístico de la aparición de palabras nuevas con el tiempo, en la obra de un autor. Recuerdo que el autor más original, en este sentido, a los que se aplicó era Borges; en cambio García Lorca estaba siempre con lo mismo”.
La ciencia de las letras
Evidentemente, el análisis estadístico nos permite analizar la obra del autor desde otro punto de vista. "Nos sirve, sobre todo, para determinar el estilo de un autor: la utilización de ciertas palabras con más frecuencia, la longitud de las palabras, la diversidad y riqueza del vocabulario". Lo dice Francisco Javier Girón, académico de número de la Real Academia de Ciencias Exactas, Físicas y Naturales.
En su opinión, la estadística en España, así como el resto de las disciplinas de la matemática desde los años 70 del siglo pasado, “goza actualmente de una envidiable salud”. Es, continúa, una ciencia que se ha introducido en todos los campos del saber hasta el punto de que es difícil encontrar una disciplina en la que no se utilice como herramienta para validar teorías científicas. “Actualmente asistimos al nacimiento y desarrollo de ciertas tecnologías para el análisis masivo de datos como Big Data, data analítica, inteligencia artificial, aprendizaje automático (machine learning) y todas utilizan la estadística como su sustrato”.
El análisis estadístico de características cuantificables, no controlables de forma consciente y propias del autor y no del género, época o editor, la estilometría, es un terreno que Girón ha visitado. En su trabajo parte de la hipótesis de que los escritores utilizan un vocabulario (o una sintaxis) que les es propio, y cuando me intereso por su labor, trae a colación un estudio que realizó hace años sobre "el problema de la autoría de la famosa obra de caballería Tirant lo Blanc, mencionada por Cervantes en el Quijote, una de las pocas obras que se salvaron del escrutinio llevado a cabo por el cura y el barbero. El problema es que no se sabe si la obra la escribió una sola persona, Joanot Martorell, o dos, Martorell y M. J. De Galba. Los especialistas en literatura medieval no se han puesto de acuerdo (sobre todo Martín de Riquer) pero el análisis estadístico señala, casi con certeza, que hay dos autores”.
Incluso sin la ayuda de la estadística
Hay quien hace una aproximación más… digamos literaria a estos asuntos. Como Luis Magrinyà, que cuando recopilaba documentación para Estilo rico, estilo pobre, detectó un montón de tics de escritores, “más lingüísticos-estilísticos que narrativos”, tiende a precisar.
Le pido que recupere algunos ejemplos. “Ponía el caso de ‘pesado’ acompañado de ciertos sustantivos: ‘respiración pesada’, por ejemplo. Unos lo utilizan como sinónimo de respiración ‘agitada’ y otros de respiración ‘lenta’. Y, es curioso, ocurre lo mismo en inglés: ‘heavy’ en este caso vale para los dos significados... y yo me pregunto para qué queremos palabras que signifiquen dos cosas contrarias al mismo tiempo. Pero lo de los significados me interesa menos que el uso de cierto léxico digamos de prestigio que los autores no tienen ni idea de cómo usar y que uno acaba por pensar que en realidad no existe. El caso de ‘tamborilear’ es realmente mutante: unos tamborilean con los dedos una superficie, otros tamborilean la superficie misma, otros tamborilean los dedos sin más, otros hacen que sean los dedos los que tamborilean... En fin, un disparate. La conclusión que se saca, sin embargo, de estos usos metastáticos es sangrante: llevados por un verbo que les suena literario, a veces los autores no hacen más que manifestar lo mucho que se dejan llevar por los tópicos y su ignorancia de la lengua”.
Dice que, de los errores (sintácticos, gramaticales, preposiciones inadecuadas...) que detecta, el que más le preocupa es no saber reconocer la multitud de construcciones fijas que tiene una lengua y que no se pueden tocar. “No se puede tocar ‘tener’ en ‘La fachada tenía tres ventanas’; y sin embargo leemos frecuentemente ‘La fachada poseía tres ventanas’... ‘Dar que hablar’ es ‘dar que hablar’; no puede decirse ‘proporcionar que hablar≈. El empeño de refinamiento de los escritores conduce a un sinfín de tonterías”.
Ver másLos siete magníficos
Lo último de Magrinyà es Intrusos y huéspedes & Habitación doble, donde vuelve a exhibir su conciencia extrema del lenguaje, y a defenderlo de manera lúcida y humorística. Le pregunto si hay alguna palabra, alguna expresión, algún clisé, que le haga pensar en un determinado autor… “Ninguno en especial”, se arranca. Pero… “Pero te confieso que cada vez que buscaba una barbaridad de esas con ínfulas de estilo que te voy comentando (y muchísimas otras) en mi trabajo de documentación para Estilo rico, estilo pobre, había cuatro autores que nunca fallaban: Arturo Pérez Reverte, Carlos Ruiz Zafón, Lorenzo Silva y Jorge Volpi. Zafón, para referirse a un patio interior, dice patio interno; para él, un cuarto de baño normal y corriente es una estancia; etc.”.
Ya puestos, y para despedirnos con brío, le pido que evoque una construcción literaria chocante, un sintagma que, al leerlo, le hiciera parar para maldecir o reír… “Esto, por ejemplo, siempre me ha hecho reír mucho: ‘¿No son ustedes –espetó en el hechizado silencio que sucedió a las palabras finales del canto– los pajes de Pantasilea?’ (Manuel Mújica Láinez, El escarabajo (1982), Plaza y Janés, Barcelona, 1993, pp. 256-257)”.
Espetemos, pues.
Pues verán. En algún sitio leí que en Estados Unidos acaba de aparecer un libro titulado Nabokov’s Favorite Word Is Mauve, firmado por Ben Blatt.