Nanette Rißler-Pipka: Sobre los problemas de investigación con revistas culturales digitalizadas del mundo hispanohablante

  • Posted on: 5 May 2014
  • By: nanette

Hasta casi finales del siglo XX, investigar revistas culturales era una ardua tarea debido a la explosión numérica que se dio tanto en España como en América Latina y, también, por estar archivadas en bibliotecas diseminadas por los continentes. Pero, desde los años 90, la digitalización de libros, de manuscritos y de numerosas revistas culturales nos facilita enormemente el acceso al abundantísimo material para la investigación en la filología hispánica . En este sentido, aunque existen ediciones facsimilares de muchas de las revistas culturales, es evidente que bibliotecas digitales como cervantesvirtual, prensahistorica, Arxiu de Revistes Catalanes Antigues, hemerotecadigital, edaddeplata, etc., nos ofrecen más ventajas en comparación con las ediciones facsimilares o los originales. A continuación expondré algunos ejemplos de trabajo con revistas digitalizadas e indagaré si la búsqueda y la presentación en los portales de internet comportan otro modo diferente de investigar.

En general, la investigación sobre la  base de revistas culturales en español ha aumentado sustancialmente durante los pasados años, como lo apuntan Patricia Artundo y Hanno Ehrlicher (en este volumen), entre otros. Una causa quizá sea el interés de la filología hispánica por un modo de trabajar más interdisciplinario, que incluya y añada cuestiones culturales, sociológicas y etnográficas a las ya tradicionales del campo de las Artes y las Letras. Otra causa pudiera ser la relativamente reciente difusión de revistas ya algo antiguas en internet. No obstante, todavía muchos de los estudios aparecidos en los años pasados utilizan, por regla general, las ediciones facsimilares. Este hecho apunta a que quizá no sea tan fácil como parece trabajar con portales de internet y los materiales digitalizados que proporcionan. O dicho de otra forma, que la transición de los métodos tradicionales a los métodos de las humanidades digitales se realiza lentamente.

1. Las bibliotecas digitales

La primera dificultad suele ser encontrar la revista que buscamos en su forma digitalizada. Pongamos por ejemplo que tenemos una lista de revistas de la Modernidad hispánica y queremos trabajar con una de las que ya se encuentran digitalizadas. Para nuestra búsqueda en internet vamos a seleccionar la revista Luz. ¿Cuál es el primer paso? Si no sabemos que existen bibliotecas digitales, una búsqueda general en la web es una empresa desesperada: los resultados que nos ofrece Google si buscamos “Luz revista” son 74 100. Por lo tanto, la mejor opción es visitar una biblioteca digital en la que esperamos encontrar la revista en cuestión. La Biblioteca Nacional de España ofrece a través de la Hemeroteca Digital un sitio web con una colección de revistas y periódicos en español catalogados de 1683 hasta 1993. Se trata de la colección más amplia en lengua española que incluye también ediciones de América Latina. La selección y la motivación de la Hemeroteca Digital rezan:

El criterio que ha guiado la composición de esta colección ha sido seleccionar periódicos y revistas representativos de su época, que reflejaran la riqueza temática de la edición hemerográfica hispana y de los que se conservaran colecciones completas. Quienes visiten la hemeroteca encontrarán prensa política, satírica, humorística, científica, religiosa, ilustrada, amena, deportiva, artística, literaria, etc. (véase en línea)

Todos los documentos digitalizados a los que se tiene acceso se encuentran en formato PDF; las revistas y los periódicos van acompañados de una descripción informativa. Hay diferentes modos de realizar una búsqueda en la colección de la Hemeroteca Digital: podemos buscar por título, ámbito geográfico, año o fecha, pero también según el contenido de todos los documentos o de las revistas o periódicos seleccionados mediante la opción “documentos que contengan las palabras”.[1] Buscando la revista Luz en el campo “título” obtenemos los nueve resultados que vemos a continuación:

Fig. 1:  Búsqueda de la revista Luz en la Hemeroteca Digital de la BNE (véase en línea)

Sin embargo, entre los resultados no se encuentra la revista Luz (Barcelona 1897–1898), muy conocida en la época del Modernisme catalán. Al parecer la selección de la Hemeroteca Digital no se corresponde con los propósitos de nuestra búsqueda, a pesar de poseer una colección realmente amplia.

Junto a la Hemeroteca Digital de la BNE existe otro portal muy conocido y utilizado: la Biblioteca Virtual Miguel de Cervantes, dirigido, desde 2001, por una fundación de la Universidad de Alicante y Mario Vargas Llosa. En la búsqueda avanzada de este portal existe la posibilidad de elegir el tipo de documento (“revista”) antes de optar por buscar el título Luz. El primero de los 37 resultados es la revista buscada que se encuentra en formato HTML sin un diseño gráfico determinado (cf. fig. 2). Se puede navegar por los textos, que no contienen casi erratas y han sido convertidos correctamente con el proceso de reconocimiento de texto, pero es imposible descargar ejemplares de la revista. Para poder trabajar con el texto, hay que marcarlo y copiarlo. Además, aunque los textos contienen algunas de las imágenes del ejemplar original de la revista, no se han reproducido todas ni se ha respetado la antigua composición gráfica. En definitiva, no se puede hacer un estudio riguroso del aspecto visual real de la revista original.

Fig. 2: La revista Luz (Barcelona 1897–1898) en la Biblioteca Virtual Miguel de Cervantes (véase en línea)

Pero aún cabe otra posibilidad de encontrar la revista en internet. Como sabemos, se trata de una revista catalana de finales del siglo XIX, así que es lógico probar suerte en ARCA de la Biblioteca de Catalunya. En este portal se encuentran más de 309 títulos de revistas y periódicos catalanes cuyo número se irá ampliando en un futuro próximo. La motivación del proyecto se describe en el portal como sigue:

Hacer posible la consulta de colecciones completas de publicacions [sic!] periódicas. Los usuarios podrán acceder a las colecciones completas sin perder tiempo ni esfuerzos en localizarlas y consultarlas en diversas instituciones. (véase sobre “Qué es ARCA” en línea)

No es difícil encontrar la revista que buscamos, Luz, mediante la “búsqueda avanzada”. El resultado se visualiza con las imágenes en miniatura de la portada de todos los ejemplares de la revista (cf. fig. 3).

Fig. 3: Búsqueda de Luz en el portal ARCA (véase en línea)

Mediante un clic se puede seleccionar fácilmente un ejemplar de la revista para trabajar con él. Todas las revistas digitalizadas en este portal gozan de una buena calidad en formato PDF y TXT, pueden apreciarse en su aspecto original mediante formato TIFF (300 dpi) o simplemente como imagen en formato JPEG o texto TXT.[2] También es posible llevar a cabo una búsqueda por palabras clave en cada ejemplar de la revista. Sin embargo, para realizar una búsqueda a través de varios títulos, se tiene que volver a hacer uso de la búsqueda avanzada. Por ejemplo, se puede buscar el nombre de una persona o cualquier otra palabra. Probamos con la búsqueda del nombre “Rubén Darío”, uno de los autores más conocidos del Modernismo. El resultado son 467 aciertos en el total de las revistas digitalizadas en el portal. Afinando la búsqueda, por ejemplo “Rubén Darío AND modernismo” obtenemos solamente 15 resultados, y 10 resultados si la búsqueda contiene la palabra catalana: “Rubén Darío AND modernisme”. También es posible buscar una palabra (o un nombre) acotando los resultados por fecha, por ejemplo “Rubén Darío AND date: 1850–1950”. Obtenemos 9 resultados. Otra modalidad de búsqueda es seleccionar ciertos títulos y buscar solamente en ese contenido. Es decir, buscando un nombre quizá todavía más conocido que Darío, “Picasso”, en toda la base de datos, obtenemos 4 939 resultados. No nos parece práctico analizar aquí todos los resultados. Afinando una vez más la búsqueda, por ejemplo, seleccionando “contributors” en la “búsqueda avanzada” el número de resultados disminuye a 6 (los seis ejemplares de la revista Arte Joven que Picasso editó junto con Francisco de Asís Soler), porque, aparentemente, “contributors” aquí no significa autor sino únicamente editor. Queda opaca la razón por la que en la “búsqueda avanzada” del portal no aparece ningún resultado si seleccionamos la opción “publisher” o “creator” y buscamos los nombres de Darío, Picasso o cualquier otro de autor conocido en las publicaciones del portal (cf. fig. 4).[3]

Resumiendo los resultados de este portal, sin olvidar que es uno de los mejores, tenemos que apuntar que si bien es posible hacer una búsqueda de contenidos en diferentes títulos a la vez, sin embargo, si queremos averiguar simplemente cuáles han sido  las revistas en las que ha contribuido un autor o artista conocido no obtenemos ningún resultado fiable.

Fig. 4: Lista de selección en la “búsqueda avanzada” de ARCA (véase en línea)

Probablemente, por lo que se refiere al aspecto técnico y desde el punto de vista de las humanidades digitales, el portal de internet de revistas españolas más avanzado tal vez sea “Revistas de la Edad de Plata”. Con un número de revistas digitalizadas limitado a 32 títulos, el portal no dispone de la misma extensión que una biblioteca como ARCA o la Hemeroteca Digital, sin embargo, los datos están bien organizados. Hay dos modos de trabajar en el portal: con el “navegador visual” y el “publicador”. En la segunda opción encontramos la totalidad de revistas digitalizadas reseñadas en un índice por orden alfabético (también existe un índice de autores, un índice de revistas–autores y un índice de autores–revistas, cf. fig. 5).

Fig. 5: El Publicador de Revistas está dividido en tres partes: a la izquierda los índices y las opciones de búsqueda, en medio el texto transcrito y a la derecha se muestra el original (véase en línea)

En este portal se encuentran los autores más conocidos y las revistas más relevantes de las vanguardias españolas, aunque, como mencioné, limitadas a 32 títulos y a los ejemplares pertenecientes al periodo que va de1917 hasta 1944 (con alguna excepción como las ediciones retrospectivas de los años 1960 o 1970). No se da razón de la selección y en algunos casos los datos bibliográficos concretos no se revelan. Solamente la presentación de la Residencia de Estudiantes, el operador del portal, nos aclara acaso la intención de la selección:

El portal Edad de Plata está dedicado a la difusión de la cultura española del periodo 1868–1936. Es una iniciativa de la Residencia de Estudiantes (Madrid) en colaboración con otros centros culturales especializados. Ofrece acceso a los catálogos y documentos de los centros participantes, a ediciones digitales y a otros recursos multimedia derivados de su actividad. (véase en línea)

A pesar de los inconvenientes, la búsqueda en el índice autores–revistas y viceversa representa una ventaja singular en comparación con otros portales. Con un simple vistazo podemos ver a los autores que colaboraron en un título seleccionado o las contribuciones de un autor en todas las revistas digitalizadas del portal. Sin embargo, se echa en falta un índice artista–revista y viceversa. Numerosos artistas de la época colaboraron en las revistas y publicaron sus obras gráficas o fotografías de sus obras en los títulos contenidos en el portal, y no aparecen en la lista del “publicador”. La búsqueda revela también las restricciones que supone la selección de revistas presente aquí: los autores españoles de vanguardia (Creacionismo, Ultraísmo, Generación del 27) tienen mucha más representación que los autores latinoamericanos o los autores de la Generación del 98 o del Modernismo. Por ejemplo, la búsqueda por Rubén Darío, Jorge Luis Borges o Alejo Carpentier da solamente uno o dos resultados por cada autor: Darío (La Gaceta Literaria, 1928 y 1930), Borges (La Gaceta Literaria, 1927–28 y Ultra, 1921–22), Carpentier (Octubre, 1933), frente a Rafael Alberti que contribuyó en 19 de las 32 revistas digitalizadas en el portal.

La otra forma de trabajar con el portal, la opción “navegador visual”, es de más ayuda si queremos visualizar la interacción entre autores, revistas y grupos de vanguardia. Se pueden visualizar las actividades y las personas, grupos, obras, revistas y artículos relacionados. Por ejemplo, buscando el nombre de Rafael Alberti en el campo “personas” aparece un esquema circular: en el centro el autor, el objeto de la búsqueda, alrededor sus obras, las revistas en las que colaboró y los grupos en los que fue miembro activo. Los resultados también se indican con cifras en un recuadro informativo a la derecha (cf. fig. 6). El número de resultados aquí es todavía mayor que en la opción de búsqueda con el “publicador”. Comprende 44 revistas y 48 artículos (y 46 obras y 3 grupos), sin embargo, surgen dudas relevantes: ¿qué se esconde detrás de la lista de títulos? ¿Dónde se originan las informaciones sobre la obra y las actividades del autor? Siguiendo con el ejemplo de Alberti, solo las 19 revistas y sus artículos que ya aparecían en la opción del “publicador” se enlazan con la fuente original: haciendo clic sobre la opción de la derecha “ver artículo” se vuelve a la revista digitalizada de la opción “publicador”. El resto de títulos (revistas, obras, etc.) carecen de fecha y cualquier otra indicación bibliográfica. Además, el término “obra” engloba poemas, antologías y otras categorías (por ejemplo, el poema “Venus en ascensor” es parte de la antología “Cal y Canto” que, asimismo, aparece en el listado del mismo gráfico). Aún así, el esquema dinámico supone una ventaja considerable.

Fig. 6: La opción “navegador visual” en Revistas de la Edad de Plata tras buscar “Rafael Alberti” en el campo “personas” (véase en línea)

El esquema circular cambia de forma y contenido cuando cliqueamos sobre uno de los iconos (grupo, revista, artículo u obra) para mostrar otra interacción. Tras cliquear sobre la revista Litoral, por ejemplo, aparece en el centro de la diana dicha revista y algunos de los autores y artículos en los anillos que lo rodean. Como nos indica el recuadro informativo a la derecha de la página, la base de datos cuenta en conjunto con 52 autores y 79 artículos relacionados con Litoral. En este caso, como no caben todos los elementos a la vez en el esquema visual, hay que hacer rotar el anillo correspondiente para ir visualizando todo lo que contiene la base de datos (cf. fig. 7). Si seleccionamos un artículo (o un dibujo) y la opción “ver artículo” en el recuadro de la derecha, se abre la ventana del “publicador” en el que se muestra la información.

Fig. 7: El “navegador visual” de Revistas de la Edad de la Plata tras buscar Litoral (véase en línea)

Como en el caso de las herramientas de búsqueda nombradas con anterioridad, también estas presentan algunos problemas si se observa con detalle el funcionamiento del portal. Busquemos, por ejemplo, el nombre de Ignacio Sánchez Mejías, menos conocido como autor que como torero (su fama literaria de debe sobre todo a la elegía que García Lorca le dedicara en 1935 tras su trágica muerte, “Llanto por la muerte de Ignacio Sánchez Mejías”, y no tanto a su colaboración directa con la Generación del 27). El resultado de la búsqueda por el autor–torero en el “navegador visual” lista 4 obras, 1 grupo (la Generación del 27) y 1 artículo titulado “Diálogo” (en la revista Hojas de Poesía). Sin embargo, la opción “ver artículo” de la derecha muestra un artículo incompleto y sin imagen original (cf. fig. 8).

Solamente si persistimos en la búsqueda mediante el “publicador” obtendremos el artículo completo. Ni en el índice de autores, ni en el índice autores–revistas y tampoco en la “búsqueda general” encontramos a Ignacio Sánchez Mejías y su “Diálogo”. Sin embargo, el índice de la revista Hojas de Poesía nos muestra un artículo con el título “El torero y el toro” (época 1, año 1935, abril, núm. 2) y cuyo autor no se reseña; tal vez sea esta la pista correcta a seguir (cf. fig. 9).

Fig. 8: Resultado del enlace entre el “navegador visual” y el “publicador” en la opción de búsqueda de “Sánchez Mejías” (véase en línea)

Fig. 9: Artículo completo de Ignacio Sánchez Mejías en el “publicador” (véase en línea). Esta dirección en la web, copiada de la misma página, no sólo lleva a un mensaje de error, es la misma que la de la fig. 9.

Se trata de un problema de falso enlace, algo que aunque es usual en internet no por ello deja de resultar frustrante cuando queremos trabajar con el portal Revistas de la Edad de la Plata. Otro problema del portal se presenta cuando queremos guardar o imprimir algún ejemplar de una revista: no existe posibilidad alguna de descargar un ejemplar completo. Solo existe la opción de guardar páginas aisladas de la revista en formato de imagen JPEG o el texto, esto en dos pasos diferentes, lo cual supone una tarea demasiado ardua si se trata de investigar más de un ejemplar de una misma revista.

Las ventajas de trabajar con el portal “Revistas de la Edad de Plata” son, en cualquier caso, mayores. En definitiva, los textos transcritos no contienen las erratas que ya hemos mencionado en el caso del proceso de transcripción OCR (Reconocimiento óptico de caracteres). En comparación con el portal ARCA de la Biblioteca de Catalunya, los textos de las Revistas de la Edad de Plata se pueden leer perfectamente. ARCA, probablemente, aplique el método OCR sin corregir los textos posteriormente; la consecuencia es que los textos son solamente legibles en formato PDF, no así en TXT. En el campo de las humanidades digitales contar con textos “correctos” es una herramienta indispensable. Por esta razón, el portal Revistas de la Edad de Plata aventaja al resto, excepto en la opción de poder descargarlos. Otra ventaja importante es la visualización de la interacción entre los autores y las revistas (grupos y obras) en la opción de “navegador visual”, ya que el modo de trabajar y de investigar cambia sustancialmente con esta forma esquemática de visualización. El investigador no lee una revista completa, sino que hojea varios títulos o busca un autor, una revista o un grupo y sus interacciones con otros. A colación de este hecho nos preguntamos en el siguiente apartado cuál es la diferencia entre un análisis de las revistas culturales modernas antes y después de la digitalización.

2. Un cambio en la forma de investigar

El comparatista estadounidense Franco Moretti de la Universidad de Stanford dirige un ‘laboratorio’ de literatura (LitLab) con el que quiere instaurar su propia disciplina en el contexto de las humanidades digitales. Para ello se apoya, sobre todo, en el discurso que él mismo desató a principios del nuevo milenio con la propuesta de sustituir el close reading por un distant reading. De esta manera, Moretti construye una oposición entre ambos términos, innecesaria, como veremos más adelante.

Su primer argumento se apoya  en el hecho de que las novelas inglesas del siglo XIX no se han analizado en toda su extensión:

[...] we all work on: a canon of two hundred novels […] less than one per cent of the novels that were actually published: twenty thousand, thirty, more, no one knows—and close reading won’t help here (Moretti 2005, 4).

El mismo argumento se puede utilizar en nuestro caso: leer más que 100 000 ejemplares de revistas supera las capacidades humanas. Existen métodos y herramientas de distant reading o macroanalysis (Jockers) para analizar textos sin la necesidad de leerlos, aunque estos métodos no tienen un estatus exclusivo. Las cuestiones que se planten en el marco de la investigación son diferentes, pero no se excluyen unas a otras, sino que se complementan. ¿Qué labor desempeñan las herramientas del macroanalysis en concreto? Al fin y al cabo no hacen sino contar palabras y visualizar los resultados en gráficos. Son métodos estadísticos que ya existían antes del ordenador en el campo del análisis del estilo literario (“estilometría”) y del análisis cuantitativo de textos (Jannidis; Schöch).[4] En la actualidad, con las herramientas estadísticas y los textos digitalizados, los métodos del distant reading y el macroanalysis han aumentado y se desarrollan continuamente. Tratan problemas respecto a la atribución del autor,[5] del género o cualquier otra clasificación. Uno de los estudios más conocidos mediante este método es el análisis de los artículos periodísticos del Ferderalist Papers (Mosteller / Wallace), escritos por tres autores diferentes y firmados con el pseudónimo de Publius. Parece tratarse del mismo material por el que nos interesamos, los artículos periodísticos, aunque en este caso los textos traten todos el mismo tema, la unión de los Estados norteamericanos, y tienen casi la misma longitud: “But researchers rarely find such well-defined and well-controlled problems” (Jockers, 68).

En el caso de las revistas culturales modernas, los documentos que analizamos no están nada “bien definidos”, aunque también se trate del resultado de un trabajo colectivo. Considerando que las revistas son el trabajo de un grupo de artistas y de autores, y que se trata de un medio que combina diferentes medios y géneros (texto e imagen: literatura, arte, música, arquitectura, publicidad, moda, deporte, etc.), se plantean otras cuestiones. Como ya han subrayado Annick Louis y Patricia Artundo, debemos observar la revista en su contexto (de producción y recepción) y en su totalidad física (Artundo, 12; Louis en este volumen). Annick Louis diferencia entre la lectura intensiva y la extensiva, términos que hacen recordar el close y el distant reading, aunque se trate de dos modos de leer sin ayuda técnica. La lectura intensiva se refiere a la lectura de los textos en la actualidad, la que “permite percibir las repeticiones, las comunicaciones internas y las redes que atraviesan una publicación”; la lectura extensiva, en cambio, es la lectura en el mismo marco de la Modernidad, una lectura obligadamente “fragmentaria” que no da a “conocer la totalidad de la revista” (Louis en este volumen). Los conceptos de Artundo y Louis son valiosos y retoman la idea contemporánea de Guillermo de Torre sobre el análisis de las revistas culturales modernas (de Torre, 24–25), aunque no pueden resolver el problema sobre cómo analizar más de 700 títulos y 100 000 ejemplares de revistas. Guillermo de Torre en su estudio, por ejemplo, compara solamente 10 títulos de revistas (cf. las revistas Germinal, Vida Nueva, Vida Literaria, Revista Nueva, Juventud, Arte Joven, La República de las Letras, Alma Española, Electra, Helios) y las califica de representativas (de Torre, 21). La selección depende, en definitiva, del interés y de la lectura especializada del investigador; el problema es idéntico trabajando con las humanidades digitales que cuentan con métodos digitales.[6] Sin embargo, la posibilidad de comparar 700 ejemplares de revistas entre sí abre nuevas cuestiones y planteamientos.

La cuestión planteada por Annick Louis, por ejemplo, respecto a cómo se recorren las “redes que atraviesan una publicación”, requiere un análisis que conste de numerosos títulos de revistas con datos (o metadatos) sobre los autores y editores, artículos y ejemplares, fechas y lugares de producción. Son cuestiones que pueden parecer insignificantes, tales como ¿qué autor escribe en qué revista, cuándo y dónde? El ordenador nos puede ayudar a reunir, contabilizar y relacionar estos metadatos y, en una segunda fase, a visualizar las relaciones en un mapa o un gráfico. Como ha mostrado el ejemplo del portal “Revistas de Edad de Plata”, la visualización de los encadenamientos entre autor, revista, artículo, obras y grupos permite una nueva lectura. Existen herramientas incluso más avanzadas, como el DARIAH–Geobrowser, que puede visualizar también las relaciones transatlánticas (cf. fig. 10 y 11). No existen datos suficientes para comprobar el funcionamiento del Geobrowser con las revistas culturales en español, sin embargo, sabemos que hay muchas relaciones entre las revistas y sus autores en América Latina y en España; un mapa de estas actividades quizá sea muy interesante, también para valorar la influencia de las revistas como medio más ágil en su difusión que el libro.

 

Fig. 10: Ejemplo de visualización con el DARIAH–Geobrowser: publicaciones de Shakespeare en el mapamundi.

Fig. 11: Ejemplo de visualización con el DARIAH–Geobrowser: las publicaciones de Shakespeare en un eje temporal (cf. ambos gráficos aquí)

La visualización de los metadatos supone solamente una primera opción. Otra es trabajar con los textos de las diferentes revistas. Sin embargo, en el contexto de las revistas culturales modernas en español no nos interesan las cuestiones ya tratadas por Mosteller y Wallace como, por ejemplo, quién ha escrito qué texto o los editoriales anónimos. Aún así, los métodos estadísticos y el análisis del estilo podrían ser útiles para comparar los estilos de revistas entre sí o para diferenciar los géneros de los textos en las revistas. Un ejemplo muy conocido, aunque poco aprovechable para nuestro análisis, es el “voyant–tool” que reproduce los gráficos “wordles” o “nubes de palabras” (muy utilizados en numerosas páginas web) y gráficos de otro tipo:

 

Fig. 12: Ejemplo de la comparación de textos de las revistas Arte Joven (1901, todos los números) y Luz (1897, los cuatro primeros números) con “voyant–tools

Después de eliminar los “stop–words” o “palabras vacías” de los textos, vemos muy claramente que “arte” es la palabra más frecuente; asimismo, con las palabras “vida”, “mujer”, “señor” y “mundo” podemos también observar la tendencia de los temas que se tratan en los ejemplares de ambas revistas. En el diagrama de la derecha de la página (“Word Trends”) podemos ver en qué textos y con qué frecuencia aparecen las palabras seleccionadas (aquí: “arte”, “vida”, “mujer”). En los primeros números de Arte Joven se habla más de “arte” y “vida”, mientras que “mujer” es más utilizado en el segundo número de la revista Luz. Si leemos la palabra en su contexto (visualizado en el centro de la página), podemos descubrir el género de texto del que se trata (artículo, poesía, teatro, prosa), a pesar de que la navegación a través del texto íntegro no sea fácil con esta herramienta. Los resultados no son nada sorprendentes, pero teniéndolos en el formato TXT siempre existe la posibilidad de observar la tendencia en los temas más relevantes de las revistas.[7]

Pese a todo, la revista cultural no parece ser apropiada para ser sometida a un análisis de estilo con las herramientas estadísticas, como lo hacen Jockers, Moretti y otros, ya que los textos publicados en ese tipo de revistas no están “bien definidos”, sino que reúnen muchos géneros de textos diferentes y aun inventan géneros nuevos, por ejemplo, el editorial, el comentario y la reseña, entre otros. Además, todas las herramientas aplicadas a las humanidades digitales analizan solamente el texto o la imagen, y la revista cultural es por definición un medio que reúne texto e imagen (presentación tipográfica, ilustración, cómic, anuncio, fotografía, pintura). Una tarea quizás interesante en un futuro sea analizar las relaciones entre estos medios y el cambio que sufren ciertas revistas que empiezan a tener apariencia de libro (por ejemplo Helios, 1903–1904) o la revista vanguardista, que experimenta con la tipografía y las imágenes (por ejemplo Ultra, 1921–1922). En definitiva carecemos de una herramienta que sería muy útil para contabilizar textos e imágenes y ordenarlos automáticamente por géneros. Los resultados visualizados en mapas o gráficos abrirían nuevas posibilidades de investigación en múltiples disciplinas indicándonos cuáles son las revistas más extraordinarias dignas de un análisis más detallado. Además, la interpretación de los resultados producto de un ordenador requieren una lectura crítica (según Stephen Ramsay, algorithmic criticism) que combina los métodos del close reading con el del distant reading:

If algorithmic criticism is to have a central hermeneutical tenet, it is this: that the narrowing constraints of computational logic —the irreducible tendency of the computer toward enumeration, measurement, and verification —are fully compatible with the goals of criticism set forth above (Ramsay, s. p.).

No se trata de descartar los métodos tradicionales tales como el close reading, sino de enriquecerlos y alterarlos transformando los textos y los documentos mediante el ordenador, métodos que Ramsay y otros comparan a la extrañeza que produjeran los textos vanguardistas.[8] Y es que también en el caso de las revistas culturales de la Modernidad los experimentos con la tipografía y la imagen nos hacen verlas y leerlas de forma diferente:

 

 

Fig. 13: La portada de la revista Ultra (núm. 1, enero 1921), (digitalizada en línea)

Bibliografía

Artundo, Patricia (2010): “Reflexiones en torno a un nuevo objeto de estudio: las revistas”. En: IX Congreso Argentino de Hispanistas, 27 al 30 de abril de 2010: El hispanismo ante el bicentenario. La Plata, Argentina, pp. 1­–15. Disponible en línea.

Ehrlicher, Hanno (2008): ”Das aufgegebene Anonymat. Kritische Anmerkungen zu einer philologischen Kanonrevision aus aktuellem Anlass“. En: PHiN 46, pp. 1–13. Disponible en línea.

― (2014a): “Introducción”. En: Hanno Ehrlicher/ Nanette Rißler-Pipka (eds.): Almacenes de un tiempo en fuga: Revistas culturales en la modernidad hispánica. Aachen: Shaker, pp. 1-10.

― (2014b): “El intento de desocultar al autor del Lazarillo y la productividad de su ocultamiento: sobre los valores de un anonimato histórico”. En: Le Guellec, Maud (ed.): El autor oculto en la literatura española. Madrid: Casa de Velázquez, pp. 63–75.

Jannidis, Fotis (1999): ”Was ist Computerphililogie?“. En: Jahrbuch für Computerphilologie, Jb 1. Disponible en línea.

Jockers, Matthew L. (2013): Macroanalysis, Digital Methods and Literary History. Urbana: University of Illinois.

López, Freddy (2011): “Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina”. En: Revista Colombiana de Estadística, vol. 34, núm. 1, pp. 15–37.

López-Escobedo, Fernanda / Méndez-Cruz, Carlos-Francisco / Sierra, Gerardo / Solórzano-Soto, Julián (2013): “Analysis of Stylometric Variables in Long and Short Texts”. En: Procedia — Social and Behavioral Sciences 95, pp. 604–611.

Louis, Annick (2014): “Las revistas literarias como objeto de estudio”. En: Hanno Ehrlicher/ Nanette Rißler-Pipka (eds.): Almacenes de un tiempo en fuga: Revistas culturales en la modernidad hispánica. Aachen: Shaker, pp. 31-58.

Madrigal, José Luis (2008): “Notas sobre la autoría del Lazarillo”. En: Lemir 12, pp. 137–236.

(2009): “Tirso, Lope y el Quijote de Avellaneda”. En: Lemir 13, pp. 191–250.

Manovich, Lev (2012): “How to Compare One Million Images?”. En: Berry, David (ed.): Understanding Digital Humanities. New York: Palgrave, pp. 249–278.

Moretti, Franco (2005): ­­Graphs, Maps, Trees: Abstract Models for Literary History. London: Verso.

― (2013): Distant Reading, London: Verso.

Mosteller, Charles Frederick / Wallace, David (1964): Inference and Disputed Authorship: The Federalist. Reading, Mass.: Addison–Wesley.

Navarro Durán, Rosa (2003): Alfonso de Valdés, autor del Lazarillo de Tormes. Madrid: Gredos.

Ramsay, Stephen (2008): “Algorithmic Criticism”. En: Schreibman, Susan / Siemens, Ray (ed.): A Companion to Digital Literary Studies. Oxford: Blackwell. Disponible en línea. [id. Ramsay, Stephen (2011): Reading Machines. Toward an Algorithmic Criticism. Urbana, Illinois: Ill. University Press,]

Schöch, Christof (2014): ”Corneille, Molière et les autres. Stilometrische Analysen zu Autorschaft und Gattungszugehörigkeit im französischen Theater der Klassik“. En: Schöch, Christof / Schneider, Lars (eds.): Literaturwissenschaft im digitalen Medienwandel, Beiheft zu PhiN (Philologie im Netz), pp. 130–157. Disponible en línea.

Suárez Figaredo, Enrique (2010): “Un apunte al artículo ‘Tirso, Lope y el Quijote de Avellaneda’ de José Luis Madrigal”. En: Lemir 14, pp. 9–26.

Torre, Guillermo de (1969): Del 98 al Barroco. Madrid: Gredos.

Enlaces adicionales

Ø  Por una lista de las bibliotecas digitales véase aquí.

Ø  Por más información sobre las herramientas de las humanidades digitales en el mundo hispanohablante véase los portales “Humanidades Digitalea Hispánicas” o “Red de Humanidades Digitales



[1]     Representa un problema en la búsqueda en el documento completo, en este portal y en otros, la mala calidad de los documentos digitalizados y convertidos en textos mediante OCR (Reconocimiento óptico de caracteres): los textos no suelen ser correctos en su ortografía, puntuación o gramática. Pongamos como ejemplo un extracto de la Gaceta literaria (Madrid 1927), 15/3/1927, núm. 6, 5: “^f^^uje£%TEimm^^u^ ENTREACTO Lo esencial en el teatro sería la decoración puesta, si la decoración no existiese como exis¿Se puede hablar do Don Juan…” (véase en línea). Curiosamente el texto entero aparece solamente cuando hacemos la búsqueda por palabras, no cuando buscamos por el título de una revista.

[2]     Desgraciadamente la buena calidad se refiere solamente a las imágenes. El reconocimiento de texto no tiene la misma calidad, más bien es comparable o peor al portal de la Hemeroteca Digital (cf. nota 1). Tomemos como ejemplo un texto de Luz, Año 1, núm. 1 (15 nov. 1897): “SALUDO Á LA PnENSA. ..1190( clir2 zu inaugurar nuestras tareas, cúmplenos, ante tobo, el beber be cortesía,…”(véase en línea).

[3]     La respuesta del portal a mi pregunta fue: “Como verá estos campos no se corresponden exactamente con la catalogación de la revista en el catálogo de la Biblioteca de Cataluña porque se refieren a la digitalización”.

[4]     Schöch atribuye los principios del análisis del estilo a Augustus de Morgan (1851) (Schöch, 133).

[5]     En el marco de la literatura española del Siglo de Oro existen varios debates respecto a la atribución del autor. Sin embargo, los investigadores no utilizan para sus análisis las herramientas nuevas, sino que trabajan con métodos tradicionales que no tienen en cuenta los límites de los datos estadísticos, dependientes de selección e interpretación. Véase Navarro Durán y Madrigal 2008 y 2009, también las respuestas críticas de Ehrlicher 2008 y 2014b y Suárez Figaredo. Madrigal, por ejemplo, usa únicamente una lista que incluye las 10 palabras más frecuentes; en la actualidad se analiza mediante listas de 800 y más palabras, dependiendo de la materia y del planteamiento, incluso al principio de la instauración de estos métodos se usaban listas de las 30‑60 palabras más frecuentes (Schöch, 136). De ahí la crítica de Suárez Figaredo a Madrigal: “se trata de divergencias por lo general inferiores al 0,01 pu, o 1 %” (Suárez Figaredo, 10). Un planteamiento mucho más complejo y avanzado es el de López-Escobedo et al. o López.

[6]     Stephen Ramsay subraya el punto convergente  de las ciencias naturales y las humanidades, la perspectiva subjetiva: “No serious scientist could ever deny that interpretation, disagreement, and debate are at the core of the scientific method. But science differs significantly from the humanities in that it seeks singular answers to the problems under discussion” (Ramsay, s. p.).

[7]     Permanece el problema consistente en que los textos completos de las revistas digitalizadas no están bien convertidos o sólo existen como imagen o documento PDF.

[8]     Ramsay habla de la transformación del texto producido en el ordenador como: “the effect is not the immediate apprehension of knowledge, but instead what the Russian Formalists called ostranenie — the estrangement and defamiliarization of textuality” (Ramsay, s. p.). Lev Manovich también cita la Vanguardia para apoyar su tesis que defiende que las visualizaciones del ordenador están cambiando nuestra percepción como también lo hicieron en su momento las vanguardias (Manovich, 277).

Nanette Rißler-Pipka (Universidad de Augsburgo)