Digital Humanities

the Programming Historian, parte II

Seguimos con la traducción de algunos capítulos del libro The Programming Historian, de William J. Turkel, Adam Crymble y Alan MacEachern.
Ahora vamos con el capítulo 4.

Haciendo uso de sus capacidades para una lectura atenta

Desde ahora, vamos a ver más y más ejemplos de código. Trate de crearse el hábito de leer cada uno muy bien, de mismo modo en que lee una importante fuente primaria. Si hay algo en el código que nunca vio antes o no comprende, trate de hacer una hipótesis explícita acerca de cómo debe funcionar. A veces, su hipótesis será correcta y otras no, pero es mucho más fácil hacer progresos si es consciente de sus conjeturas. Ese es también el modo que deberá asumir cuando comience a corregir errores (debug) de programas que no funcionan. Una de las ventajas que tienen los historiadores tienen cuando se ponen a programar es que ya están habituados a la interrogación de fuentes en lugar de tomarlas en sentido literal.

Enviando información a archivos de texto

En las secciones previas, vimos cómo enviar información al panel “Command Output” (panel de salida) del editor Komodo, al utilizar el comando de Python print.

print 'hola mundo'

El lenguaje de programación Python es orientado a objetos. Esto quiere decir que está construido alrededor de un tipo especial de entidad, un objeto, que contiene tanto datos como un número de métodos para acceder y procesar esos datos. En el ejemplo de arriba, vemos un tipo de objeto, la cadena (string) hola mundo. Un objeto cadena es una secuencia de caracteres; aprenderemos más sobre métodos de cadenas pronto. Print es un comando que imprime objetos de modo textual.
Usará print en los casos donde quiera crear información que necesita de inmediato. A veces, de todos modos, usted creará información que quiera guardar, enviar a alguien más, o usar como “input” para ulteriores procesamientos por otros programas o grupos de programas. En esos casos usted querrá enviar información a archivos en su disco duro en lugar de hacerlo al panel “Command Output”. Ingrese el siguiente programa en la ventana principal del Komodo y guárdelo como arch-salida.py

# arch-salida.py
f = open('holamundo.txt','w')
f.write('hola mundo')
f.close()

En ese programa f es un objeto archivo, y open, write y close son métodos de archivos. En el método open, holamundo.txt es el nombre del archivo que usted está creando, y el parámetro w dice que usted está abriendo ese archivo en modo escritura (write). Note que tanto el nombre del archivo como el parámetro son cadenas en este caso. Su programa escribe el mensaje (otra cadena) en el archivo y luego lo cierra. (Para más información sobre estas órdenes, ver la sección File Objects en la Librería de Referencia Python.)
Haga doble click en el botón “Run Python” para ejecutar el programa. Aunque nada se imprima en el panel “Command Output”, puede ver un mensaje de estado que dice [en Windows] 'C:\Python25\Python.exe arch-salida.py' returned 0. Esto significa que su programa fue ejecutado con éxito. Si usa File->Open->File en el editor Komodo, puede abrir el archivo holamundo.txt. Este deberá contener su mensaje de una línea:

hola mundo

Puesto que los archivos de texto incluyen un mínimo monto de información de formato, ellos tienden a ser pequeños, fáciles de intercambiar entre plataformas diferentes (i.e, desde Windows a Linux o Mac o viceversa), y fáciles de enviar de un software a otro. Además, pueden ser usualmente leídos por quienes tengan un editor de texto como el Komodo.

Obteniendo información desde archivos de texto

Python tiene además comandos que le permiten obtener información desde archivos. Tipee el siguiente programa en el Komodo y guárdelo como arch-entrada.py. Cuando lo ejecute haciendo doble click en “Run Python”, abrirá el archivo de texto, leerá el mensaje de una línea e imprimirá el mismo mensaje en el panel “Command Output”.

# arch-salida.py
f = open('holamundo.txt','r')
mensaje = f.read()
print mensaje
f.close()

En este caso, el parámetro r es usado para indicar que estamos abriendo un archivo para leerlo (read). Read es otro método de archivo. El contenido del archivo (el mensaje de una sola línea) es copiado en mensaje, que es una cadena (string), y luego el comando print es utilizado para enviar el contenido de mensaje al panel de salida de Komodo.

Dividiendo código en módulos y funciones

A menudo querrá utilizar nuevamente un grupo de commandos, generalmente porque tiene una tarea que debe realizar una y otra vez. Supongamos, por ejemplo, que usted tiene que mantener todas sus referencias bibliográficas en Zotero y tiene una etiqueta que le indica cuáles necesita en su próximo viaje a la biblioteca. Resultaría muy útil tener un programa que seleccione sólo aquellos ítems etiquetados y los ordene por número topográfico.
Dado que eso forma parte de sus actividades de investigación, usted querrá tener disponible el programa para reutilizar en cada visita a la biblioteca. Un programa, en otras palabras, es un mecanismo para empaquetar una colección de comandos para facilitar su reutilización. Zotero mismo es un paquete de comandos útiles, como también lo es Firefox.
Cuando los programas son pequeños se guardan, generalmente, en un archivo único. Cuando quiere correr uno de esos programas, simplemente envía ese archivo al intérprete. Cuando los programas se hacen muy largos, tiene sentido dividirlos en archivos separados conocidos como módulos. Básicamente, la modularización permite a los programadores reutilizar código para tareas que realizan muchas veces. Más abajo, por ejemplo, puede ver que los comandos para trabajar con páginas web han sido puestos en un módulo de Python aparte. Python posee un comando especial, import que permite que un programa acceda a los contenidos de otro archivo de programa. (Como tendrá que trabajar con los ejemplos de más abajo, asegúrese de haber comprendido la diferencia entre cargar un archivo de datos (loading) e importar un archivo de programa (import).)
Hilando fino se puede decir que los programas están compuestos por rutinas que son potencialmente reutilizables. Estas son conocidas como funciones, y Python posee mecanismos que permiten definir nuevas funciones. Vamos a trabajar con un ejemplo muy simple de función y módulo. Supongamos que queremos crear una función con el propósito general de saludar personas. Copie la siguiente definición de función en el Komodo y guárdela como saludo.py. Ese archivo es su módulo.

# saludo.py
def saludogral (x):
    print "hola " + x

Advierta que la indentación es muy importante en Python. Los espacios en blanco antes del comando print le dicen al intérprete que eso es parte de una función que está siendo definida. Usted podrá aprender más sobre esto a medidas que avancemos. Por ahora, asegúrese de mantener la indentación tal como se lo mostramos.
Ahora puede crear otro programa que importe código desde su módulo y haga uso de él. Copie este código en el Komodo y guárdelo como usando-saludo.py. Este archivo es su programa.

# usando-saludo.py
import saludo
saludo.saludogral("a todos")
saludo.saludogral("programming historian")

Puede corer su usando-saludo.py con el commando Run Python que usted creó en el Komodo. Note que no puede correr su módulo…sólo puedo llamarlo desde su programa. (Como habrá podido advertir en este ejemplo y en los previos, las cadenas en Python pueden delimitarse con comillas simples o dobles. Es verdad.) Si todo va bien, usted verá:

hola a todos
hola programming historian

en el panel de salida del Komodo Edit.

Podemos pensar acerca de la “granularidad” del código de dos modos:
. De arriba hacia abajo. Si usted piensa en todas las cosas para las que quiere usar la computadora, puede descomponer el problema en recurrentes subproblemas. Necesita trabajar con archivos (sistema operativo), documentos (procesador de textos), números (planillas de cálculo), imágenes (programa de procesamiento de imágenes), páginas web (browser) y así sucesivamente. Cualquier programa deberá poder abrir, manipular y guardar archivos. Usted puede querer tener la capacidad para chequear la ortografía, puede querer requerir algún tipo de diccionario y la capacidad para buscar cada palabra en él. Buscar palabras implica estar en condiciones de comparar palabras letra por letra. Cada tarea puede ser dividida en otras más pequeñas.
. De abajo hacia arriba. Supongamos que usted comienza con una tarea simple, como sumar dos números entre sí (a+b). En cuanto aprenda a hacerlo, será posible generalizar su habilidad para sumar números entre sí (a+b)+c=(a+b+c). De la suma usted puede llegar a la multiplicación (a*3)=(a+a+a). Una vez que pudo convertir la suma de números en una útil función, puede recurrirse a esta constantemente. Su sistema operativo necesita de la adición para determinar cuánto espacio disponible existe en su disco rígido. Su procesador de texto necesita de la suma para mantener el conteo de las palabras y de las páginas, su planilla de cálculo necesitará mucho de la suma. Útiles “ladrillos” como los de la suma pueden ser combinados y recombinados a cualquier nivel de complejidad.

Acerca de las URLs

Una página web es un archivo que está guardado en otra computadora, una máquina conocida como servidor web. Cuando usted ‘entra’ a una página lo que en verdad sucede es que su computadora, el cliente, envía una petición al servidor que se encuentra en la red, y el servidor responde enviando una copia de la página solicitada a su máquina. Una manera de acceder a una página web con su browser es siguiendo un link de algún sitio. También puede, claro, pegar o tipear una Uniform Resource Locator (URL). La URL le dice a su browser dónde encontrar un recurso online especificándole el servidor, el directorio y el nombre del archivo que quiere recuperar, así como también el tipo de protocolo que el servidor y su browser podrán usar para intercambiar información (como HTTP, “Hypertext Transfer Protocol”). La estructura básica de una URL es

protocolo: //servidor : puerto /ruta ?consulta

Miremos algunos ejemplos.

http://niche.uwo.ca

El tipo más básico de URL simplemente especifica el protocolo y el servidor. Si le da esa URL a su browser, este le devolverá la página principal de sitio NiCHE. Lo que se asume es que la página principal de un determinado directorio se denomina index, a menudo index.html. El sitio NiCHE está escrito en un lenguaje distinto a HTML, pero de todos modos, el nombre de la página principal es index.php (PHP es otro lenguaje de programación web. Si le interesa conocer más sobre el mismo, hay un W3 Schools tutorial).
La URL también puede incluir un número de puerto. Sin entrar en demasiados detalles en este punto, el protocolo de red que soporta el intercambio de información en internet permite que las computadoras se conecten de distintas maneras. Generalmente, el puerto por defecto para HTTP es 80. La siguiente URL es equivalente a la primera:

http://niche.uwo.ca:80

Como sabemos, generalmente hay muchas páginas en un determinado sitio web. Ellas están guardadas en directorios del servidor, y usted puede especificar la ruta de una página en particular. La tabla de contenidos de este libro sigue la siguiente URL (note que no necesitamos mencionar el nombre de archivo ya que también en este caso es index.php.

http://niche.uwo.ca/programming-historian/

Finalmente, algunas páginas web permiten que ingresemos consultas. El sitio web NiCHE, por ejemplo, está dispuesto de tal manera que permite que solicitemos una página en particular usando una cadena de consulta. La siguiente URL nos lleva a la página principal de la infraestructura digital de NiCHE.

http://niche.uwo.ca/?q=node/12

Abriendo URLs con Python

Con el fin de cosechar y procesar automáticamente páginas web, necesitaremos poder abrir URLs con nuestros propios programas. El lenguaje Python incluye varios procedimientos para hacerlo.
Para dar un ejemplo, vamos a trabajar con un tipo de archivo que podemos encontrar cuando hacemos una investigación histórica. Digamos que usted está interesado en [N.T.: Este ejemplo lo ponemos nosotros porque el original tuvo problemas de acceso] Álvar Núñez Cabeza de Vaca, el inefable explorador y tremendo escritor. Con Google podemos localizar una entrada sobre Cabeza de Vaca en The Handbook of Texas Online.

Cabeza de Vaca



La URL para esa entrada es:

http://www.tshaonline.org/handbook/online/articles/CC/fca6.html

Mirando la página nos enteramos que hay una versión para imprimir de esa entrada:

Cabeza de Vaca



La URL es:

http://www.tshaonline.org/handbook/online/articles/CC/fca6_print.html

Cuando procesamos recursos de la web automáticamente a menudo resulta una buena idea trabajar con versiones para imprimir, ya que estas tienden a estar menos formateadas.
Ahora vamos a probar abrir la versión para imprimir de esa entrada. Copiamos el siguiente programa en el Komodo y lo guardamos con abrir-html.py. Cuando lo ejecutemos, el programa abrirá el archivo biográfico, leerá su contenido y lo guardará en una cadena de Python llamada por nosotros html y luego imprimirá los primeros trescientos caracteres de la cadena en el panel “Command Output” del Komodo. Use el comando View -> Page Source en Firefox para verificar que el código fuente HTML de la página es el mismo que el código que su programa recuperó. (Para conocer más sobre la librería urllib2, ver la biblioteca de referencia Python en esta sección.)

# abrir-html.py
import urllib2
url = ' http://www.tshaonline.org/handbook/online/articles/CC/fca6_print.html '
respuesta = urllib2.urlopen(url)
html = respuesta.read()
print html[0:300]

Guardando una copia local de una página web

Ya que usted sabe cómo escribir archivos, es fácil modificar el programa de arriba para que escriba el contenido de la cadena html en un archivo local en lugar de hacerlo en el panel “Command Output” del Komodo. Copie el siguiente programa en el Komodo, guárdelo como guardar-html.py y ejecútelo. Usando el comando File -> Open File en el Firefox, abra el archivo local que fue creado (‘fca6.html’) para confirmar que su copia es la misma que la copia online.

# guardar-html.py
import urllib2
url = ' http://www.tshaonline.org/handbook/online/articles/CC/fca6_print.html '
respuesta = urllib2.urlopen(url)
html = respuesta.read()
f = open('fca6.html', 'w')
f.write(html)
f.close

Entonces, si ya puede guardar un archivo tan fácilmente, ¿puede escribir un programa para bajar un montón de archivos? Puede aumentar las letras y los números del nombre de las páginas del Handbook, por ejemplo, y hacer sus propias copias de un montón de ellas. Sí. Ya lo veremos.

***

the Programming Historian, parte I

Algo habíamos mencionado aquí en Tapera, hace algún tiempo, pero sin prestarle la atención debida. Bill Turkell detuvo "Digital History Hacks" -uno de los blogs más importantes en historia digital- pero casi al mismo tiempo comenzó a publicar un libro en formato wiki: The Programming Historian. (Los autores son William J. Turkel, Adam Crymble y Alan MacEachern. El libro se publica bajo el auspicio del departmento de historia de la University of Western Ontario y NiCHE: Network in Canadian History & Environment). El libro es una especie de tutorial políglota (utilizada distintos lenguajes, diferentes programas) para aprender a programar. Aunque por ahora su fuerte es Python. Python es un tremendo lenguaje de programación orientado a objetos, bastante intuitivo para, por ejemplo, trabajar con textos, pero también abierto y gratuito, y, además, poblado de librerías con funciones para distintas especialidades.
No sé qué tan útil resulta conocer cierto lenguajes de programación a los historiadores o a los cientistas sociales; supongo que mucho en la medida en que las bibliotecas son cada vez más digitales. Supongo que en el terreno de la docencia el conocimiento de estas lenguas posee un altísimo potencial. Lo cierto es que, en la actualidad, vendrían bien tutoriales sobre base de datos: muchísimas investigaciones encajan en ese género o trabajan con esa metodología, sin embargo mucho menos del 1% de esos trabajos nos dice cómo hicieron para procesar sus datos. Y esto no se debe al arte marcial de la economía narrativa; se debe a que sencillamente sus autores no lo saben. Pero sigamos con el Programming Historian, que está muy bueno.
La traducción que hacemos aquí es por pedazos y por cierto bastante precaria. Ojalá aprenda algún día.
Hay un índice, el punto 1 ("Acerca de este libro"),el punto 2 ("¿Es necesario aprender a programar?"). Nosotros vamos directo al punto 3,

Empezando

A fin de estudiar los métodos en este libro, necesitará bajar e instalar software de acceso libre. Tanto como se pueda, trataremos de hacer todo compatible con máquinas con Linux, Mac o Windows. Suponemos que la mayoría de nuestros lectores probablemente utilizan Windows, por lo que primero trataremos de que funcione bajo Windows XP, luego en Mac y finalmente bajo Linux. Estaremos complacidos en incluir instrucciones para plataformas específicas, especialmente si nos las envían. También incluiremos críticas y comentarios de pares en la página de discusión de secciones específicas. Pueden leerse esos comentarios clickeando la solapa discussion en el borde superior de esta y otras páginas wiki. Si tiene problemas con nuestras instrucciones o encuentra que algo no funciona en su plataforma, por favor avísenos.

Dado que es un trabajo muy en progreso, ocasionalmente haremos comentarios e indicaremos algunas cosas que son provisionales en color púrpura

.

Instrucciones para Windows XP [en el original hay instrucciones para Linux y Mac] * Haga un back up de su PC.
* Si aún no lo está usando, instale el browser Firefox.
* Instale las siguientes extensiones del Firefox
*Web developer toolbar
* Extension Developer’s Extension

Si está usando Firefox 3 no podrá instalar esta extensión por razones de seguridad. Saltee este ítem por ahora. Hay más información en la página de discusión

.
* Si todavía no lo usa, instale Zotero.
* Vaya al sitio de Python, baje la última versión estable del lenguaje de programación Python (versión 2.5.2 de abril de 2008) e instálela.
* Instale las siguientes librerías de Pyhton:
*Baje la última versión de Beatiful Soup y cópiela en el directorio de librerías de Python (usualmente C:\Python25\Lib).
* Instale Komodo Edit.
* Ejecute Komodo Edit. Verá algo así.



* Si no ve el panel Toolbox en el costado derecho, elija View –> Tabs –> Toolbox. No importa si el panel Project está abierto o no. Toma algo de tiempo familiarizarse con el diseño del editor Komodo. El archivo de Ayuda es bastante bueno.
* Ahora necesita configurar el editor para que pueda correr programas en Python.
* Elija Edit –> Preferences. Esto abrirá una nueva ventana de diálogo.
* Seleccione la categoría Python y establezca el 'Default Python Interpreter' (este suele ser C:\Python25\Python.exe).
* Si todo se ve como esto, haga un click en OK.



* Luego elija Toolbox –> Add –> New Command. Esto abrirá una nueva ventana de diálogo. Renombre su comando a “Run Python”. Bajo “Command”, use el menú de cascada para seleccionar

% (python) %f

Y bajo “Start in”, ingrese

% D

* Nota: Si olvida el %f en el primer commando, Python se colgará misteriosamente porque no recibirá un programa como entrada.
* Si todo se ve así, clickee en OK.



* Su nuevo comando aparecerá en el panel Toolbox.
Nota: Algunas personas han reportado que tuvieron que resetear la máquina antes de que Python pueda trabajar con Komodo.

'Hola mundo' en Python

Es tradición comenzar la programación en un nuevo entorno tratando de crear un programa que diga “hola mundo” y finalice. Para mantener nuestro acercamiento políglota a la programación, haremos eso de diferentes maneras, utilizando distintos lenguajes de progamación [N.T.: nosotros no lo haremos, esos desarrollos pueden seguirse en la versión original] Los lenguajes que utilizaremos son todos interpretados. Esto significa que hay un programa especial (conocido como intérprete) que sabe cómo seguir las instrucciones escritas en tal lenguaje. Una manera de usar el intérprete es guardar todas las instrucciones en un archivo y luego ejecutar al intérprete sobre ese archivo. Un archivo que contiene instrucciones de un lenguaje de programación es conocido como un programa. El intérprete ejecutará cada una de esas instrucciones que usted escribió en su programa y luego parará. Vamos a probar esto.
En Komodo, cree un nuevo archivo, ingrese las siguientes dos líneas de programación y guárdelas como hola-mundo.py

# hola-mundo.py
print 'hola mundo'

Entonces podrá hacer doble click en el botón “Run Python” -que usted creó en los pasos previos- para ejecutar su programa. Si toda va bien, podrá ver algo así:



Advierta que el resultado de su programa fue impreso en el panel “Command Output”.
Otro modo de interactuar con un intérprete es usarlo como lo que se conoce por Shell (interfase). Puede tipear una orden y presionar luego la tecla Enter, y el intérprete responderá a su comando. Usar una interfase es una buena manera de testear órdenes para asegurarse de que ellas hagan lo que usted piensa que harán.
Puede acceder a la interfase de Python haciendo doble click en C:\Python25\python.exe. Una nueva ventana se abrirá en su pantalla.
En la ventana de la interfase tipee:

print 'hola mundo'

y presione Enter . La computadora responderá con

hola mundo

Cuando representemos una interacción con la interfase, usaremos -> para indicar que la interfase respondió a su comando, como se muestra abajo:

print 'hola mundo'
-> hola mundo

En su pantalla esto se verá más o menos así:



La razón por la que nosotros usamos Python para muchas de nuestras tareas de programación es que Python es un lenguaje de muy alto nivel. Permite, en otras palabaras, escribir programas cortos y efectivos. Cuanto más corto el programa, más probable que este quepa en una pantalla, y de ese modo es más fácil hacer el seguimiento de la rutina.

***

Le siguen otras secciones que no traducimos: [haga copia de su trabajo][manténgase en contacto][otros recursos] y [lecturas recomendadas] La próxima sección es "Trabajando con archivos y páginas webs". Veremos cuándo está lista su traducción.

Mitología del blog: recorrido para no iniciados

Post cruzado desde Clionauta

En efecto, éste es más o menos el título del artículo incluido en la sección "From the Intersections: History and New Media" del numero de mayo de Perspectives on History. Su autor es Jeffrey N. Wasserstrom, profesor de historia en la University of California at Irvine, quien bloguea con asiduidad para The China Beat y Huffington Post . Además de otras cosas, es el editor del Journal of Asian Studies y su obras más recientes son Global Shanghai, 1850–2010: A History in Fragment (Routledge, 2008) y China in 2008: A Year of Great Significance (Rowman & Littlefield, 2009). Esto nos dice:

Para algunos lectores de esta revista, la palabra "blog" -término derivado de "web log" y que ahora se utiliza para referirse a todo tipo de lugares- probablemente evoca la imagen narcisista, auto-confesional, del escritor que le da vueltas a sus manías. Así que permítanme comenzar con algunos datos personales, una confesión y una manía. Los detalles: enseño sobre China y contribuyo regularmente a un blog de grupo. La confesión: hasta hace un año y medio, nunca había blogueado ni leído blogs. La cosa que no soporto (que no sorprenderá a quienes hayan repasado mi "Eurocentrism and Its Discontents” aparecido en Perspectives en enero de 2001): los ensayos que se centran en fenómenos globales, como los blogs, y hacen generalizaciones que sirven para la Estados Unidos y Europa occidental, pero no necesariamente para el resto del mundo. (Lo que sigue, de hecho, comenzó como una carta de queja desencadenada por un ensayo, por otro lado admirable, aparecido en la New York Review of Books sobre los blogs, aquejado precisamente de ese defecto). Así, al leer lo que sigue, hay que tener en cuenta: (1) Se oirá hablar mucho de China – y no precisamente mal si se curiosea en la web, ya que ese país cuenta ahora con más usuarios de Internet que cualquier otro. (2) La categoría de "historiador no iniciado" del título me incluye a mi, al menos hasta mediados de 2007. (3) Muchos de los conceptos erroneos que quiero desacreditar son cosas que yo creía hasta hace poco -aunque 18 meses en la blogosfera (donde el tiempo pasa tan rápido que es mejor calcularlo en años chinos) no es realmente un período tan corto .
Malentendido 1: Todos los bloggers parlotean sobre sí mismos, se confiesan y despotrican contra esto o lo otro. Algunos lo hacen, pero no todos. Tomemos, por ejemplo, el equipo responsable de China Digital Times (lema: “The revolution will be blogged”). Es un sitio excelente que se dedica a poner al día a sus lectores sobre la política china.
Malentendido 2: Todos los blogs incluyen eslóganes que son una monada. Algunos lo hacen. El del blog de grupo al que pertenezco, por ejemplo, el de The China Beat es “Blogging How the East is Read”, que nos gusta pensar que es inteligente. Para otros ejemplos, véase la entrada “The Best Website Taglines Around the Internet” —en particular, “The Straight Dope: Fighting Ignorance since 1973 (It’s taking longer than we thought)”— en el Daily Blog Tips. Muchos blogs, sin embargo, no tienen ese tipo de eslóganes, incluido Daily Blog Tips.
Malentendido 3: Lo de los blogs es una moda que tarde o temprano se acabará, por lo que podemos ignorar el fenómeno y esperar a que pase. Eso nadie lo sabe. Parece dudoso, sin embargo, que los blogs vayan a desaparecer pronto. Además, últimamente se han convertido en una parte cada vez más importante del panorama político e intelectual. Para los historiadores, hay blogs que forman parte de un portal dedicado a la disciplina, como el History News Network de Rick Shenkman, o vinculados a nuestras organizaciones profesionales (la AHA, por ejemplo). Muchas (quizás todas) editoriales universitarias los tienen. Incluso el venerable Times Literary Supplement (de Londres), estandarte tradicional, tiene dos: el Don's Life de la clasicista Mary Beard y el epónimo de su editor Peter Stothard, ambos sin eslógan. Cierto que la New York Review of Books no tiene uno propio, sino que está asociado a "NYRB Classics" . Sin embargo, New Yorker tiene varios (incluido uno excelente sobre China de Evan Osnos) y la sección New York Times Sunday Book Review acoge un excelente Paper Cuts , de modo que la NYRB pronto podría seguir el ejemplo. De hecho, en su edición de 14 de febrero de 2009 apareció un largo ensayo sobre los blogs escrito por Sarah Boxer.
Malentendido 4: "[Una entrada en un blog] está disponible para cualquier persona con una conexión a Internet". Esta es una de las líneas del artículo de Boxer que no comparto. ¿Por qué? Porque muchos internautas chinos tienen vedados muchos blogs. Esto se debe al mecanismo de censura que los peridistas occidentales habitualmente llaman el "Gran Cortafuegos de China", pero que uno de mis bloguers favoritos, Jeremy Goldkorn, ha denominado el "Net Nanny", un término que capta muy bien los esfuerzos por parte del gobierno chino por dirigir a los usuarios hacia determinados sitios de Internet y mantenerlos alejados de los demás. Además, no sólo es un problema chino. Por otra parte, hay algunos que están protegidos con contraseñas o están bloqueados por edades.
Malentendido 5: Los libros y los blogs son tan diferentes que lo novedoso de la publicación de la antología de Boxer era como lo de "hombre muerde a perro". Así es como Boxer presentó su Ultimate Blogs en el ensayo para la NYRB, explicando cómo había llegado a la idea de hacer la antología, a pesar de verlo de entrada como una "terrible" perspectiva. Thomas Jones, escribiendo sobre Boxer en la edidión del 24 de enero de la London Review of Books, comienza: "Libros y blogs, si hacen su trabajo correctamente, son tan diferentes como lo puedan ser dos tipos de textos impresos". Considera a Ultimate Blogs "un temprano aspirante al libro más inútil del año." Lo único que quiero señalar es que los lectores chinos verán esta forma de ver las cosas un poco extraña. Ellos saben perfectamente que escribir libros y escribir blogs pueden ser tareas muy diferentes, aunque se hayan acostumbrado a que se recopilen las entradas en tapa dura. En Occidente, se han producido suficientes libros basados en blogs como para que se haya acvuñado un término ( "blooks") y haya un premio para los mejores ( "Premio Blooker"). Algunos incluso se han vendido bien, aunque es un género menor propio del mercado anglosajón. Pero la cosa va a más. Por ejemplo, China in 2008: A Year of Great Significance, una antología basada en el citado The China Beat que contiene también materiales de otras publicaciones y ensayos nuevos. Está coeditado por Kate Merkel-Hess, Kenneth Pomeranz y yo mismo (con la asistencia de Miri Kim), y con un prólogo de Jonathan Spence, expresidente de la AHA.
Malentendido 6: Lo del blogging es para los jóvenes. Esta es una idea tentadora para alguien de mi edad. Pasados los 45, como hice hace unos años, cualquier posibilidad de ser considerado "joven" empieza a parecerme estupenda. Además, algunos de los bloggers que he mencionado anteriormente tienen mi edad.
Malentendido 7: El blog es lo último en escritura en línea. De hecho, los más jóvenes creen que los blogs son realizados por personas que son mayores de lo que realmente son. Ellos prefieren las formas de comunicación que permitan una interacción mucho más rápida entre los participantes de la que se produce a través de la sección de comentarios de un blog normal, y piensan que los blogs que no permiten hacer comentarios o que son moderados son estrictamente aburridos. Prefieren el chat, Facebook o Twitter. Aunque he sido escéptico sobre esto, creo que hay que saber más sobre cómo funciona exactamente, ya que algunos de los bloggers que más admiro , como Rebecca MacKinnon y su Rconversation, han comenzado a combinar los blogs con tweeting.
Malentendido 8: Los académicos y otros intelectuales que se pasan a los blogs están llamando la atención de quienes tienen problemas para conseguir publicar en formatos más tradicionales. Seguramente esto es cierto a veces. Pero Mary Beard mantiene activo un blog y también publica ensayos y libros a ritmo prodigioso. Y en términos de llamar la atención, a veces la motivación de un blog es reclamar la atención de las publicaciones impresas. Este fue sin duda el caso de mi iniciación como blogger. Mi primer post fue para la "Campaign for the American Reader", blog del que me he convertido en adicto. Cuando me invitaron a participar en su "Writers Read", acepté por varias razones: me halagaba; me daba la oportunidad de hablar de escritores de cuya lectura me había beneficiado; acababa de publicar mi primer libro, China’s Brave New World—And Other Tales for Global Times (Indiana University Press, 2007), y estaba preocupado por si no tenía lectores.
Malentendido 9: El blog académico es un lujo para los que tienen una plaza fija. Hay peligros en la práctica del blogging, especialmente si no no tiene una plaza. Puede que uno dedique demasiado tiempo a los blogs en lugar de hacer otras cosas, o puede que uno haga comentarios inadecuados en el ciberespacio que se vuelvan contra sí mismo. Aquellos de nosotros que enseñamos a los estudiantes graduados o a ayudantes deberíamos señalarles los riesgos. Dicho esto, no creo que necesariamente debamos alentarles a que se olviden del blog. Al fin y al cabo, la musculación de la escritura puede mejorar con diversos tipos de ejercicios textuales. Y, con pragmatismo, a veces al que hace un blog le ocurren cosas buenas. Hay dos ejemplos, ciertamente bastante atípicos, que me vienen a la mente. En la UC Irvine, tenemos algo llamado "Schaeffer Fellowships" que se dan a estudiantes que demuestran un don para la "no-ficción creativa" o, simplemente, tienen cierta habilidad para escribir con estilo, incluso tratándose de cuestiones académicas. Una reciente ganadora procede del departamento de historia, Jana Remy, que obtuvo el premio por la calidad de sus blogs en sitios como Making History Podcast: The Blog, una iniciativa que desarrolló para explorar enfoques experimentales en la narrativa histórica (entre los asuntos tratados está la labor de Laurel Thatcher Ulrich, presidenta de la AHA). También sé del caso de otra graduada local que ha sido invitada a escribir reseñas de libros para una prominente revista literaria después que su blog sobre libros impresionara a uno de los editores de esa publicación.
Malentendido 10: Los Bloggers piensan que todo se puede reducir a un ranking de los diez primeros. Esto no es cierto. He utilizado aquí este formato popular, pero en The Beat China nuestras listas tienden a ser sólo de la mitad.

Las humanidades digitales en 2008 (3)

Post cruzado desde Clionauta

Tras la primera y la segunda, Lisa Spiro examina en esta última entrega la evolución de la investigación en las humanidades digitales.

1) Retos y oportunidades de la investigación
¿Cuáles son algunos de los principales desafíos? Destacados especialistas abordaron esta cuestión cuando la NEH y CLIR convocaron un taller sobre Promoting Digital Scholarship: Formulating Research Challenges In the Humanities, Social Sciences and Computation. Antes del seminario, seis especialistas de diversas areas escribieron breves reseñas sobre sus respectivos campos y sobre las formas en las que la tecnología de la información podría ayudarles. Los ensayos promueven la conversación y la colaboración interdisciplinarias, y además son amenos.
Veamos algunas conclusiones:
1. Global Humanistic Studies: Both Caroline Levander y Greg Crane, Alison Babeu, David Bamman, Lisa Cerrato, y Rashmi Singhal pregonan una especie de estudios humanísticos globales, ya sea concibiendo los American studies desde una perspectiva hemisférica o volviendo a examinar las guerras médicas desde el punto de vista persa. Los académicos que trabajan en este campo se enfrentan a importantes desafíos, tales como la necesidad de leer textos en varios idiomas y comprender múltiples contextos culturales. Las nuevas tecnologías prometen ayudarnos a abordar estos problemas. Por ejemplo, las herramientas de traducción y de apoyo a la lectura pueden ayudar a dar sentido a obras que de otra forma serían inaccesibles; las herramientas de visualización pueden permitir que los investigadores "exploren el dinamismo espacial y temporal"; el trabajo colaborativo permite compartir las tareas, y las ideas, enfocando un complejo problema de investigación desde múltiples perspectivas. Además, favorecer las bases de datos de acceso libre permitirá identificar más fácilmente y construir un trabajo relevante. Para Greg Crane, por ejemplo, "al vincular automáticamente la flexión de las palabras en un texto para el análisis lingüístico y las entradas de un diccionario, permitimos a los lectores que dediquen más tiempo a pensar en el texto que fue posible a través de los diccionarios impresos". Véase un ejemplo del campo de la historia:Global Middle Ages.

2. ¿Qué habilidades necesitan los estudiosos de humanidades? Doug Oard sugiere que las humanidades deberían colaborar con los científicos para definir y abordar los problemas y retos, de modo que el desarrollo de nuevas tecnologías se base en necesidades académicas reales . En última instancia, "los estudiosos de las humanidades van a necesitar aprender un poco de teoría de la probabilidad" a fin de comprender la exactitud de los métodos para el procesamiento automático de datos, la "ciencia del tal vez." ¿De qué manera la teoría de la probabilidad se conjuga con las tradiciones humanistas de la ambigüedad y la interpretación ? Y ¿cómo aprenderemos estas habilidades?
Según el simposio, entre los principales retos para la investigación de las humanidades digitales se incluyen:
1. “Scale and the poverty of abundance”: el desarrollo de herramientas y métodos para hacer frente al aluvión de datos, incluyendo la minería y análisis de textos, visualización, gestión de datos y de almacenamiento, y la sostenibilidad.

2. Representar el tiempo y el espacio: entender la forma de apoyar el análisis geo-temporal y permitir que el análisis esté documentado, se preserve y reproduzca.
3. Redes sociales y economía de la atención: la comprensión de los comportamientos de la investigación en línea, análisis de corpus textuales a partir de estas conductas (por ejemplo, redes de citas)
4. El establecimiento de una infraestructura de investigación que facilite el acceso, la colaboración interdisciplinaria y la sostenibilidad. Como preguntó un participante, "¿cuál es el Protein Data Bank de las humanidades? "

2) High performance computing: visualización, modelado, minería de textos
¿Cuáles son algunas de las más prometedoras áreas de investigación en las humanidades digitales? En cierto sentido, los tres últimos ganadores de la NEH/DOE’s High Performance Computing Initiative definen tres principales áreas y demuestran cómo la informática puede abrir nuevos enfoques en la investigación humanística.

* Minería y análisis de textos: Para su proyecto de "Large-Scale Learning and the Automatic Analysis of Historical Texts", la Perseus Digital Library de la Tufts University examina cómo las palabras latinas y griegas han cambiado con el tiempo mediante la comparación de la estructura lingüística de textos clásicos con obras escritas en los últimos 2000 años. En el comunicado de prensa que anunciaba los ganadores, David Bamman, investigador de lingüística computacional del Perseus Project, señaló que el "high performance computing nos permite hacer preguntas a una escala que no hemos sido capaces de plantearnos antes . Seremos capaces de seguir los cambios del griego desde la época de Homero a la Edad Media. Vamos a ser capaces de comparar las obras de John Milton en el siglo XVII con las de Virgilio, que fueron escritas en torno al cambio de milenio, y tratar de encontrar automáticamente los lugares en donde El Paraíso perdido alude a la Eneida, aunque una esté escrita en inglés y otra en latín".

* Modelado 3D: Para su “High Performance Computing for Processing and Analysis of Digitized 3-D Models of Cultural Heritage” project, el Institute for Advanced Technology in the Humanities de la University of Virginia reprocesa los datos existentes para crear modelos 3D culturalmente significativos de diversos artefactos y de arquitectura. Por ejemplo, el IATH espera volver a recomponer fragmentos del antiguo arte griego y romano.
* Visualización y análisis cultural: el proyecto Visualizing Patterns in Databases of Cultural Images and Video, de la University of California-San Diego, estudia la cultura contemporánea, analizando imágenes, pinturas, fotografía profesional, diseño gráfico, fotos generadas por usuarios, así como decenas de miles de videos, películas, animaciones, videos musicales de anime y videos caseros. En última instancia, el proyecto producirá una visualización detallada de los fenómenos culturales.

Por supuesto, hay más cosas en el campo de las humanidades digitales. Por ejemplo, el listado ofrecido en la conferencia celebrada en Chicago sobre Digital Humanities and Computer Science o lo que se contiene en el Digital Humanities 2008 Book of Abstracts.

Quedan preguntas del tipo de: ¿Cómo reconstruir manuscritos antiguos dañados? ¿Cómo archivar las performances de danza? ¿Por qué la comunidad de las humanidades digitales enfatiza las herramientas en lugar de hacer hincapié en los servicios?

3) Sobre el método
A medida que crecen las humanidades digitales, se dedica mucha atención al desarrollo de metodologías de investigación. En su “Sunset for Ideology, Sunrise for Methodology?”, Tom Scheinfeldt sugiere que las humanidades académicas están empezando a inclinarse hacia la metodología, que estamos entrando en una "nueva fase que no estará dominada por las ideas, sino una vez más por la organización de actividades, tanto en términos de organizar los conocimientos como de organizarnos a nosotros mismos y a nuestro trabajo ".

Ejemplos de métodos elaborados y / o aplicados por los investigadores de las humanidades digitales? En el “Meaning and mining: the impact of implicit assumptions in data mining for the humanities” Bradley Pasanek y D. Sculley abordan los problemas metodológicos que plantea la minería de datos en las humanidades, señalando que la crítica literaria debe elaborar normas para tratar estas bases de datos.

4) Los estudios literarios digitales
Diferentes enfoques metodológicos para el estudio literario se discuten en Companion to Digital Literary Studies (DLS), editado por Susan Schreibman y Ray Siemens, que fue liberado de forma gratuita en el otoño de 2008. Hay que agradecérselo a Blackwell, que ofrece además A Companion to Digital Humanities. El libro incluye ensayos como “Reading digital literature: surface, data, interaction, and expressive processing” de Noah Wardrip-Fruin, “The Virtual Codex from page space to e-space” de Johanna Drucker, “Algorithmic criticism” by Steve Ramsay, and “Knowing true things by what their mockeries be: modelling in the humanities” de Willard McCarty. También proporciona una annotated bibliography a cargo de Tanya Clement y Gretchen Gueguen

5) El oficio de historiador: History Appliances
Para Spiro, aquí podemos encontrar lo mejor, lo más innovador, lo más inesperado. Y es el trabajo de Bill Turkel, que está estudiando la fabricación humanista. Turkel está trabajando en la “materialization”, dando una forma física de representación digital. Turkel señala varios motivos por los que los estudiosos de las humanidades deben experimentar con la fabricación, como DaVinci, conectando la mente y la mano para darle forma física a una idea; estudiar el pasado recreando objetos históricos (fósiles, artefactos, etc) que se pueden tocar, girar, analizar, estudiar "la historia tactual", una experiencia sensual del pasado, creando y criticando.
Turkel y su equipo trabajan en diversos dispositivos, de algunos de los cuales ha hablado en su blog, “Digital History Hacks”, aunque ahora lo tiene paralizado para dedicarse más intensamente a esos otros intereses.

Las humanidades digitales en 2008 (2)

Post cruzado desde Clionauta
[<--- viene de la primera parte]

Comunidad académica y código abierto

El acceso abierto es algo bueno, algo que permite rastrear información y reutilizarla, promoviendo el intercambio de ideas, y garantiza el acceso del público a la investigación que los contribuyentes a menudo ayudan a costear. Además, como sostiene Dan Cohen, los académicos se benefician del acceso abierto a su trabajo, pues aumenta su propia visibilidad: “En un mundo en el que tenemos acceso instantáneo a miles de millones de documentos en línea, ¿por qué habríamos de preferir que el artículo o libro que tanto nos ha costado exista sólo en papel o sea de pago? Éste es un camino seguro a la invisibilidad en la era digital”. Por tanto, algunos académicos están adoptando la social scholarship, que promueve la apertura, la colaboración y el intercambio de investigaciones. Este año hemos contemplado algunos desarrollos positivos en el acceso abierto y la comunicación académica, tales como la aplicación de la norma de la NIH, la decisión de la Harvard’s Faculty of Arts & Science’s de adoptar el acceso abierto (seguido por la Harvard Law), y el lanzamiento de la Open Humanities Press. Pero también hubo algunos acontecimientos preocupantes (el intento de revocar el mandato del NIH, el juicio de EndNote contra Zotero) y algunos más confusos (el acuerdo en torno a Google Books). En la segunda parte de mi resumen sobre las humanidades digitales, voy a centrarme en el paisaje de la comunicación académica, discutiendo sobre el acceso abierto al material educativo, los nuevos modelos de publicación, el acuerdo en torno a Google Books y los obstáculos culturales a la publicación digital.

El código abierto crece y encuentra resistencia

En diciembre de 2007, la NIH Public Access Policy se convirtió en ley, fijando que toda investigación financiada por los NIH se depositará en PubMed Central pasado un año de su publicación. El mandato se puso en práctica, de modo que casi 3000 nuevos textos biomédicos han sido depositados cada mes en PubMed Central . Ahora John Conyers ha presentado un proyecto de ley para revocar el mandato de los NIH y prohibir que otras agencias federales apliquen políticas similares. Este proyecto de ley niega el acceso público a la investigación que financia y ahoga la innovación y los descubrimientos científicos. Según Elias Zerhouni, ex director de los NIH, no hay pruebas de que la norma perjudique a los editores, sino que maximiza el retorno público de la inversión en la financiación de la investigación científica. Hay una campaña contra el Conyers Bill’s entre los contribuyentes norteamericanos:

http://www.taxpayeraccess.org/action/HR801-09-0211.html.

¿Humanidades abiertas?

¿Por qué las humanidades han ido a la zaga de las ciencias en la adopción de un acceso abierto? Gary Hall señala varias diferencias entre ciencias y humanidades: la ciencia obtiene mayor financiación y pone más énfasis en la difusión rápida de la información, mientras en las humanidades hay una “percepción negativa del medio digital.” Pero Hall ha ayudado a cambiar esa percepción, colaborando en Open Humanities Press (OHP) y publicando “Digitize This Book”. Presentándose a sí misma como “una publicación colectiva e internacional de libre acceso sobre teoría crítica y cultural”, OHP selecciona revistas para su inclusión en el colectivo según su adhesión a los estándares de publicación, de acceso abierto, de diseño, técnicos y de mejores prácticas de redacción. Destacados académicos, como Jonathan Culler, Stephen Greenblatt y Jerome McGann aparecen como miembros de la junta directiva del Open Humanidades Press, dando más prestigio y credibilidad académica. En una charla dada en la UC Irvine la pasada primavera, Sigi Jöttkandt, co-fundador de OHP, refutó la hipótesis de que el acceso abierto signifique “una especie de apertura a cualquier publicación libre” y no textos de alta calidad revisados por pares. Jöttkandt sostuvo que el acceso abierto debería ser fundamental para las humanidades digitales: “siempre y cuando los materiales primarios y secundarios con los que estas herramientas funcionan permanezcan encerrados en espacios protegidos, las Humanidades Digitales no podrán cumplir con la verdadera promesa de innovación contenida en el medio digital”. Cabe señalar que muchos recursos de las humanidades digitales están disponibles como acceso abierto, incluidas la Digital Humanities Quarterly, el Rossetti Archive y los proyectos desarrollados por el CHNM; muchos otros pueden no ser explícitamente de acceso abierto, pero permiten que la información esté disponible de forma gratuita .

En “ANTHROPOLOGY OF/IN CIRCULATION: The Future of Open Access and Scholarly Societies,” Christopher Kelty, Michael M. J. Fischer, Alex “Rex” Golub, Jason Baird Jackson, Kimberly Christen y Michael F. Brown entablan un amplio debate sobre el acceso abierto en la antropología, promovido en parte por la American Anthropological Association y la decisión de trasladar sus publicaciones a Wiley Blackwell. Esta rica conversación explora diferentes modelos de acceso abierto, el papel de las sociedades en la publicación académica, la creación de comunidades en torno a problemas de investigación, la reutilización y remezcla de contenidos académicos, la economía de la edición, la conexión entre la reputación académica y acceso de los lectores a las publicaciones, el cómo hacer los contenidos accesibles a las comunidades de origen, y mucho más. Como señala Kelty, “el futuro de la innovación académica no sólo está en la AAA (American Anthropological Association) y sus revistas, sino en las estructuras que construimos y que permiten que nuestra investigación circule e intractúe de formas totalmente nuevas”. Kelty (que , por desgracia, fue tentado por la UCLA y dejó Rice) está estudiando la forma de hacer que lo académico sea más abierto e interactivo. Se puede comprar una copia impresa de Two Bits, su nuevo libro sobre el movimiento de software libre publicado por Duke UP; leer (gratis) una versión en PDF del libro, comentarlo sobre la versión CommentPress o descargar y remezclar el código HTML. En Two Bits at Six Months, Kelty observó, “Duke está obteniento tanto o tan poco dinero como obtiene con otros libros semejantes, pero yo estoy recibiendo mucho más del acceso abierto de lo que podría obtener de otra manera”. El proyecto ha hecho más visible a Kelty como especialista, lo que ha supuesto más atención de los medios, más invitaciones para dar conferencias, para escribir, etc

Nuevos modelos de comunicación académica, y continúa la resistencia

¿En qué medida los nuevos modelos emergentes de publicación como los de Internet permiten una rápida y barata distribución de la información, la incorporación de los elementos multimedia en las publicaciones y la colaboración en red? Para averiguarlo, The ARL/ Ithaka New Model Publications Study realiza un “barrido organizado” de las nuevas publicaciones, como blogs, ejournals y nudos (hubs) de investigación. ARL reclutó 301 bibliotecarios voluntarios de 46 colegios y universidades para entrevistar a profesores sobre las nuevos modelos de publicaciones que utilizan. (He participado parcialmente, entrevistando a un miembro del cuerpo docente en Rice.) Según el informe, existen ejemplos de nuevos modelos de publicaciones en todas las disciplinas, aunque los científicos tienen más probabilidades de utilizar los repositorios de pre-publicaciones, mientras que los especialistas en humanidades participan más frecuentemente en foros de discusión. El estudio identifica ocho tipos principales de recursos académicos:

* E-revistas
* Reseñas
* Preprints y documentos de trabajo
* Enciclopedias, diccionarios, y contenidos anotados
* Datos
* Blogs
* Foros de debate
* Nudos (hubs) de profesionales y académicos

Estas categorías proporcionan una especie de manual abreviado para identificar diferentes tipos del nuevo modelo de publicaciones . Quisiera añadir un par de categorías, como el comentario colaborativo o las reseñas peer-to-peer (por ejemplo los proyectos que utilizan CommentPress); wikis académicas como OpenWetWare que permiten el intercambio de información académica y portales de investigación como NINES (que tal vez deberían ser considerados como un hub). El informe incluye algunos ejemplos fascinantes de publicaciones innovadoras, sobre todo de ejournals, pero ARL ofrece breves descripciones de 206 recursos que considera "trabajos académicos originales" a través de una base de datos pública.

Mi ejemplo favorito de nuevo modelo de publicación es eBird, un proyecto iniciado por el Cornell Lab of Ornithology y la Audobon Society, que ofrece un listado de aficionados y profesionales amantes de los pájaros que recolectan datos sobre la observación de aves. Los científicos utilizan estos datos para entender la “distribución y abundancia de aves”. Me pregunto si una investigación colaborativa semejante puede ser planteada para, por ejemplo, las artes escénicas (ePerformances.org?), donde los participantes fueran el público que asiste a diversas representaciones.

La ARL / Ithaca selecciona también algunos de los retos de estos nuevos modelo de publicaciones, como el conservadurismo de la cultura académica, la dificultad de que los académicos participen en foros en línea, y la forma de encontrar maneras de financiar y mantener las publicaciones. En Interim Report: Assessing the Future Landscape of Scholarly Communication, Diane Harley y sus colegas en la Universidad de California-Berkeley profundizan en algunos de estos desafíos. Harley considera que si bien algunos estudiosos están interesados en publicar sus investigaciones en un formato multimedia interactivo, “(1) las nuevas formas deben ser percibidan como algo que haya sido sometidos a riguroso examen por sus pares, (2) pocos estudiosos untenured (sin contrato fijo) están presentando este tipo de publicaciones como parte de sus tenure cases (optar a una plaza), y (3) los mecanismos para la evaluación de nuevos géneros (por ejemplo, las narrativas no lineales y las publicaciones multimedia) pueden resultar prohibitivos para los evaluadores en términos de tiempo y de inclinación”. En general, los investigadores en humanidades están menos preocupados por la rapidez de publicación que los científicos y los científicos sociales, pero se quejan de la poca predisposición de las revistas a la hora de incluir imágenes de alta calidad y desearían enlazar sus afirmaciones con las fuentes que citan. Sin embargo, los académicos en general no son conscientes de las sencillas herramientas que tienen a su alcance, ni de la facilidad para hacer obras multimedia ni, por tanto, de las probabilidades de experimentar con nuevas formas. Académicos de todos los ámbitos comparten sus investigaciones con otros estudiosos, por lo general a través de correos electrónicos y otras formas de comunicación personal, pero muchos consideran los blogs como “una pérdida de tiempo porque no son revisados por pares.” Del mismo modo, Ithaka’s 2006 Studies of Key Stakeholders in the Digital Transformation in Higher Education (publicado en 2008) señala que “las decisiones académicas sobre dónde y cómo publicar los resultados de su investigación se basan principalmente en la visibilidad dentro de su campo particular”, no en el libre acceso .

Pero el conservadurismo académico no debe impedir imaginar y experimentar con enfoques alternativos para la publicación académica. La propuesta de Kathleen Fitzpatrick’s (“libro-como-objeto”- blob), Planned Obsolescence: Publishing, Technology, and the Future of the Academy, ofrece una visión audaz y convincente del futuro de las publicaciones académicas. Fitzpatrick pide a la academia que salga de su adormecimiento y propone formas “de peer-to-peer” (como en Wikipedia), centrándose en el proceso en lugar de en el producto (como en los blogs), y participando en conversaciones en red (como en CommentPress).

EndNote demanda a Zotero

Normalmente tengo problemas para que la gente venga a los talleres sobre herramientas de investigación y comunicación académica, pero acuden en masa a mis talleres sobre Zotero, que reconocen como una herramienta que les ayudará a trabajar de forma más productiva. Al parecer, Thomson Reuters, el fabricante de EndNote, se ha dado cuenta de la amenaza planteada por Zotero, ya que han demandado a la Universidad de George Mason, que gestiona Zotero, alegando que Zotero puede reconvertir y utilizar en abierto los archivos que genera EndNote. Los comentaristas con mayores conocimientos acerca de los detalles técnicos y jurídicos que he encontrado dicen que lo que plantea Thomson es falso. Mi cínica lectura de esta demanda es que EndNote ve una amenaza en una aplicación popular y potente de código abierto, de modo que plantea una acción legal en lugar de competir por ofrecer un producto mejor. Como Hugh Cayless sugiere, “es un acto de pura desesperación por parte de Thomson Reuters” y demuestra que Zotero ha “atemorizado lo suficiente a sus competidores…”.

La demanda parece confirmar la descripción de Yokai Benkler sobre los intentos propietarios de control de la información. Lamentablemente, la demanda parece estar teniendo un efecto que en última instancia, creo, perjudicará a EndNote. Por ejemplo, los desarrolladores de BibApp han decidido no importar las listas de citas producidas por EndNote, ya que resulta ariesgado utilizar su modelo. Esta demanda plantea la cuestión crucial de si los investigadores pueden mover sus datos de un sistema a otro. ¿Por qué elegir un producto que no sea compatible? Nature publicó un editorial, citado por CHNM en su respuesta a la demanda, diciendo que “las virtudes de la interoperabilidad y el fácil intercambio de datos entre los investigadores es algo que vale la pena reiterar”.

Acuerdo sobre Google Books

En el otoño, Google llegó a un acuerdo con Authors Guild y la Association of American Publishers sobre Google Book Search [ya hemos hablado de ello en varias ocasiones en Clionauta]. Pero, al igual que otros, me preocupa que una empresa sea propietaria de la totalidad de esta información y desearía que la justicia hubiera fijado un uso leal de tales principios (incluso si tal decisión fuera restrictiva). Las bibliotecas tienen algunas preocupaciones legítimas sobre el acceso, la intimidad, la libertad intelectual, el trato equitativo y las condiciones de uso. De hecho, Harvard se retiró del proyecto, siguiendo lo dicho por Robert Darnton. A pesar de lo que señala el acuerdo, me preocupa que los humanistas y otros estudiosos digitales no tengan acceso a los datos que necesitan. ¿Qué sucede si Google se hunde o va mal? En todo caso, la creación del Hathi Trust me hace sentirme un poco mejor acerca de las cuestiones de acceso y preservación, y veo que Hathi proporcionará un corpus de 50000 documentos. Como ya he señalado en otra ocasión, quiero ver cómo Google Books puede transformar la investigación mediante el acceso a tanta información.

Aproximadamente por las mismas fechas (¿el mismo día?) en que se producía el acuerdo sobre Que Google Books, la Open Content Alliance (OCA) alcanzó un hito importante, al dar acceso a más de un millón de libros. Como su nombre indica, la OCA permite que los libros digitalizados estén disponibles de forma libre para su lectura, descarga y análisis, y creo que la calidad de la digitalización es mejor. A pesar de que la colección de la OCA es más pequeña y se centra en los materiales de dominio público, ofrece una importante alternativa a GB. (Rice pertenece a la Open Content Alliance).

Las humanidades digitales en 2008 (1)

Post cruzado desde Clionauta

Como hiciera para 2007 y por segundo año consecutivo Lisa Spiro realiza un amplio balance de la situación de las Digital Humanities a lo largo del pasado 2008. Vayamos ahora con la primera parte.

1. La emergencia de las 'digital humanities'

Varios de los líderes de las humanidades digitales han declarado que éste ha sido el año de su "emergencia". En uno de los primeros Bamboo workshops, John Unsworth señaló el elevado número de participantes y la evolución de las humanidades digitales pasados cinco años del informe ACLS Cyberinfrastructure (Our Cultural Commonwealth), indicando "que hemos alcanzado de hecho la emergencia… ahora estamos en un momento en que parece posible un cambio real". Asimismo, Stan Katz comentó en una entrada de un blog llamado 'The Emergence of the Digital Humanities": "Queda mucho por hacer, y la falta de atención en nuestros campus a las humanidades complica la tarea. Pero las humanidades digitales están aquí para quedarse, y merecen seguirse con atención".
El año pasado escribí acerca de la aparición de las humanidades digitales (DH) y sospecho que lo voy a hacer también en los próximos años, pero las humanidades digitales parecen haber ganar impulso y visibilidad en 2008. Para mí, un signo clave de la aparición de las DH se produjo cuando la NEH convirtió la Digital Humanities Initiative en Office of Digital Humanities (ODH), señalando la importancia de lo "digital" en el mundo académico de las humanidades. Tras crear dicha institución, en Inside Higher Ed se expuso ("Rise of the Digital NEH”) que lo que había sido un "movimiento de base" estaba atrayendo financiación y que se estaba desarrollando una "estructura organizativa". El establecimiento de la ODH dio credibilidad a un campo emergente (¿disciplina?, ¿metodología ?). Cuando uno trata de defender que su labor en las humanidades digitales tenga que contar para la promoción y para obtener una plaza, ciertamente no está nada mal señalar que es financiado por la NEH. La ODH actúa, no sólo como fuente de financiación (de 89 proyectos hasta la fecha), sino también facilitando el proceso, convocando conversations, escuchando activamente y fomentando que en las humanidades a “keep innovating”. Reconociendo que el trabajo en las humanidades digitales se produce a través de las fronteras nacionales y disciplinarias, la ODH colabora con organismos de otros países, como JISC en el Reino Unido, Social Sciences and Humanities Research Council (SSHRC) en Canadá, o DFG en Alemania; agencias norteamericanas como NSF, IMLS y DOE; y otras sin ánimo de lucro como CLIR. Aunque la ODH tiene un personal reducido (tres personas) y fondos limitados, me he quedado impresionada por la cantidad de conocimiento emprendedor que este equipo ha sido capaz de llevar a cabo, como el lanzamiento de iniciativas centradas en data mining y high performance computing, la defensa de las humanidades digitales, el impulso de proyectos innovadores y el patrocinio de institutos sobre temas avanzados en este ámbito.
También parece que hay más puestos de trabajo en este campo en 2008, o al menos más anuncios de trabajo en los que figuran las humanidades digitales como especialización deseada. Por supuesto, la recesión económica no sólo puede limitar el número de puestos de trabajo en las DH, sino también la financiación disponible para llevar a cabo proyectos complejos -o, aquí está la esperanza, puede conducir a la financiación de proyectos de infraestructura para la investigación scanner-ready.

2.Definiendo las “digital humanities”

Quizás otra señal de emergencia sea el esfuerzo por averiguar queé hay tras esta "bestia". A lo largo de 2008 se han publicado varios ensayos y diálogos que exploran el sentido de las humanidades digitales; unos pocos utilizan el término "promesa", lo que sugiere que el campo está lleno de potencialidades, pero que todavía no se han hecho plenamente efectivas.
* The Promise of Digital History, una conversación entre Dan Cohen, Michael Frisch, Patrick Gallagher, Steven Mintz, Kirsten Sword, Amy Murrell Taylor, Will Thomas III y Bill Turkel, se publicó en el Journal of American History. Esta discusión, amplia y fascinante, explora la definición de la historia digital, el desarrollo de nuevos enfoques metodológicos, la enseñanza de las competencias y la comprensión de la importancia de los nuevos medios de comunicación para la historia, etc. ¡Menos mal! Uno de los más fascinantes hilos de discusión: ¿Es un método, un campo o un medio? Si la historia digital es un método, entonces todos los historiadores tienen que adquirir unos conocimientos básicos sobre el mismo; si se trata de un medio, eso significa que ofrece una nueva forma de pensamiento histórico, basada en la colaboración en red. Los participantes sugieren que la historia digital no sólo trata de análisis de algoritmos, sino también de la colaboración, de redes y de la utilización de nuevos medios de comunicación para explorar ideas históricas.
* En Humanities 2.0: Promise, Perils, Predictions” (se requiere suscripción, pero véase su texto similar: Participatory Learning and the New Humanities: An Interview with Cathy Davidson), Cathy Davidson sostiene que las humanidades, cuyo fuerte está en la "perspectiva histórica, la habilidad interpretativa, el análisis crítico y la forma narrativa", deben incorporarse a la era de la información. Por eso, exhorta a que los humanistas reconozcan y se comprometan con la transformación potencial de la tecnología para la enseñanza, la investigación y la escritura.
Describiendo cómo el acceso en línea a los materiales de investigación ha cambiado la investigación, cita la broma de un colega que dice que el trabajo realizado antes de la aparición de los archivos digitales debería ser reconocido con una pegatina que dijera: "crédito extra". Ahora nos estamos moviendo en el mundo de las "Humanidades 2.0″, caracterizado por la participación en red, la colaboración y la interacción. Por ejemplo, los estudiosos podrían iniciar un ensayo de crítica y comentarios usando una herramienta como CommentPress, o podrían colaborar en proyectos de investigación y enseñanza multinacionales y multilingües, como el Law in Slavery and Freedom Project. Sin embargo, Davidson reconoce los "peligros" que plantea la tecnología de la información, en particular los de tipo monopolístico, de control corporativo de la información. Davidson contribuye a este diálogo sobre las humanidades digitales subrayando la importancia de una comprensión crítica de la tecnología de la información y abogando porque el mundo académico se comprometa y participe.
* En Something Called ‘Digital Humanities', Wendell Piez desafía al rechazo de William Deresiewicz a "Algo llamado humanidades digitales " (entre otros rechazos). Piez sostiene que al igual que en el Renacimiento eruditos-técnicos como Aldus Manutius contribuyeron a crear la cultura de lo impreso, también los humanistas digitales se centran en la comprensión y la creación de medios digitales. A medida que reflexionamos sobre el papel de las humanidades en la sociedad, tal vez las humanidades digitales, que permiten tanto nuevos modos de comunicación con amplias comunidades como reflexiones críticas sobre esos nuevos medios, proporcionen un modelo para la acción.

3. Comunidad y colaboración

Según Our Cultural Commonwealth, "facilitar la colaboración" es uno de los cinco objetivos clave para la cyberinfrastructura de las humanidades . Aunque este objetivo se enfrenta a obstáculos culturales, organizativos, financieros y técnicos, varias iniciativas recientes están tratando de articular y hacer frente a estos desafíos.
Para facilitar la colaboración, Our Cultural Commonwealth exige el desarrollo de una red de centros de investigación que proporcionen tanto conocimientos técnicos como de contenidos. En A Survey of Digital Humanities Centers in the United States, Diane Zorich inventaría asuntos como la gobernabilidad, las estructuras organizativas, los modelos de financiación, las misiones, los proyectos y la investigación en los centros de DH. Señala que estos centros están en un momento crucial, llegando a su punto de madurez, pero indica que se enfrentan a distintos retos para mantenerse y preservar los contenidos digitales. Zorich reconoce la labor innovadora que muchos centros de humanidades digitales han estado haciendo, pero pide una mayor coordinación entre los centros para que puedan salir de los silos que los albergan, abordando cuestiones comunes como la preservación digital y creando servicios compartidos. Esta coordinación está ya en marcha a través de grupos como CenterNet y HASTAC, proyectos de investigación en colaboración financiados por la NEH y otros organismos, planificación de proyectos de cyberinfrastructuras tales como Bamboo y asociaciones informales entre centros.
¿Cómo lograr una mayor coordinación entre los "Centros de Investigación en Humanidades" fue también el tema de la Sexta edición de Scholarly Communications Institute (SCI), que utilizó el informe de Zorich como punto de partida para la discusión. El informe SCI se refiere tanto a los centros tradicionales de humanidades, en cuanto se comprometen con los nuevos media y tratan de convertirse en "agentes de cambio", como a los centros de humanidades digitales, en su lucha por "pasar de la experimentación a la normalización" logrando la estabilidad. Según el informe, los centros de humanidades deben facilitar que haya "mayor compromiso con los métodos", debatir sobre qué es lo que cuenta en el mundo académico y coordinar sus actividades con los demás. Tengo entendido que la reunión del SCI parece estar dando resultados: CenterNet y el Consortium of Humanities Centers and Institutes (CHCI) están negociando una posible colaboración, como crear posdoctorados en humanidades digitales.
Asimismo, Bamboo está reuniendo a investigadores en humanidades, informática, tecnología de la información y bibliotecarios para discutir el desarrollo de servicios tecnológicos compartidos en apoyo de los investigadores en artes y humanidades Desde abril de 2008, Bamboo ha convocado tres talleres para definir las prácticas académicas, examinar los desafíos y planificar la cyberinfrastructura de las humanidades . No he estado involucrada con Bamboo (más allá de mi asociación para añadir información a Digital Research Tools wiki), por lo que no soy la comentarista más autorizada, pero creo que la participación de una amplia comunidad académica en la definición de las necesidades y el desarrollo de servicios tecnológicos sólo tiene sentido si evita la replicación, aprovecha los recursos comunes y, en definitiva, como espero, hace que sea más fácil realizar y sostener la investigación con herramientas y recursos digitales. El reto, por supuesto, es cómo pasar del dicho al hecho, sobre todo teniendo en cuenta las limitaciones económicas actuales y la expansión inevitable que supone planificar de actividades que involucran a más de 300 personas. Para hacer frente a las cuestiones de cómo aplicarlo, Bamboo ha creado ocho working groups que se ocupan de temas como la educación, creación de redes académicas, herramientas y contenidos o servicios compartidos. Estoy ansiosa por ver lo que sucede con Bamboo.
Planificar la Cyberinfrastructura y coordinar las actividades entre los centros de humanidades son actividades importantes, pero jugar con las herramientas e ideas entre colegas de las humanistas digitales es divertido! (Bueno, supongo que la planificación y la coordinación puede ser divertida, pero un tipo diferente de diversión). El pasado mes de junio, el Center for New Media in History acogió su primer THATCamp (The Humanities and Technology Camp), generado por el propio usuario y orgánicamente organizado según el sistema de unconference (muy Web 2.0 / de código abierto). En lugar de desarrollar un programa previo a la conferencia, los organizadores pidieron a cada participante que pusiera en el blog cuáles eran sus intereses, dedicando la primera sesión a fijar las propias sesiones sobre la base de lo que los participantes querían discutir. En lugar de escuchar pasivamente a tres oradores leer sus documentos, se pidió a cada persona que participara activamente. Los temas fueron del tipo Teaching Digital Humanities, Making Things (con el taller de Bill Turkel, Arduino ), Visualization, Infrastructure and Sustainability y el encantador Dork Shorts, donde los THAT campistas expusieron brevemente sus proyectos. En THAT Camp comparecieron una gran diversidad de profesores, estudiantes, bibliotecarios, programadores, técnicos de información, financiadores, etc. En la conferencia se utiliza la tecnología para suscitar y mantener la energía y las ideas -el blog anterior a la conferencia ayudó a los asistentes a establecer algunos de los temas de debate, y Twitter proporcionó un backchannel durante la conferencia. Nunca he ido a una conferencia donde las personas estuvieran tan emocionados de estar allí, de manera comprometida y abierta. Apuesto a que nacieron muchas colaboraciones e ideas brillantes en el campamento. Este año, el THAT Camp se ampliará y tendrá lugar justo después de las Digital Humanities de 2009.
THAT Camp me enganchó a Twitter. Inicialmente era escéptica con Twitter ( ¿necesito otra forma de procrastinación?), pero he descubierto que es una muy buena manera de averiguar lo que está sucediendo en las humanidades digitales y de conectar con otras personas que tienen intereses similares. Me gusta lo que propone Barbara Ganley (via Dan Cohen): "el blog para reflexionar, Tweet para conectar". Si estás interesado en Twitter, pero no sabes cómo empezar, me gustaría sugerir que siguieras las humanidades digitales y a algunas de las personas que ellos siguen. También se pueden buscar temas en search.twitter.com. Amanda French ha escrito un par de grandes posts acerca de Twitter como vehículo para la conversación académica, y un reciente podcast de Digital Campus presenta una discusión entre los tweeters Dan Cohen y Tom Scheinfeldt frente al escéptico Mills Kelly.
HASTAC ofrece otro modelo para la colaboración mediante el establecimiento de una red virtual de personas y organizaciones interesadas en las humanidades digitales, patrocinio de foros en línea (organizado por estudiantes de licenciatura y posgrado) y otras actividades. Actualmente funciona en HASTAC un rico y animado foro sobre the future of the digital humanities a cargo de Brett Bobley, director de la NEH’s ODH. Entra!