
El Comienzo
El Proyecto Gutenberg comenzó en 1971 cuando a Michael Hart le otorgaron una cuenta de US $100,000,000 de tiempo de computadora del Xerox Sigma V mainframe, en el Laboratorio de Materiales de Investigación, de la Universidad de Illinois
Esto fue realmente afortunado, porque dos de los cuatro operadores del equipo resultaron ser el mejor amigo de Michael y el mejor amigo de su hermano. Michael simplemente estaba “en el lugar correcto en el momento indicado”, en un momento en que había más tiempo de computadoras que gente que supiera que hacer con él; y aquellos operadores eran motivados a hacer cualquier cosa que quisieran con esa fortuna en “tiempo libre”.
De cualquier modo, Michael decidió que no había nada que él pudiera hacer, en sentido de “computación normal”, que repusiera el gran valor de tiempo de computadora que le había sido dado… De manera que tenía que crear US $100,000,000 en algo que valiera la pena. Una hora y 47 minutos después, anunció que el gran valor creado por las computadoras sería el almacenamiento y búsqueda de lo que estaba guardado en nuestras bibliotecas.
Procedió entonces a tipear la “Declaración de la Independencia” e intentó enviársela a todo el mundo en las redes, cosa que sólo puede ser descripta hoy, como la temprana creación de lo que más tarde sería llamado el “Virus de Internet”.
Una discusión amistosa sobre esto creó la primera edición de un documento en texto electrónico. El Proyecto Gutenberg nació cuando Michael afirmó que había empleado exitosamente sus US $100,000,000 porque una copia de la Declaración de la Independencia sería eventualmente un libro electrónico en las bibliotecas de computadoras de 100,000,000 de usuarios futuros.
El comienzo de la Filosofía Gutenberg
La premisa sobre la cual Michael Hart basó el Proyecto Gutenberg fue: cualquier cosa que puede ser ingresada en una computadora puede ser reproducida indefinidamente, lo que Michael definió como “Tecnología Replicadora”. El concepto de la Tecnología Replicadora es simple; una vez que un libro o cualquier otro ítem (incluyendo pinturas, sonidos, e inclusive objetos 3-D) que pueden ser almacenados en una computadora, cualquier número de copias estarán disponibles. Cualquiera en el mundo, o inclusive fuera de este mundo (dada la transmisión satelital) puede tener una copia de un libro que ha sido ingresado a una computadora.
La premisa filosófica ha creado diversos vástagos:
1. Los textos electrónicos (Etexts) creados por el Proyecto Gutenberg disponibles en la forma más sencilla.
Las sugerencias para hacerlos mas legibles no son tomadas ligeramente. Sin embargo, los Etexts del Proyecto Gutenberg están disponibles en lo que se ha conocido como “Plain Vanilla ASCII”, significando el mismo grupo del Codigo Standard Americano para el Intercambio de Información: es decir la misma clase de caracteres que usted lee en una página impresa normal – subrayados, negritas, cursivas y han sido escritas con mayúsculas.
La razón de esto es que el 99% del Hardware y Software que una persona puede utilizar lee y busca esos archivos.
Cualquier otro sistema de almacenamiento de Etetxs caerá lejos del 99% de los usuarios.
Esto no significa que no haya otros medios válidos de hacer los etexts… Después de todo, más de la mitad de las computadoras son DOS, por lo tanto uno puede dirigirse a una gran audiencia utilizando simplemente DOS. El Plain Vanilla ASCII, de todas formas, se dirige a una audiencia con Apples y Ataris, de la misma manera que a las viejas computadoras caseras Z80, mientras que una audiencia de Mac, UNIX y derivados sigue incluida.
En el mismo sentido, el Proyecto Gutenberg selecciona etexts teniendo en cuenta esta filosofía: “Nosotros elegimos etexts que esperamos utilicen grandes porciones de audiencia en forma frecuente. Nos piden constantemente que preparemos etexts de ediciones impresas de materiales esotéricos, pero esto no brinda uso a la audiencia a la que se apunta, 99% del público general.”
De igual modo, el Proyecto Gutenberg ha evitado los pedidos, las demandas y las presiones para crear “Ediciones Autorizadas” (Críticas – Definitivas): “Nosotros no escribimos para el lector que se preocupa por si una cierta frase de Shakespeare lleva “:” o “;” entre sus cláusulas. Nosotros ponemos nuestra visión en el objetivo de producir etexts que son 99% exactos a los ojos del lector general. De todas maneras, para la persona que desea una “edición autorizada” tendremos que esperar algún tiempo hasta que se convierta en algo viable. Tenemos, de todas formas, la intención de realizar muchas ediciones de Shakespeare y otros clásicos, para un estudio comparativo de nivel erudito, antes del finales del año 2001, cuando planeamos completar nuestra Biblioteca Pública Electrónica Proyecto Gutenberg, contando con 10,000 libros
El Proyecto Gutenberg ha sido parte de las celebraciones del Centésimo Aniversario de las Bibliotecas Públicas, comenzado en 1995. El Proyecto Gutenberg espera fundar el “Registro de Dominio Público”, luego del 100 aniversario del Registro de Copyright de los Estados Unidos en 1997.
Esperamos que ustedes sean parte de eso también. Están todos invitados.
Nota al pie:
Nuestro eventual logro es proveer ediciones de Etexts de Dominio Público apenas entren en el Dominio Público. Por supuesto, el período antes de que una obra con copyright entre al Dominio Público se extendió de 28 años (con una extensión de 28 años disponible) a 50 años más de la vida del autor, por lo que esto da un giro, por decirlo de alguna manera, a nuestros planes. (El copyright original fue de 14 años, en los Estados Unidos). Sin embargo, una persona podría originalmente hacer una predicción que cualquier cosa bajo copyright estaría bajo Dominio Público mientras pudiera ser usada. Bajo la nueva ley es imposible predecir la longitud del copyright; y la probabilidad de un nuevo libro entrando al Dominio Público durante el período de vida del lector promedio es mínima. (Supóngase que tiene usted 25 años cuando lee un nuevo libro y el autor tiene 50: Espere los 25 años promedio hasta que el autor muera (¡que pensamiento!). Ahora usted debe esperar otros 50 años para tener acceso al libro; no importa cuando ha sido escrito (a menos que sea uno viejo… antes de que el período de la ley se retroactivara)… entonces usted tendría que esperar (en promedio) hasta que usted tenga 100 años. Uno de 25 años bajo la ley original solamente tendría que esperar 14 años… hasta la edad de 39. Gran diferencia entre las edades de 39 a 100 años. No sólo eso, sino que las leyes de Copyright tendrán que mantenerse de la misma manera todo el tiempo… algo dudoso, viendo cuanto han cambiado en el reciente siglo.
La Filosofía del Proyecto Gutenberg.
La Filosofía del Proyecto Gutenberg es crear información, libros y otros materiales disponibles al público en general en una forma para uso de la vasta mayoría de computadoras, programas y gente, que pueda fácilmente leerlas, usarlas, buscarlas y citarlas.
Esto tiene múltiples ramificaciones:
1. Los Etexts del Proyecto Gutenberg deberían "pesar" tan poco que nadie realmente debería preocuparse por cuanto "pesan". Deberían tener un tamaño general que encaje en los medios estándar de su tiempo…
2. Los Etexts del Proyecto Gutenberg deberían ser fácilmente usables de manera tal que nadie debería preocuparse en como usarlos, leerlos, citarlos y buscarlos…
Cuando empezamos, los archivos debían ser muy pequeños; ya que un libro normal de 300 páginas ocupaba un mega de espacio, que nadie en 1971 podía esperar tener (en general). Por lo tanto, hacer la Declaración de la Independencia de los Estados Unidos (solamente 5K) parecería lo mejor para empezar. Esta fue seguida por la Carta de Derechos – luego la Constitución de los Estados Unidos entera, que como espacio comenzaba a ser grande (al menos en los estándares de 1973). Luego vino la Biblia; luego Shakespeare (una obra cada vez), y luego obras generales en áreas de preferencia de la literatura ligera y seria.
Para el momento en que el Proyecto Gutenberg se hizo famoso, el estándar era discos 360K, por lo que hicimos libros como Alicia en el País de las Maravillas o Peter Pan porque podían entrar en un disco. Ahora el disco de 1.44 y el ZIP es el estándar de compresión; el tamaño de archivo es aproximadamente 3 millones de caracteres, largo suficiente para el libro promedio.
De todas maneras, las imágenes son todavía pesadas para almacenarse en un disquete y pasará un poco hasta incluir inclusive las ilustraciones menos pesadas junto con un libro. De todas formas estamos MUY interesados en hacerlo, y sólo estamos esperando el avance de la tecnología para intentar una edición de testeo. El mercado deberá, de todos modos, establecer ALGUNOS estándares para los gráficos antes de que el intento llegue al público general, por lo menos en nivel de gráficos.
Para ilustrar nuestra fe en los gráficos, y en el futuro, hemos dado un paso más en lo que llamamos la Tecnología Replicadora MR hace unos pocos años. Quisiéramos terminar esta fase del Proyecto Gutenberg (con la primera aplicación 3D de la Tecnología Replicadora) al hacer CAT, MRI y escaneos fluoroscópicos de rayos x de algo, quizás una pintura, e imprimir copias en 3D. Si alguno tiene acceso a una obra maestra de 100 años… el libro promedio.
(continuación)
Esto ha creado la necesidad the presentar estos Etexts del Proyecto Gutenberg en “Plain Vanilla ASCII”, como hemos dado a llamarlo con el paso de los años.
La razón de esto es muy simple… es el único modo de texto que facilita tanto la lectura a los ojos como a la computadora.
De todas maneras, esto impulsa a otros a mejorar nuestros Etexts en una variedad de formas y a distribuirlos en otras variedades de medios, como sigue:
Una vez que un etext es creado en Plain Vanilla ASCII, es la base de cualquier número de ediciones que puedan esperarse en el futuro. Cualquiera que desee hacer coincidir un etext con una edición determinada de papel puede hacerlo sin tener que preparar todo el libro de nuevo. Ellos pueden usar los Etexts del Proyecto Gutenberg como base, y luego construir en cualquier dirección que elijan.
Sin embargo cualquier queja respecto a como hacemos las itálicas, las negritas y el subrayado, o si deberíamos usar esta u otra fórmula de “markup” son devueltas con la sugerencia de hacerlo en la forma en que cualquier persona quiera, y utilizando el trabajo básico hecho, y nuestras felicitaciones.
Lo mismo vale para el medio. Tenemos una vieja y viva costumbre de proveer nuestros etexts en cualquier medio que la gente quiera: Amiga, Apple, Atari… a IBM, a MAC, a TRS-80 …
De todas formas, ahora que nuestros etexts están subidos en tantos BB´s, redes y otros lugares, es más fácil bajar el archivo de forma que se puedan utilizar y mandar por mail o disquete, por lo que no nos preocupamos tanto por eso.
El punto más importante es que en los próximos años los Etexts del Proyecto Gutenberg seguirán siendo viables pero, programa tras programa, sistema operativo tras sistema operativo, irán camino hacia el dinosaurio, como irán todas las piezas de Hardware que corren con ellos. Por supuesto, esto es válido para todos los etexts en Plain Vanilla ASCII, no sólo de aquellos a los que se puede tener acceso a través del Proyecto Gutenberg. El punto es que dentro de una década nosotros probablemente no estaremos usando los mismos sistemas operativos, o los mismos programas y por lo tanto todos los tipos de etexts que no son Plain Vanilla ASCII serán obsoletos. Necesitamos tener etexts en archivos que el programa lector buscador de archivos Plain Vanilla pueda manejar; esto no equivale a decir que nunca habrá un “markup”, sólo que esas formas de “markup” deberían ser sencillamente convertibles a un archivo regular, Plain Vanilla ASCII para que su utilidad no expire cuando los programas en uso no estén más con nosotros. Recuérdese todo el problema con los programas de CONVERSIÓN, para tener archivos cambiados de un viejo programa de procesador a Plain Vanilla ASCII.
Ustedes quieren hacer todo de vuelta con cada libro que el mundo alguna vez ponga en etext?
El valor del Plain Vanilla ASCII es obvio… así como el valor de los sistemas de “markup” que tenemos en el mundo. Pero hasta que un verdadero estándar llegue deberemos limitar nuestras opciones en gran parte, si no mantenemos copias de etexts en Plain Vanilla ASCII.
No tenemos nada en contra del “markup”, tampoco lo contrario. Alicia en el País de la Maravillas, la Biblia, Shakespeare, el Corán y muchos otros estarán con nosotros cuanto dure la civilización… un sistema operativo, un programa, un sistema de “markup”, no.
Esto incluye muchos de los pedidos en formatos particulares de compresión. Hay sólo dos formatos que nosotros conocemos que son apropiados para transferencia para el público en general: Plain Vanilla ASCII (archivos en .txt) y el ZIPpeado de ellos, (archivos .zip). Los pedidos por otros formatos de compresión deben ser ignorados mientras sean apropiados sólo para pequeñas porciones de nuestro target de lectores. Sin embargo, (programadores tomen nota: necesitaremos su ayuda) planeamos poner algunos eslabones de compresión sobre nuestros archivos; entonces podrán ser transmitidos en cualquiera de los formatos de compresión de surtido en marcha., por ejemplo, debería ser posible generar cualquier tipo de archivos que nos pidieran, pero debemos mantener sólo una copia de cada etext en nuestros servidores… como la comprensión .Z lo hace en una forma similar hoy.
La selección de Etexts del Proyecto Gutenberg
Hay tres secciones de la Biblioteca del Proyecto Gutenberg, básicamente descriptas como:
1. Literatura ligera; como por ejemplo Alicia en el País de las Maravillas, A través del espejo, Peter Pan, las Fábulas de Esopo, etc.
2. Literatura seria; como la Biblia y otros documentos religiosos, Shakespeare, Moby Dick, El Paraíso Perdido, etc.
Referencias; como Roget´s Thesaurus, almanaques, y un set de enciclopedia, diccionarios, etc.
La colección de literatura ligera está destinada a las personas que obtienen una computadora, siendo esta persona un preescolar, o un anciano. Nos alegramos cuando escuchamos sobre niños o abuelos que toman uno a otro etexts de Peter Pan cuando vuelven de mirar HOOK en las películas, o cuando leen Alicia en el País de las Maravillas luego de verlo en la TV. También nos han contado que casi cada película de Star Trek ha citado obras del Proyecto Gutenberg (desde Moby Dick en el Wrath de Khan; a la cita final de Peter Pan siendo el más reciente, etc.) sin mencionar la referencia de A través del espejo en JFK. Esto fue un objetivo primario cuando elegimos los libros de nuestras bibliotecas.
Queremos que la gente sea capaz de buscar citas escuchadas en una conversación, películas, música, u otros libros, fácilmente con una biblioteca que contenga todas estas citas en un formato etext sencillo de buscar.
Con Plain Vanilla ASCII usted podrá fácilmente buscar en una completa biblioteca, sin ningún programa. De hecho, estos Etexts del Proyecto Gutenberg son tan simples que uno puede hacer una búsqueda en ellos sin siquiera usar un programa intermedio de búsqueda. Norton y otros programas de acceso directo al disco pueden buscar entre sus archivos sin siquiera ponerles nombre, indicando el directorio del etext o lo que sea. Uno puede buscar simplemente desde el disco … Yo hago esto en medio Giga bite de partición del disco, conteniendo todas nuestras ediciones.
|