Desidia PDF

Como parece que no se ha entendido muy bien – mea culpa- el post anterior sobre los PDFs voy a intentar explicar el porqué no se deben utilizar los PDFs y sobre todo las causa de mi diatriba.

Alberto Knapp lo cuenta muy gráficamente en una de sus charlas.

Cada vez que surge una nueva tecnología, esta intenta imitar en su funcionamiento y proceso a la tecnología de la que es heredera. Se piensa y se usa esta nueva tecnología en términos de la tecnología anterior.

Como ejemplo los primeros coches a motor diseñados con una estética y materiales (madera) similares a los de los coches de caballos a los que precedieron. Es más, no sé si habrá fijado que estos coches iniciales eran coches sin techo.  Aunque los conductores de estos nuevos carruajes no necesitaran blandir el látigo para espolear a los caballos, persistía la idea de que los coches debían ser descubiertos, al menos la zona reservada al conductor. Analogías similares encontramos en las primeras películas que no eran más que meras traslaciones del teatro a la pantalla, la invención de la telegrafía, el teléfono, la radio, o la televisión.

Una vez que la nueva tecnología evoluciona y desarrolla sus propios procesos empieza a mostrar sus posibilidades que serán nuevas y distintas de las que se hacían anteriormente.

Si la representación intelectual que nos hacemos sobre la información y el conocimiento son las páginas de un libro o de una revista académica, nos sentiremos cómodos cuando tengamos delante de nosotros esas páginas, o lo más parecido a ellas: el formato PDF. Muchas personas se encuentran todavía en este estadio, para ellos Internet tiene indudables ventajas, pero la siguen viendo como un inmenso almacén donde colocar y conseguir información, eso sí en un formato confortable y familiar: el PDF, como la telegrafía sin hilos o como un coche sin techo.

Pero las cosas han cambiado y no reconocerlo es peligroso, Internet, ya cuenta con espacios nuevos como las redes sociales o los blogs, la información es ubicua sin que sepamos muchas veces su verdadero origen y se comparte y actualiza automáticamente y a extraordinaria velocidad. En Internet la audiencia es a la vez productora de información, hay un nuevo tipo de mensaje que ya no requiere una estructura estandarizada, ni siquiera de un lenguaje uniforme. En estos casos anclarse en formatos antiguos y poco prácticos, es como esos primeros usuarios de la televisión que “encendían” la tele sin abrir las puertas, porque ellos, a lo que estaba acostumbrados era a oír la radio.

Con otro enfoque Rafa Cofiño en su blog llega conclusiones parecidas a las mías e un impagable post titulado Diario de un procastinador.

Un Comentario

  1. DrBonis

    Rafa,
    Sigues anclado en el mismo error conceptual. Confundes continente con contenido.
    El problema no es el PDF sino pensar que «hay un nuevo tipo de mensaje que ya no requiere una estructura estandarizada».
    Desde la perspectiva computacional una entrada de un post o un tuit o un PDF contienen la misma estructura estandarizada (es decir, ninguna): todos están expresados en lenguaje natural.
    Lee por favor sobre las diferencias entre lenguaje formal y lenguaje natural (http://es.wikipedia.org/wiki/Lenguaje_formal http://es.wikipedia.org/wiki/Lenguaje_natural) sobre las dificultades de extraer información del lenguaje natural (http://www.elprofesionaldelainformacion.com/contenidos/1997/enero/procesamiento_del_lenguaje_natural_revisin_del_estado_actual_bases_tericas_y_aplicaciones_parte_i.html) y sobre todo lee algo sobre los modelos de programación por capas (http://es.wikipedia.org/wiki/Programaci%C3%B3n_por_capas), y en especial sobre el patrón de arquitectura MVC (Modelo Vista Controlador):

    http://es.wikipedia.org/wiki/Modelo_Vista_Controlador

    Después de leerlo si quieres discutimos donde está el gran «embudo» computacional para el verdadero aprovechamiento de la «sabiduría de las multitudes», y sobre si el enemigo es el PDF o es el escaso uso de lenguajes formales en la difusión de conocimiento e información.

    Me gusta

    • rafabravo

      Que no Julio , que no , que hablamos de distintas cosas. Al igual que desconozco los conceptos básicos de la física cuántica o se poco de biología molecular, yo no tengo ni idea de informática. Por eso cuando escribo (o tu escribes) «estructura estandarizada»” lenguaje formal» o «lenguaje natural» probablemente nos estemos refiriendo a cosas distintas.

      Me gusta

  2. DrBonis

    Por ponerte un ejemplo ligado a lo que creo que es tu caballo de batalla:

    De nada me sirve que las agencias dejen de distribuir sus boletines farmacoterapeúticos en PDF y empiecen a distribuirlos en posts HTML en un blog. Eso no cambia absolutamente nada a nivel práctico.
    Lo importante es que distribuyeran la información en un lenguaje formal; explicado así para legos… en una «tabla» con campos estandarizados.
    Si lo distribuyen en una tabla, yo puedo computacionalmente juntar las tablas de todas las agencias evaluadoras y hacer un resumen de cuantas han dicho que aporta, cuales han dicho que no aporta, etc, etc…
    Luego ese resumen lo puedo poner en forma de gráfico, de PDF, de powerpoint o incluso que me lo lea una voz como la de los autobuses de Madrid (loquendo).
    Lo importante es que me lo den en un lenguaje formal.
    Lo mismo con las fichas técnicas de los medicamentos, por ejemplo.

    Por cierto, se pueden generar RSS de PDFs, extraer el texto plano y publicarlo en un agregador en HTML.
    También puedes coger un PDF, extraer el texto, separarlo por frases e ir publicándolo en Twitter, una frase cada 5 segundos (si es que eso tiene algún interés).
    Si tanto te agobia el tema, pásate por aquí:
    http://pdftohtml.sourceforge.net/

    Me gusta

    • rafabravo

      Ahora si que nos vamos a entender

      «De nada me sirve que las agencias dejen de distribuir sus boletines farmacoterapeúticos en PDF y empiecen a distribuirlos en posts HTML en un blog. Eso no cambia absolutamente nada a nivel práctico.»

      Si cambia y tu lo sabes, aunque no es mi propuesta tampoco probablemente iría más en lo que tu apuntas después.
      Captas la idea perfectamente y lo que se trata es de convencer a esa gente que cree que con poner un PDF ( como paradigma fácil de atacar), es poner información en Internet para que hagan una cosa parecida a lo que propones, llámalo tablas, lenguaje formal o lo que te parezca.

      Por cierto, se pueden generar RSS de PDFs, extraer el texto plano y publicarlo en un agregador en HTML.También puedes coger un PDF, extraer el texto……

      Como la canción… ya lo sabia mucho antes incluso que http://www.zamzar.com/
      Por cierto ¿hay convertidores de tocapelotas a «gente normal»? 🙂 pero tu no los utilices, que así eres mucha más divertido

      Me gusta

  3. drbonis

    Rafa,

    Si yo la idea la he captado perfectamente desde el principio. Pero tú no me has entendido hasta que lo he explicado «pa tontos» (pa tontos informáticos, me refiero).

    El problema inmediato es que propones atacar un «enemigo fácil» (la costumbre de publicar en PDF). Pero como es el enemigo equivocado, es muy probable que lo único que consigas es malgastar energías sin atacar el meollo del asunto.

    El problema de fondo es que en la «sociedad espectáculo» se confunde a menudo saber informática con ser aficionado a la informática. El discurso del 2.0 promueve mucho esto, y surgen «expertos en eSalud» como churros, que en realidad son como mucho expertos en usar aplicaciones web y en navegar por internet.

    Por supuesto podría optar por no «tocarte las pelotas» y simplemente retuitearte, mandarte superabrazos dospuntocéricos y aplaudirte aún sabiendo que algunas de las cosas que dices son erróneas.

    Me gusta

    • rafabravo

      Pues ha costado ¡dios mío!, da igual que el gato sea blanco o negro , pdf o css lo importante es que caze ratones
      En cuanto lo de “tonto informático” es para mí un honor , ya sabes que como Sacket no me gusta ser experto en nada y menos en una cosa con tan poco glamour como la informática o tan vaporosa como la e-salud o “ijel”
      Por otro lado supongo que entre tocapelotas y abrazafarolas 2.0, habrá un término medio ( que no moderado), aunque te prefiero así antes que borjahappycirujanomegabrazo; como te dije es más divertido.

      Me gusta

  4. drbonis

    By the way,
    No te recomiendo usar Zamzar.
    Siempre que puedas resolver un problema en tu disco duro local, evita resolverlo a través del servidor de un tercero.

    Me gusta

Deja un comentario

Este sitio utiliza Akismet para reducir el spam. Conoce cómo se procesan los datos de tus comentarios.