Descargar libremente desde Slideshare
Un cliente de posicionamiento web me ha preguntado como descargar esa fantástica presentación de su competencia que tanto le gusta. Él lo hacía mediante capturas de pantalla que guardaba en una carpeta. Un proceso algo lento si el documento tiene muchas páginas. Incluso el pobre cliente estuvo slideshare downloader online en google a ver si encontraba algo. Pero que mejor que hacer las cosas tu mismo. Así que me he puesto manos a la obra para optimizar el proceso de descarga desde slideshare. Todo esto de forma gratuita 100% mediante el siguiente truco para descargar utilizando la consola de linux, curl e imagemagik.
¿Cómo descargar diapositivas de Slideshare bloqueadas, protegidas o sin bloquear?
Para bajar las diapositicas de Slideshare.net, primero tenemos que ver el código fuente de la página (pulsar CTRL+U en Firefox o en Google Chrome). Una vez abierto buscaremos el siguiente código:
<img class="slide_image"....
Mientras no cambie el código html de slideshare no habrá problema. El primer
ítem encontrado será la imagen correspondiente con un código como este:
<img class="slide_image" src="http://image.slidesharecdn.com/......-phpapp01/95/slide-1-638.jpg?......." data-normal="http://image.slidesharecdn.com/......-phpapp01/95/slide-1-638.jpg?...." data-full="http://image.slidesharecdn.com/......-phpapp01/95/slide-1-1024.jpg?....." data-small="http://image.slidesharecdn.com/.....-phpapp01/85/slide-1-320.jpg?" />
A partir de la url de la imagen abrimos la consola de linux y escribimos la siguiente instrucción de curl:
curl -O http://image.slidesharecdn.com/....1.....-phpapp01/95/slide-[1-n]-resolucion.jpg
La orden curl es la encargada de descargar las imágenes una a una. Con esa expresión vemos que el nombre de las imágenes es el mismo si exceptuamos su número. Rellenando los datos especiales para cada presentación:
- ….1….. habrá que colocar el texto correspondiente.
- [1-n] n es el número de páginas que tiene la presentación. Si tiene 95 páginas deberás poner [1-95]
- En resolución deberás poner el número que te da el tamaño de la imagen. 1024 suele estar siempre pero las demás resoluciones disponibles están en al anterior código fuente.
Con esto tendremos todas las imágenes descargadas pero a lo mejor queremos hacer un pdf con ellas por comodidad. La orden que hay que hacer sería esta:
convert `ls slide-* | sort -n -t - -k 2` slideshare.pdf
Donde le estamos diciendo que ordene las imágenes por orden numérico y las convierta a un archivo pdf de nombre slideshare. Podéis cambiar el nombre claro.
Aclaraciones:
Si no tenéis instalado curl lo podéis hacer desde la fuente http://curl.haxx.se/download.html.
Si no tienes instalado imagemagick no podrás utilizar la orden convert. Puedes probar de instalar con el siguiente código:
sudo apt-get install imagemagick
He utilizado la orden -compress pero no he notado cambios significativos en los ejemplos para elaborar este artículo.
Este tutorial se basa y ha sido probado en el sistema operativo linux y similares (Unix, BSD, Solaris,…).
Si tienes instalado windows puedes bajar curl y quizás algún emulador de linux pero es casi mejor utilizar un livecd o livedvd como el de gentoo que ya viene con todo instalado.
Si no te has pasado todavía a linux te recomiendo Lubuntu funciona mucho más rápido que cualquier Windows.
Edito: Estaba haciendo el proceso y he visto algo que ha cambiado al menos hoy. El código fuente que me salía era este:
<div id="main_div"> <div> <iframe src="http://www.slideshare.net/slideshow/embed_code/......." marginwidth="0" marginheight="0" allowfullscreen="" webkitallowfullscreen="" mozallowfullscreen="" frameborder="0" height="390" scrolling="no" width="480"></iframe>
Con ver el código fuente de iframe cargado por javascript ya es suficiente para seguir con los anteriores pasos sin problema.
Ya sólo te queda ver esas diapositivas en tu kindle o lector de libros favoritos.
Pues muy útil, muchas gracias y feliz verano !!
Funciona muy bien. Muchas gracias!!
Muchas gracias. Hay que leer el código y ver que url es la de la primera imagen y luego ver cuantas diapositivas son. Y perfecto
es en windows o linux????? no puedo completar el prodecimiento
En linux
Bueno script. Me gusta bajar las slides de los grandes maestros de internet. Podrías escribir mas scripts para descargar mas información seria de internet. Slideshare es una de mis fuentes de sabiduria mas preciadas y hay muchas mas de las que no puedo descargar ningun fotografia. Tu serias mas amable si nos muestras el camino. Perdona mi español. Lo he traducido con ayuda de google translate
Excelente, muy bueno pero al generar el PDF los paginas estaban ordenada de 1, 10 , no me salian en orden correcto, tuve que cambiael comando convert a este «convert `ls estudio-del-trabajo-* | sort -V -t – -k 2` slideshare.pdf» , utilizando la opcion -V en vez de -n
Ahora solo teneis que hacer la version de windows, para que todo el mundo pueda emplearlo.
UNA VERSION con interfaz grafico, y no una puta linea de comandos como si estubiramos en 1970…
Si tuviera tiempo… no es mala idea.. pero si hiciera eso le tendría que poner publicidad o que los usuarios pagasen algo… es mucho tiempo de desarrollo.
Ingenioso, me ha ahorrado leerme un tocho desde el ordenador.
Ahora, a mi no me ordena los documentos correctamente, he tenido que utilizar el la siguiente linea
$ for i in `seq 1 298`; do echo -e archivo-$i-1024.jpg >> prueba ; done
$ convert `cat prueba` archivo.pdf
Por lo demás genial!. Aunque hace años que no utilizo Linux como escritorio, con el Bash Ubunto en Windows ha funcionado sin problemas. Un año de esto regreso a Linux!
Gracias y saludos,
Everything is very open with a clear explanation of the challenges.
It was definitely informative. Your website is extremely helpful.
Thank you for sharing!