lunes, 25 de abril de 2011

Continuar una descarga fallida en Firefox con Ubuntu


A veces pasa que estamos descargando un archivo grande desde un servidor tipo: Rapidshare, Megaupload, Filefactory, Mediafire, Depositfiles, Shareflare... y falla la descarga por alguna razón, el problema es que si intentamos reanudarla con Firefox, falla y tendremos que empezar desde el principio, perdiendo todo lo descargado...

Esto pasa por que la mayoría de estos servidores tienen bastantes restricciones para usuarios gratuitos, limitando el numero de descargas, numero de megas, o que no se puedan continuar descargas, ya que dan una ruta distinta para cada descarga...


Pues voy a explicar un método muy sencillo para continuar esa descarga y no perder todo lo que tenemos descargado, con un comando muy útil en consola, el comando wget y el parámetro -c.

Cuando Firefox empieza la descarga de un archivo, crea dos archivos, uno con el nombre normal del archivo (vacío hasta que termina la descarga) y uno temporal con el mismo nombre terminado en ".part" con lo que lleva descargado del archivo hasta el momento.

Pues bien, para continuar una descarga fallida:

Elimina el archivo con el nombre normal y quita la extensión .part del otro, (haz una copia de ambos antes de nada, por seguridad) pon el archivo en tu carpeta de usuario, abre un terminal y consigue un nuevo enlace para iniciar una descarga del mismo archivo:

Para obtenerlo, entramos a Firefox en el servidor que sea, y en el ultimo botón al que pulsamos para que nos salte ya la descarga del archivo, le damos al botón derecho y pinchamos con el botón normal en "copiar la ruta del enlace" .

Ahora solo nos queda pegarlo en la consola, después de:
wget -c "pegar aquí la nueva ruta sin las comillas"

Pulsamos intro, reconocerá lo que teníamos descargado y continuara la descarga por donde fallo!!!

Nota: Para los usuarios de Ms Windows también esta disponible wget, podéis bajarlo de aquí y usarlo en la consola virtual de MSDOS (Alt+F2, y luego en ejecutar escribir: cmd y pulsar intro)

domingo, 3 de abril de 2011

Editar texto escaneado en Ubuntu 10.10 : Usando software OCR

Cuando escaneamos un documento no es posible editarlo ya que se escanea como si fuera una foto.

Si queremos editarlo, necesitamos para esta tarea un software OCR, que se encarga de reconocer las imágenes de cada letra y convertirlas en su correspondiente letra, para poder usarla con cualquier programa de edición de texto, cosa nada sencilla ya que existen muchos tipos de letra e idiomas.

Para esta tarea los usuarios de gnu/Linux y en concreto Ubuntu disponemos de algunos programas descargables desde el centro de software Ubuntu, he probado varios pero ninguno me convencía hasta que probé gscan2pdf + Tesseract con Español.

Su instalacion es sencilla ya que los dos los tenemos en repositorios, abrimos un terminal y pegamos esto:

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-spa

Le desimos que si, y metemos la clave de administrador y se intalara en:
Aplicaciones / Graficos / gscan2pdf

La abrimos y pulsamos el icono del escaner, (Tenemos que tener el escaner funcionando)

Con la siguientes opciones he tenido muy buenos resultados en el reconocimiento:

- Tenemos que seleccionar Tsseract como programa OCR y Español para el idioma.

- En las opciones de escaneo, he puesto 300 de Resolución y Escala de Grises en vez de Blanco y Negro