BandaAncha

  • 🔍 en 📰 artículos ⏎
  • 🔍 en 💬 foros ⏎
  • 🔍 en 👇 este 💬 foro ⏎
  • 🔍 en 👇 este 💬 tema ⏎
Regístrate Regístrate Identifícate Identifícate
ADSL

Manual ultra-mega grande de 30,7 MB del Comtrend CT-500 pasarlo a pdf pequeño

MulderX69

Bueno propongo esto, que el manual que nosa dan es una burrada de grande ya que son todo fotos escaneadas y no es texto puro, me gustaria extraer las fotos de cada pagina y abrirlas con un programa de OCR para que extraiga el texto de la imagen y al final crear un nuevo PDF pero de solo texto que ocuparia una o dos megas y subirlo online.

Lo que pasa es que no tengo el software adecuado, hace falta el Adobe Acrobat no para despellejar un pdf ? no lo tengo y con el acrobat reader me queda fatal haciendo copy paste.

No dispongo de software OCR ya que no tengo scanner y lo shareware que he encontrado es una K K.

Alguna ayudita ? alguien se anima a ayudar a la comunidad y tener un manual decente en castellano que sea facil de descargar ?

Este tema está cerrado a nuevas respuestas. Abre un nuevo tema para retomar la conversación.
walker

Hola Mulder. Yo tengo el Acrobat y no habría problemas para la escritura del PDF final. El problema es que, como tu díces, las páginas están tomadas como imágenes y habría que sacar como unas 75 'fotos' (dos por página calculo) para luego procesarlas con el OCR y repasar el formato posterior... lo dicho, mucho curro para uno sólo...

Yo estoy dispuesto, si te parece, a hacer la mitad: pasar el OCR y convertirlo todo a texto plano. Luego tu le das un formato 'bonito' con un editor de texto, me lo remites de vuelta y yo lo paso a PDF ¿hace?

Saludos a Scully

walker
hellwalker@bigfoot.com
perso.wanadoo.es/jmmoralesv/

🗨️ 1
BocaDePez

existe en internet una aplicación que viene con dos programitas: uno extrae texto y otro imágenes de un pdf
de esta forma, extrae por separado lo que queramos...

el programa en cuestión es: xpdf-0.92-dos6-djgpp.zip

lo podréis encontrar en:

filesearching.com/cgi-bin/s?q=xpdf-0.92-…&t=f&d=&l=en

BocaDePez

eso