Wydobywanie tekstu z zabezpieczonego PDFa

Dzisiaj musiałem z pewnego PDFa wyciągnąć tekst, który był mi potrzebny. Normalnie to wystarczy, że w KPDF zaznaczę tekst i wybieram “kopiuj tekst do schowka” i po sprawie. Jednak skoro dokument jest zabezpieczony, a ja nie mogę kopiować jego zawartości to co zrobić ?

Sprawa jest całkiem prosta. Wystarczy, że otworzysz tego PDFa i wydrukujesz to pliku PDF (paczka “cups-pdf” pod Ubuntu). Ale zaraz, PDFa drukować do PDFa? Tak! Kawał polega na tym, że zostanie zapisana dokładna kopia dokumentu, z tą różnicą, że nie będzie już zabezpieczeń. Po tej malutkiej sztuczce mogłem moim KPDF kopiować tekst z “wydrukowanego” pliku. Jedynym problemem było to, że część materiału w oryginalnym dokumencie było już zapisane jako obrazek i tego już nie szło zapisać jako tekst ;-) (ok, dałoby radę gdybym użył jakiegoś OCR, ale nie o tym mowa ;p )

8 Responses to “Wydobywanie tekstu z zabezpieczonego PDFa”

  1. Michał Górny March 10, 2007 at 9:59 pm #

    To już kiedyś było… http://ja-joanna.jogger.pl/2006/11/01/zabezpieczenia-pliku-pdf-i-drukowanie-kilku-stron-na-jednej/

  2. radmen March 10, 2007 at 9:59 pm #

    ech.. i jak zwykle dowiaduję się, że coś takiego już było.. :/

  3. jpc March 10, 2007 at 9:59 pm #

    Drukowanie przez CUPSa ma taką wadę, że pójdzie poprzez PostScript i potem spowrotem przez Ghostscripta do PDF. Często powoduje to przyrost objętości x10.

    btw. Zabezpieczanie PDF-ów jest głupie, ale to już wiemy, nie? ;]

  4. macholl March 10, 2007 at 9:59 pm #

    Radek, szmato, w koncu mozna komentowac bez logowania :D

  5. radmen March 10, 2007 at 9:59 pm #

    Macholl, cipqo można już od dawna, ale te Twoje głupoty będę po prostu kasować :]

  6. Jedras March 10, 2007 at 9:59 pm #

    Witam, a czy jest mozliwe wydobycie obrazkow z zabezpieczonego pdf’a ?!

  7. bloom March 10, 2007 at 9:59 pm #

    Po co program???

    http://www.ensode.net/pdf-crack.jsf

  8. Arche March 10, 2007 at 9:59 pm #

    bloom, tam jest limit, 5mb na plik… niektóre mają więcej niż 5…