Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > de.comp.os.unix.apps.misc > #3774

Re: [Linux] Von PDF nach PDF

From Andreas Kohlbach <ank@spamfence.net>
Newsgroups de.comp.os.unix.apps.misc
Subject Re: [Linux] Von PDF nach PDF
Date 2023-12-29 00:02 -0500
Organization A noiseless patient Spider
Message-ID <87zfxteh3u.fsf@usenet.ankman.de> (permalink)
References <87a5ptg7qh.fsf@usenet.ankman.de> <inj16k-2e7u1.ln1@martin.dont-email.me>

Show all headers | View raw


On Fri, 29 Dec 2023 02:24:27 +0100, Martin Schnitkemper wrote:
>
> Am Do, 28.12.2023 um 19:41 schrieb Andreas Kohlbach:
>
>> Ich habe hier ein PDF, was offenbar ein Foto (eingekapselt in PDF)
>> ist. Dort kann ich im Viewer (atril) keinen Text markieren, obwohl dieser
>> sehr gut lesbar ist.
>
> Wahrscheinlich handelt es sich dabei um ein eingescanntes Dokument und
> nicht um ein als Ausgabe einer Anwendung erzeugtes PDF. Damit ist es nicht
> durchsuchbar. 

Mag sein. Ich finde die Quelle nicht mehr.

>> Wie bekomme ich das in ein PDF mit selektierbarem Text? Möglichst mittels
>> Kommandozeilen-Programm, was keine GUI hat (oder braucht).
>
> Ich mache das mit ocrmypdf:
> https://github.com/ocrmypdf/OCRmyPDF
>
> Damit kann man unter Zuhilfenahme von tesseract ein durchsuchbares (und
> natürlich auch markierbares) PDF erstellen.

Das hat geholfen, danke! Ging wiedererwartend fix auf meiner betagten
Kiste.

Werde das Ergebnis auf archive.org hochladen.
-- 
Andreas

Back to de.comp.os.unix.apps.misc | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

[Linux] Von PDF nach PDF Andreas Kohlbach <ank@spamfence.net> - 2023-12-28 19:41 -0500
  Re: [Linux] Von PDF nach PDF Martin Schnitkemper <news.trash.5.mschnitk@spamgourmet.com> - 2023-12-29 02:24 +0100
    Re: [Linux] Von PDF nach PDF Andreas Kohlbach <ank@spamfence.net> - 2023-12-29 00:02 -0500
      Re: [Linux] Von PDF nach PDF Michael Pachta <mipani@gmx.de> - 2023-12-29 13:40 +0100
        Re: [Linux] Von PDF nach PDF Andreas Kohlbach <ank@spamfence.net> - 2023-12-29 14:27 -0500
          Re: [Linux] Von PDF nach PDF Michael Pachta <mipani@gmx.de> - 2023-12-30 09:34 +0100
            Re: [Linux] Von PDF nach PDF Andreas Kohlbach <ank@spamfence.net> - 2023-12-30 12:31 -0500
              Re: [Linux] Von PDF nach PDF Kay Martinen <usenet@martinen.de> - 2024-02-16 22:05 +0100
                Re: [Linux] Von PDF nach PDF Andreas Kohlbach <ank@spamfence.net> - 2024-02-16 19:17 -0500
      Re: [Linux] Von PDF nach PDF Christian Garbs <mitch@cgarbs.de> - 2024-01-02 19:53 +0000
        Re: [Linux] Von PDF nach PDF Andreas Kohlbach <ank@spamfence.net> - 2024-01-02 17:01 -0500
          Re: [Linux] Von PDF nach PDF Christian Garbs <mitch@cgarbs.de> - 2024-01-12 08:14 +0000
          Re: [Linux] Von PDF nach PDF Sebastian Barthel <naitsabes@freenet.de> - 2024-03-01 16:21 +0000
            Re: [Linux] Von PDF nach PDF Andreas Kohlbach <ank@spamfence.net> - 2024-03-01 13:33 -0500

csiph-web