Damian 1.533 Geschrieben 27. Mai 2016 Melden Teilen Geschrieben 27. Mai 2016 HalloIch habe hier ein seltsames Problem mit einem PDF-Dokument. Das PDF wird im Viewer korrekt angezeigt, doch wenn ich Text daraus kopiere, wird dieser Text (egal bei welchem Editor) ohne jegliches Leerzeichen zwischen Wörtern, Zahlen oder Satzzeichen übernommen. Aus einem kopierten Absatz mit mehreren Zeilen wird also ein einziger Bandwurmsatz.Selbst Konvertierungs-Tools (PDF zu RTF/DOC/HTML usw.) übernehmen diese eigenartige Formatierung.Die Eigenschaften des PDF: PDF-Version 1.3 Erstellt in QuarkXPress 8.01 Schriftarten sind eingebettet Öffentliches Dokument ohne jegliche Einschränkungen Ich vermute als Quelle dieses Verhaltens QuarkXPress. Ob Absicht, Fehlkonfiguration oder Bug kann ich nicht einschätzen. Was mich verwundert ist, das diese Formatierung in einem Standardformat wie PDF wirksam ist. Nochmal, die Anzeige im PDF-Viewer ist völlig in Ordnung. Andere Dokumente aus der gleichen Quelle machen keine Probleme.Ich habe für mich eine Lösung gefunden. Das PDF im Opera-Browser mit dem internen PDF-Viewer anzeigen lassen. Dort kann der Text problemlos und fehlerfrei heraus kopiert werden.Kennt sich hier jemand mit QuarkXPress aus und kann mir dieses Verhalten etwas näher erklären? Wenn es als reguläre Option im Programm angeboten wird, wofür benötigt man so etwas?Bin gespannt auf die Antworten.Damian Zitieren Link zu diesem Kommentar
blub 115 Geschrieben 27. Mai 2016 Melden Teilen Geschrieben 27. Mai 2016 Hallo Damian, QuarkXPress kenne ich leider nicht. Wir erstellen unsere Dokumente alle mit LateX. Bei LateX erstellt man einen Asciitext, der verschiedenste Formatierungstags enthält und am Ende ins PDF-Format kompiliert wird. Ähnlich wie bei HTML gibt es in einem Dokument hunderte von verschachtelten, öffnenden und schließenden solcher Tags. Und auch wie bei HTML kann ein "Programmier"-Fehler zu verschiedensten, unspezifischen Effketen führen: von "das Dokument kann gar nicht kompiliert/ gelesen werden", bis zu solchen Dingen wie du sie beschreibst. Besonders wenn man die Warnungen beim Kompilieren nicht ernst nimmt. Wenn Quark ein ähnliches Prinzip wei LateX hat, würde ich den Fehler hier vermuten. blub Zitieren Link zu diesem Kommentar
Damian 1.533 Geschrieben 27. Mai 2016 Autor Melden Teilen Geschrieben 27. Mai 2016 Hallo LateX ist ein Textsatz-Programm, um den Druck zum Beispiel von Büchern vorzubereiten. QuarkXPress hingegen ein Layout-Programm, um zum Beispiel Magazine, Broschüren und dergl. zu entwerfen. Die Arbeitsweise ist auch völlig unterschiedlich, von daher nicht vergleichbar. Trotzdem Danke fürs Lesen und für die Antwort. :) Damian Zitieren Link zu diesem Kommentar
blub 115 Geschrieben 27. Mai 2016 Melden Teilen Geschrieben 27. Mai 2016 war ein Versuch Zitieren Link zu diesem Kommentar
MrCocktail 192 Geschrieben 29. Mai 2016 Melden Teilen Geschrieben 29. Mai 2016 Aber vielleicht dennoch der richtige Ansatz ... Vielleicht hat jemand einen Index erstellen wollen, PDF kann bewusst einen Text vorgeben, der beim kopieren erwischt werden soll. Grafik im Vordergrund, ASCII für Suche usw im Hintergrund. Nutzt man zum Beispiel in dem Bereich OCR häufig. GrussJ Zitieren Link zu diesem Kommentar
Damian 1.533 Geschrieben 29. Mai 2016 Autor Melden Teilen Geschrieben 29. Mai 2016 Hi Wäre denkbar, aber es handelt sich um ein standartisiertes PDF, das regelmäßig erscheint. Es ist das Amtsblatt der Stadt Duisburg. Wer selber mal schauen möchte: http://www.duisburg.de/rathaus/rathaus/publikationen/102010100000216500.php Bis einschließlich Ausgabe Nr. 12 gab es keine Probleme. Nr. 13 ist das von mir beschriebene Problem-PDF. Nr. 14 ist sogar noch abgedrehter, da bekommt man beim Kopieren statt Text nur Zeichensalat. Bei Nr. 15 ist wieder alles ok. Ich gehe inzwischen von einem Bedienungs-/Einstellungsfehler in QuarkXPress aus. Darum habe ich anfangs auch gefragt, ob es eine offizielle Option in diesem Programm ist und wofür man sie braucht. Damian Zitieren Link zu diesem Kommentar
Gulp 254 Geschrieben 30. Mai 2016 Melden Teilen Geschrieben 30. Mai 2016 Hmm also bei mir habe ich den beschriebenen Fehler in Nr. 13 mit Adobe Reader nicht, da bekomme ich sogar den exakten Block so in meinen Editior, wie er im PDF gesetzt ist, mit Leerzeichen etc. Den Zeichensalat bei nr. 14 habe ich allerdings auch ...... merkwürdig. Grüsse Gulp Zitieren Link zu diesem Kommentar
Damian 1.533 Geschrieben 30. Mai 2016 Autor Melden Teilen Geschrieben 30. Mai 2016 Habe auf PDF Nr. 13 jetzt mal einen anderen PDF-Viewer angesetzt. Dort erscheint an Stelle der Leerzeichen ein Fragezeichen. Das PDF hat anscheinend eine ganz krude Formatierung bekommen. Etwas, das nur bei der Anzeige in den PDF-Viewern funktioniert. Vielleicht wollte da jemand bei den Einstellungen in QuarkXPress besonders kreativ sein. :rolleyes: Damian Zitieren Link zu diesem Kommentar
Dunkelmann 96 Geschrieben 30. Mai 2016 Melden Teilen Geschrieben 30. Mai 2016 Ich hab mir mal die Nr. 14 angeschaut. Sieht recht komisch aus. Mit dem OCR Feature von Pdf-Xchange Viewer (Option Originalinhalt in Bild konvertieren und Textebene hinzufügen) war das Ergebnis einigermaßen brauchbar. Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.