BITTE helfen Sie uns HEUTE mit einer SPENDE
Helfen Sie das OpenOffice Forum zu erhalten!

DANKE >><< DANKE

> KEINE WERBUNG FÜR REGISTRIERTE BENUTZER!<
Ihre Spende wird für die Deckung der laufenden Kosten sowie den Erhalt und Ausbau 🌱 des OpenOffice Forums verwendet.
🤗 Als Dankeschön werden Sie im Forum als OO-SUPPORTER gekennzeichnet. 🤗

Buch gescannt

WRITER hat alles, was Sie von einer modernen, voll ausgestatteten Textverarbeitung erwarten.
Antworten
Cake
Beiträge: 3
Registriert: Sa 11. Nov 2017, 21:49

Buch gescannt

Beitrag von Cake » Sa 11. Nov 2017, 22:42

Hi all,

habe mal ein altes Buch eingescannt (das es nicht als ebook gibt und zu 99% auch nicht geben wird) und in OO die Rechtschreib-Fehler ausgebügelt.

1. Überflüssig sind nur noch die Seitenzahlen, weil die sonst auf dem ebook-Reader enorm stören würden. Wie bekomme ich es hin, dass die auf Knopfdruck mit einem Mal alle gelöscht werden? Beim Stichwort Fusszeile hab ich nix gefunden (oder übersehen).

2. Im Text sind viele kleine rote Pfeile wo Teile des Textes "versteckt" bzw. abgeschnitten werden. Wie kann ich das umgehen und den Text vollständig anzeigen lassen? Wozu soll das eigentlich gut sein? Ist doch Platz genug.

3. Warum hält sich OO nicht an das originale Layout? Die letzte Zeile einer Seite reicht oft nicht bis zum rechten Rand was im Original aber natürlich so ist. Ich kann das weder mittels Blocksatz noch als Notlösung per Leertaste ausbügeln. Das ist wie in Stein gemeißelt.

Mehr fällt mir jetzt erstmal nicht ein, wäre für jeden Tipp sehr dankbar!

nikki
Beiträge: 573
Registriert: Sa 30. Jul 2016, 14:14
Kontaktdaten:

Re: Buch gescannt

Beitrag von nikki » So 12. Nov 2017, 10:05

Hallo,
ich gehe davon aus, obwohl dazu Deinerseits jegliche Information fehlt, dass das Dokument nach dem SCAN nicht als ODF vorliegt, sondern in irgendeinem Fremdformat.

Enthält das Dokument keine Kopf- oder Fußzeilen mit enthaltenen Seitennummern können diese natürlich auch nicht auf Knopfdruck entfernt werden.
Gruß

--------------------------------------------------------
Win.10 Prof. 64-bit, AOO 4.1.7, LO 6.3.4 (x64)

Benutzeravatar
miesepeter
Beiträge: 565
Registriert: Fr 29. Mär 2013, 10:39
Wohnort: Bayern

Re: Buch gescannt

Beitrag von miesepeter » So 12. Nov 2017, 12:19

Cake hat geschrieben:
Sa 11. Nov 2017, 22:42
2. Im Text sind viele kleine rote Pfeile wo Teile des Textes "versteckt" bzw. abgeschnitten werden.
Du müsstest eine Beispieldatei hochladen. Das könnten Tabellenzellen oder Rahmen sein, die sich so verhalten. Und ja: Wie nikki schon schreibt, manches deutet auf Fremdformat (RTF? DOC?) hin, das nicht so einfach zu bearbeiten ist oder im Hintergrund laufende Unverträglichkeiten produziert... Ciao

Cake
Beiträge: 3
Registriert: Sa 11. Nov 2017, 21:49

Re: Buch gescannt

Beitrag von Cake » Mo 13. Nov 2017, 05:46

Texterkennung nach dem Scannen wurde mit Abbyy Finereader durchgeführt und gleich danach gespeichert als odt (der Finereader gibt einem die Möglichkeit den erkannten Text in diversen Formaten zu speichern).

@nikki
Hatte doch geschrieben, dass Seitenzahlen vorhanden sind....dass ich nix entfernen kann was nicht da ist ist schon klar....

pitzy
Beiträge: 58
Registriert: Do 17. Mai 2012, 11:55

Re: Buch gescannt

Beitrag von pitzy » Mo 13. Nov 2017, 10:26

Zwar werden die Buchseiten in einem .odt-Format gespeichert und sind somit mit OO les- und bearbeitbar, jedoch ist die Struktur der Seite nur annähernd dem Original nachempfunden. Abhägig ist dies auch noch, welche Layout-Optionen beim Finereader zur Verfügung stehen.

Ich selbst nehme momentan Readiris Home, wo man zwischen a) kontinuierlichem Text, b) Wort- und Paragraph-Formatierung beibehalten und c) Originaldokument wiederherstellen wählen kann. Im Resultat werden ein unterschiedliche Zahl von Texrahmen erzeugt, in denen dann die Fragmente stehen, ggf. sogar mit Bildteilen. Aber alle diese folgen keinem vorgegebenen Struktur-Schema, so dass man keineswegs die Seitenzahlen in einem Ruck entfernen kann. Es ist immer viel Handarbeit angesagt, bis man den reinen Text hat, den man dann selbst formatieren muss, wenn man ein bearbeitbares Buch wiederherstellen will. Alternativ kann man ja z.B. primär ein pdf erzeugen. Jede Seite ist dann ein Bild, originalgetreu, aber kaum textlich bearbeitbar.
win7pro / Avira / AOO 4.1.3 / LO 4.4.7.2

pitzy
Beiträge: 58
Registriert: Do 17. Mai 2012, 11:55

Re: Buch gescannt

Beitrag von pitzy » Mo 13. Nov 2017, 10:32

Ergänzend: Die roten Pfeile am Ende sagen nur, dass der Text weitergeht, aber der Rahmen leider nicht mehr hergibt. Da hilft nur:
1. Allen Text markieren (strg+A),
2. dann den Text "normalisieren" (strg+M , falls nicht wirksam dann über Menü Schrift Standard wählen)
3. dann den Text schließlich soweit verkleinern, dass man alles lesen kann

Zu Deiner letzten Frage, warum OO sich nicht an das Oritginal-Layout hält. Ja, das Original-Layout hat der Finereader (wie alle vergegleichbaren Programme) nicht exportieren gekonnt. Also liegt es nicht an OO.
win7pro / Avira / AOO 4.1.3 / LO 4.4.7.2

Cake
Beiträge: 3
Registriert: Sa 11. Nov 2017, 21:49

Re: Buch gescannt

Beitrag von Cake » Do 16. Nov 2017, 20:31

OK, ich dachte halt, dass odt gleich odt ist....mein Denkfehler!
Werde mal etwas rumprobieren, vielleicht kommt was raus was mir gefällt.

Danke Euch!

nikki
Beiträge: 573
Registriert: Sa 30. Jul 2016, 14:14
Kontaktdaten:

Re: Buch gescannt

Beitrag von nikki » Fr 17. Nov 2017, 10:31

Cake hat geschrieben:
Do 16. Nov 2017, 20:31
OK, ich dachte halt, dass odt gleich odt ist....mein Denkfehler!
Die Dateiendung, wie z. B. .odt, ist völlig unerheblich. Diese dient lediglich dem Betriebssystem zur Programmverknüpfung, bzw. den Programmmodulen.

Maßgeblich ist allein der Inhalt einer Datei, der letztlich das Dateiformat bestimmt. Wird das Dateiformat von einem Drittprogramm bei der Konvertierung schlecht umgesetzt, ist dafür nicht das öffnende Programm (im vorliegenden Fall Apache OpenOffice) verantwortlich.
Gruß

--------------------------------------------------------
Win.10 Prof. 64-bit, AOO 4.1.7, LO 6.3.4 (x64)

Antworten