BITTE helfen Sie uns HEUTE mit einer SPENDE
Helfen Sie das OpenOffice Forum zu erhalten!
> KEINE WERBUNG FÜR REGISTRIERTE BENUTZER!<
Ihre Spende wird für die Deckung der laufenden Kosten sowie den Erhalt und Ausbau 🌱 des OpenOffice Forums verwendet.
🤗 Als Dankeschön werden Sie im Forum als OO-SUPPORTER gekennzeichnet. 🤗
Buch gescannt
Buch gescannt
Hi all,
habe mal ein altes Buch eingescannt (das es nicht als ebook gibt und zu 99% auch nicht geben wird) und in OO die Rechtschreib-Fehler ausgebügelt.
1. Überflüssig sind nur noch die Seitenzahlen, weil die sonst auf dem ebook-Reader enorm stören würden. Wie bekomme ich es hin, dass die auf Knopfdruck mit einem Mal alle gelöscht werden? Beim Stichwort Fusszeile hab ich nix gefunden (oder übersehen).
2. Im Text sind viele kleine rote Pfeile wo Teile des Textes "versteckt" bzw. abgeschnitten werden. Wie kann ich das umgehen und den Text vollständig anzeigen lassen? Wozu soll das eigentlich gut sein? Ist doch Platz genug.
3. Warum hält sich OO nicht an das originale Layout? Die letzte Zeile einer Seite reicht oft nicht bis zum rechten Rand was im Original aber natürlich so ist. Ich kann das weder mittels Blocksatz noch als Notlösung per Leertaste ausbügeln. Das ist wie in Stein gemeißelt.
Mehr fällt mir jetzt erstmal nicht ein, wäre für jeden Tipp sehr dankbar!
habe mal ein altes Buch eingescannt (das es nicht als ebook gibt und zu 99% auch nicht geben wird) und in OO die Rechtschreib-Fehler ausgebügelt.
1. Überflüssig sind nur noch die Seitenzahlen, weil die sonst auf dem ebook-Reader enorm stören würden. Wie bekomme ich es hin, dass die auf Knopfdruck mit einem Mal alle gelöscht werden? Beim Stichwort Fusszeile hab ich nix gefunden (oder übersehen).
2. Im Text sind viele kleine rote Pfeile wo Teile des Textes "versteckt" bzw. abgeschnitten werden. Wie kann ich das umgehen und den Text vollständig anzeigen lassen? Wozu soll das eigentlich gut sein? Ist doch Platz genug.
3. Warum hält sich OO nicht an das originale Layout? Die letzte Zeile einer Seite reicht oft nicht bis zum rechten Rand was im Original aber natürlich so ist. Ich kann das weder mittels Blocksatz noch als Notlösung per Leertaste ausbügeln. Das ist wie in Stein gemeißelt.
Mehr fällt mir jetzt erstmal nicht ein, wäre für jeden Tipp sehr dankbar!
Re: Buch gescannt
Hallo,
ich gehe davon aus, obwohl dazu Deinerseits jegliche Information fehlt, dass das Dokument nach dem SCAN nicht als ODF vorliegt, sondern in irgendeinem Fremdformat.
Enthält das Dokument keine Kopf- oder Fußzeilen mit enthaltenen Seitennummern können diese natürlich auch nicht auf Knopfdruck entfernt werden.
ich gehe davon aus, obwohl dazu Deinerseits jegliche Information fehlt, dass das Dokument nach dem SCAN nicht als ODF vorliegt, sondern in irgendeinem Fremdformat.
Enthält das Dokument keine Kopf- oder Fußzeilen mit enthaltenen Seitennummern können diese natürlich auch nicht auf Knopfdruck entfernt werden.
Gruß
--------------------------------------------------------
Win.10 Prof. 64-bit, AOO 4.1.7, LO 6.3.4 (x64)
--------------------------------------------------------
Win.10 Prof. 64-bit, AOO 4.1.7, LO 6.3.4 (x64)
- miesepeter
- Beiträge: 565
- Registriert: Fr 29. Mär 2013, 10:39
- Wohnort: Bayern
Re: Buch gescannt
Du müsstest eine Beispieldatei hochladen. Das könnten Tabellenzellen oder Rahmen sein, die sich so verhalten. Und ja: Wie nikki schon schreibt, manches deutet auf Fremdformat (RTF? DOC?) hin, das nicht so einfach zu bearbeiten ist oder im Hintergrund laufende Unverträglichkeiten produziert... Ciao
Re: Buch gescannt
Texterkennung nach dem Scannen wurde mit Abbyy Finereader durchgeführt und gleich danach gespeichert als odt (der Finereader gibt einem die Möglichkeit den erkannten Text in diversen Formaten zu speichern).
@nikki
Hatte doch geschrieben, dass Seitenzahlen vorhanden sind....dass ich nix entfernen kann was nicht da ist ist schon klar....
@nikki
Hatte doch geschrieben, dass Seitenzahlen vorhanden sind....dass ich nix entfernen kann was nicht da ist ist schon klar....
Re: Buch gescannt
Zwar werden die Buchseiten in einem .odt-Format gespeichert und sind somit mit OO les- und bearbeitbar, jedoch ist die Struktur der Seite nur annähernd dem Original nachempfunden. Abhägig ist dies auch noch, welche Layout-Optionen beim Finereader zur Verfügung stehen.
Ich selbst nehme momentan Readiris Home, wo man zwischen a) kontinuierlichem Text, b) Wort- und Paragraph-Formatierung beibehalten und c) Originaldokument wiederherstellen wählen kann. Im Resultat werden ein unterschiedliche Zahl von Texrahmen erzeugt, in denen dann die Fragmente stehen, ggf. sogar mit Bildteilen. Aber alle diese folgen keinem vorgegebenen Struktur-Schema, so dass man keineswegs die Seitenzahlen in einem Ruck entfernen kann. Es ist immer viel Handarbeit angesagt, bis man den reinen Text hat, den man dann selbst formatieren muss, wenn man ein bearbeitbares Buch wiederherstellen will. Alternativ kann man ja z.B. primär ein pdf erzeugen. Jede Seite ist dann ein Bild, originalgetreu, aber kaum textlich bearbeitbar.
Ich selbst nehme momentan Readiris Home, wo man zwischen a) kontinuierlichem Text, b) Wort- und Paragraph-Formatierung beibehalten und c) Originaldokument wiederherstellen wählen kann. Im Resultat werden ein unterschiedliche Zahl von Texrahmen erzeugt, in denen dann die Fragmente stehen, ggf. sogar mit Bildteilen. Aber alle diese folgen keinem vorgegebenen Struktur-Schema, so dass man keineswegs die Seitenzahlen in einem Ruck entfernen kann. Es ist immer viel Handarbeit angesagt, bis man den reinen Text hat, den man dann selbst formatieren muss, wenn man ein bearbeitbares Buch wiederherstellen will. Alternativ kann man ja z.B. primär ein pdf erzeugen. Jede Seite ist dann ein Bild, originalgetreu, aber kaum textlich bearbeitbar.
win7pro / Avira / AOO 4.1.3 / LO 4.4.7.2
Re: Buch gescannt
Ergänzend: Die roten Pfeile am Ende sagen nur, dass der Text weitergeht, aber der Rahmen leider nicht mehr hergibt. Da hilft nur:
1. Allen Text markieren (strg+A),
2. dann den Text "normalisieren" (strg+M , falls nicht wirksam dann über Menü Schrift Standard wählen)
3. dann den Text schließlich soweit verkleinern, dass man alles lesen kann
Zu Deiner letzten Frage, warum OO sich nicht an das Oritginal-Layout hält. Ja, das Original-Layout hat der Finereader (wie alle vergegleichbaren Programme) nicht exportieren gekonnt. Also liegt es nicht an OO.
1. Allen Text markieren (strg+A),
2. dann den Text "normalisieren" (strg+M , falls nicht wirksam dann über Menü Schrift Standard wählen)
3. dann den Text schließlich soweit verkleinern, dass man alles lesen kann
Zu Deiner letzten Frage, warum OO sich nicht an das Oritginal-Layout hält. Ja, das Original-Layout hat der Finereader (wie alle vergegleichbaren Programme) nicht exportieren gekonnt. Also liegt es nicht an OO.
win7pro / Avira / AOO 4.1.3 / LO 4.4.7.2
Re: Buch gescannt
OK, ich dachte halt, dass odt gleich odt ist....mein Denkfehler!
Werde mal etwas rumprobieren, vielleicht kommt was raus was mir gefällt.
Danke Euch!
Werde mal etwas rumprobieren, vielleicht kommt was raus was mir gefällt.
Danke Euch!
Re: Buch gescannt
Die Dateiendung, wie z. B. .odt, ist völlig unerheblich. Diese dient lediglich dem Betriebssystem zur Programmverknüpfung, bzw. den Programmmodulen.
Maßgeblich ist allein der Inhalt einer Datei, der letztlich das Dateiformat bestimmt. Wird das Dateiformat von einem Drittprogramm bei der Konvertierung schlecht umgesetzt, ist dafür nicht das öffnende Programm (im vorliegenden Fall Apache OpenOffice) verantwortlich.
Gruß
--------------------------------------------------------
Win.10 Prof. 64-bit, AOO 4.1.7, LO 6.3.4 (x64)
--------------------------------------------------------
Win.10 Prof. 64-bit, AOO 4.1.7, LO 6.3.4 (x64)