Elektronikus könyvek készítésének technikai kérdései

C

Chalamade

Vendég
Adobe Acrobat is képes jelentősen csökkenteni a méretet.
Tedd fel a dézsa verziót.
 

madar2252

Állandó Tag
Állandó Tag
Sziasztok, elméleti jellegű kérdésem van pdf - doc konverzióról. Van egy pdf-em ami szövegként tárolja a tartalmat, tehát az egyik konverziós megoldás az lenne hogy simán ctrl+c ctrl+v -vel bedobom egy docba, de ebben az esetben bukom az összes formázást, minden sor végén sortörés lesz. Még ha ezek után a worddel kiszedem az összes olyan sortörést ami után kisbetű jön, vagy nincs előtte pont\kérdőjel\felkiáltójel, akkor is marad olyan ahol pont úgy jött ki a lépés hogy a sor vége épp mondat vége is de mégsem új bekezdés.

Ha viszont megetetem ABBYY -vel (nekem 10-es verzióm van), akkor tökéletes lesz a formázásom, viszont cserébe kapok egy halom OCR hibát, elsősorban a "..." sorozatot imádja "." -nak felismerni és többnyire meg se jelöli mint bizonytalan beolvasás. Sajnos ebben a pdfben sok a "...", és ezt a fajta hibát csak úgy tudom kiszűrni ha az egész könyvet végignézem a képernyőn, mellette a felismert verziót, és az összes "..." -ot lecsekkolom hogy mi lett belőle... elég fárasztó a szemnek, és könnyű hibázni.

Ti hogyan kezdenétek bele? Van valami trükk az első verzióban nem veszíteni formázást, vagy a második verzióban jobb karakter eredményt elérni? Van esetleg valamilyen egyéb programjavaslat? A Calibre az első változatot csinálja, illetve az ABBYY PDF Transformer+ próbaverzióját próbáltam, az pedig ugyanazt csinálja mint az ABBYY 10.

előre is köszi.
 

hampidampi

Állandó Tag
Állandó Tag
Sziasztok, elméleti jellegű kérdésem van pdf - doc konverzióról. Van egy pdf-em ami szövegként tárolja a tartalmat, tehát az egyik konverziós megoldás az lenne hogy simán ctrl+c ctrl+v -vel bedobom egy docba, de ebben az esetben bukom az összes formázást, minden sor végén sortörés lesz. Még ha ezek után a worddel kiszedem az összes olyan sortörést ami után kisbetű jön, vagy nincs előtte pont\kérdőjel\felkiáltójel, akkor is marad olyan ahol pont úgy jött ki a lépés hogy a sor vége épp mondat vége is de mégsem új bekezdés.

Ha viszont megetetem ABBYY -vel (nekem 10-es verzióm van), akkor tökéletes lesz a formázásom, viszont cserébe kapok egy halom OCR hibát, elsősorban a "..." sorozatot imádja "." -nak felismerni és többnyire meg se jelöli mint bizonytalan beolvasás. Sajnos ebben a pdfben sok a "...", és ezt a fajta hibát csak úgy tudom kiszűrni ha az egész könyvet végignézem a képernyőn, mellette a felismert verziót, és az összes "..." -ot lecsekkolom hogy mi lett belőle... elég fárasztó a szemnek, és könnyű hibázni.

Ti hogyan kezdenétek bele? Van valami trükk az első verzióban nem veszíteni formázást, vagy a második verzióban jobb karakter eredményt elérni? Van esetleg valamilyen egyéb programjavaslat? A Calibre az első változatot csinálja, illetve az ABBYY PDF Transformer+ próbaverzióját próbáltam, az pedig ugyanazt csinálja mint az ABBYY 10.

előre is köszi.
Ezt a pontozós dolgot csak egy bizonyos pdf-fel csinálja neked, vagy mindegyikkel?
Milyen kimenetet használsz? Érdemes editable copy-t beállítani és kipróbálni többféle formátumot (rtf-docx-html).
Nekem konzekvensen az Í betűt ismeri fel í-nek. Rohadt zavaró.
Esetleg próbáld ki a pdftoepub programot. Néha meglepően jó eredményt ad.
 

madar2252

Állandó Tag
Állandó Tag
köszönöm,
két olyan pdf-et próbáltam amiben sok a ..., ott mind a kettőnél kb 10-20% hatékonysággal ismeri meg a ... -ot. Editable copyt használok, de a kimeneti formátum mindegy, mert már a mentés előtt, a képernyőn látszik hogy a felismerés nem jött össze rendesen.
Kipróbáltam a pdftoepub programot is, ez a karaktereket jól átveszi, de a tördeléssel szintén hadilábon áll (bár így is sokkal jobb mint a sima copy-paste), időnként nem tördeli be amit kéne, vagy betördeli amit nem kéne... Van hogy a párbeszéd közepén dönt úgy hogy nem írja új sorba a gondolatjellel kezdődő sorokat...
Még így is talán ez adja a legjobb eredményt...

Látszik hogy azok a programok amik optikailag ismernek fel, azok értik hogy azért van egy sor behúzva mert új bekezdés, viszont a sima konverterek ezt nem nagyon realizálják.
Lehet hogy másik OCR-t kéne próbáljak, hátha az jobban értelmezi a ... -ot.
 

mastop01

Állandó Tag
Állandó Tag
Sziasztok!
Tudtok olyan alkalmazást ajánlani, amellyel már a kész e-book-ot lehet editálni? helyesírási hibák javítása, új oldal beszúrása - például térképek esetén, stb. Főképp mobi könyveim vannak, tehát ami ahhoz (is) jó.
 

hampidampi

Állandó Tag
Állandó Tag
Sziasztok!
Tudtok olyan alkalmazást ajánlani, amellyel már a kész e-book-ot lehet editálni? helyesírási hibák javítása, új oldal beszúrása - például térképek esetén, stb. Főképp mobi könyveim vannak, tehát ami ahhoz (is) jó.
Ide is csak azt tudom írni, amit a Kindle fórumon:
Közvetlenül nem tudod megcsinálni. Először át kell konvertálni szerkeszthető formátumra, megcsinálni, amit akarsz, aztán visszakonvertálni.
Praktikusan Calibre-rel a legegyszerűbb rtf-fé vagy html-lé alakítani, összefűzni és visszakonvertálni.
 

mastop01

Állandó Tag
Állandó Tag
Ide is csak azt tudom írni, amit a Kindle fórumon:
Közvetlenül nem tudod megcsinálni. Először át kell konvertálni szerkeszthető formátumra, megcsinálni, amit akarsz, aztán visszakonvertálni.
Praktikusan Calibre-rel a legegyszerűbb rtf-fé vagy html-lé alakítani, összefűzni és visszakonvertálni.


Ennek nem örülök túlzottan, mert pont ezt az oda-vissza konvertálást szerettem volna elkerülni. De akkor marad ez a megoldás.
 

hampidampi

Állandó Tag
Állandó Tag
C

Chalamade

Vendég
Sziasztok!
Tudtok olyan alkalmazást ajánlani, amellyel már a kész e-book-ot lehet editálni? helyesírási hibák javítása, új oldal beszúrása - például térképek esetén, stb. Főképp mobi könyveim vannak, tehát ami ahhoz (is) jó.

Calibrével mobi -> epub. Ezt Sigillel nyitod és editálod. Ezeket lehet benne.
 

luxipapa

Állandó Tag
Állandó Tag
Sziasztok!
Kis segítség kellene!
http://canadahun.com/temak/saját-kindle-olvasmányok.29707/page-47#post-3578277
címen található könyv/mobi/ ékezet hibás/ő,ű/,és sok üres sorköz is van.
Kérdés:
Simán Calibre-vel orvosolható-e a probléma?/ha igen,milyen beállításokkal/
Ha Calibre-vel nem akkor mi a megoldás?
Aki tud segíteni kérem úgy válaszoljon hogy az alapfokú ismeretekkel rendelkező is megértse!
Türelmeteket előre is köszönöm!
Könyvbaráti üdvözlet:luxipapa
 

rumfic

Állandó Tag
Állandó Tag
Szia!
Próbáld meg a Calibre KindleUnpack bővitményével. Ez részeire bontja és a HTML már szerkeszthető.
Nem biztos, hogy beválik, de egy próbát megér.
Sok sikert!

ui.: kipróbáltam, kicsomagolja, a html-t word-del nyitottam az ő ű cserével javítható. Az üres sorközt izlés szerint lehet javítani.
Ha gondolod elküldöm amig én jutottam.
 
Utoljára módosítva:

asnobli

Állandó Tag
Állandó Tag
Sziasztok!
Kis segítség kellene!
http://canadahun.com/temak/saját-kindle-olvasmányok.29707/page-47#post-3578277
címen található könyv/mobi/ ékezet hibás/ő,ű/,és sok üres sorköz is van.
Kérdés:
Simán Calibre-vel orvosolható-e a probléma?/ha igen,milyen beállításokkal/
Ha Calibre-vel nem akkor mi a megoldás?
Aki tud segíteni kérem úgy válaszoljon hogy az alapfokú ismeretekkel rendelkező is megértse!
Türelmeteket előre is köszönöm!
Könyvbaráti üdvözlet:luxipapa

Szia,

A Calibreben a következőket tudod megcsinálni (legyen az eredeti filéről másolatod!):
1. add book
2. Nyisd meg a könyvet a Calibre olvasójával, keresed meg a cserélendő karaktert (pl. Õ)
3. jelöld ki, majd ctrl+ins a clipboardba (az olvasót ne zárd be)
4. katt a fő ablakra
3. jobb click a könyvön, convert books, convert individually
4. Search&Replace ikon (távcső)
5. shift+ins a "Search regular expression" sorba
6. Ő a "Replacement text sorba"
(teszteleheted a varázspálca ikonra kattintva a keresést, az Õ-ből 47 db volt)
7. az "Add" gombra kattintve beteszi az alatta levő ablakba
9. menj át a könyvolvasóba és keresd meg a köv. cserélendő karaktert (gondolom az õ->ő, "kalapos U"-> Ű, stb).
10. a 4. ponttól folytasd, amíg van cserélendő karakter

11. Ha a karakterekkel meg vagy, akkor meg kell nézni a könyvnézőkében, hol van feleslegese üres sor, szöveget kijelölöd előtte v. utána, majd a search regular expressionbe beírod, és a varázspálcával megkeresed a szöveges részben. A keresési feltételeket itt is módosíthatod.
12. Itt megnézed, hogy néz ki a dupla sortörés. Én ilyet most nem találtam, de biztos van benne. (a sortörés </p>, de az üres sor biztos nem </p></p>, mert erre rákerestem, meg lehet, a sorok kezdetére is berak valamiket, ahogy elnéztem, esetleg így nézhet ki: </p><p class="calibre_33"></p><p class="calibre_33"> de így sem találtam).
13. Szóval kikopizod a sortörés+üres sor részt (egérrel kijelöl, majd ctrl+ins), azt berakod a keresőbe, teszteled, ha OK, akkor a az aktuális keresési kifejezés megmarad a a "Search regular expression" sorban. (pl. </p><p class="calibre_33"></p><p class="calibre_33">)
14. A "Replacement text" sorba pedig berakod a keresési kifejezésnek azt a részét, amelyikben már nincs benne az üre sor, (pl. </p><p class="calibre_33">)
majd szintén az "Add" gomb megnyomásával hozzáadod a módosítandók listájához.
15. Célszerű elmenteni a keresési kifejezéseket egy filébe, mert akkor a javításuk sokkal könnyebb (van "save" meg "Load" gomb is)

16. Ezután beállítot a kimeneti formátumot, ami lehet a bemeneti is, OK megnyomása, majd konvertálod.
17. Megnézed az eredményt a Calibre könyvolvasójával, azokra a részekre fókuszálva, amit szerettél volna javítani. Ha van még valami gond, akkor lehet javítgatni a kifejezéseket.

Remélem értelmesen írtam le a mozdlatsorokat.
Sok sikert, asnobli
 

luxipapa

Állandó Tag
Állandó Tag
Szia,

A Calibreben a következőket tudod megcsinálni (legyen az eredeti filéről másolatod!):
1. add book
2. Nyisd meg a könyvet a Calibre olvasójával, keresed meg a cserélendő karaktert (pl. Õ)
3. jelöld ki, majd ctrl+ins a clipboardba (az olvasót ne zárd be)
4. katt a fő ablakra
3. jobb click a könyvön, convert books, convert individually
4. Search&Replace ikon (távcső)
5. shift+ins a "Search regular expression" sorba
6. Ő a "Replacement text sorba"
(teszteleheted a varázspálca ikonra kattintva a keresést, az Õ-ből 47 db volt)
7. az "Add" gombra kattintve beteszi az alatta levő ablakba
9. menj át a könyvolvasóba és keresd meg a köv. cserélendő karaktert (gondolom az õ->ő, "kalapos U"-> Ű, stb).
10. a 4. ponttól folytasd, amíg van cserélendő karakter

11. Ha a karakterekkel meg vagy, akkor meg kell nézni a könyvnézőkében, hol van feleslegese üres sor, szöveget kijelölöd előtte v. utána, majd a search regular expressionbe beírod, és a varázspálcával megkeresed a szöveges részben. A keresési feltételeket itt is módosíthatod.
12. Itt megnézed, hogy néz ki a dupla sortörés. Én ilyet most nem találtam, de biztos van benne. (a sortörés </p>, de az üres sor biztos nem </p></p>, mert erre rákerestem, meg lehet, a sorok kezdetére is berak valamiket, ahogy elnéztem, esetleg így nézhet ki: </p><p class="calibre_33"></p><p class="calibre_33"> de így sem találtam).
13. Szóval kikopizod a sortörés+üres sor részt (egérrel kijelöl, majd ctrl+ins), azt berakod a keresőbe, teszteled, ha OK, akkor a az aktuális keresési kifejezés megmarad a a "Search regular expression" sorban. (pl. </p><p class="calibre_33"></p><p class="calibre_33">)
14. A "Replacement text" sorba pedig berakod a keresési kifejezésnek azt a részét, amelyikben már nincs benne az üre sor, (pl. </p><p class="calibre_33">)
majd szintén az "Add" gomb megnyomásával hozzáadod a módosítandók listájához.
15. Célszerű elmenteni a keresési kifejezéseket egy filébe, mert akkor a javításuk sokkal könnyebb (van "save" meg "Load" gomb is)

16. Ezután beállítot a kimeneti formátumot, ami lehet a bemeneti is, OK megnyomása, majd konvertálod.
17. Megnézed az eredményt a Calibre könyvolvasójával, azokra a részekre fókuszálva, amit szerettél volna javítani. Ha van még valami gond, akkor lehet javítgatni a kifejezéseket.

Remélem értelmesen írtam le a mozdlatsorokat.
Sok sikert, asnobli
Köszönöm!
Próbálom követni a leírtakat,nekem magyar nyelvű a Calibre.
Köszi a mindenre kiterjedő leírást!
Üdv:luxipapa
 

rumfic

Állandó Tag
Állandó Tag
S.O.S.
Nem tudom mi állítódott el a Word 2007-ben, de a bekezdés formázást nem cm-ben és pontban hanem px-ben adja meg és nem tudom visszaállítani!
Tegnap még tökéletesen működött :(
A word beállításai-specialis-megjelenítés-méröszámok cm-re van állítva
Próbáltam régi-új dokumentumot is, de az eredmény mindig px :confused:
 

luxipapa

Állandó Tag
Állandó Tag
S.O.S.
Nem tudom mi állítódott el a Word 2007-ben, de a bekezdés formázást nem cm-ben és pontban hanem px-ben adja meg és nem tudom visszaállítani!
Tegnap még tökéletesen működött :(
A word beállításai-specialis-megjelenítés-méröszámok cm-re van állítva
Próbáltam régi-új dokumentumot is, de az eredmény mindig px :confused:
Szia!
Eddig néztük a netet:word beállítások stb,stb.de nem jutunk semmire.
Próbálunk segíteni,de mi "nagytudásúak "nem tudjuk mi lehet a gond.Remélem megoldódik a problémád.
 

rumfic

Állandó Tag
Állandó Tag
Szia!
Eddig néztük a netet:word beállítások stb,stb.de nem jutunk semmire.
Próbálunk segíteni,de mi "nagytudásúak "nem tudjuk mi lehet a gond.Remélem megoldódik a problémád.
Köszönöm szépen, én sem jutottam tovább. Valószínűleg egy sajátként mentett stílus a bűnös, de nem értem miért nem tudom felül írni :confused:
Lehet az is, hogy egy Abbyy-ből inportált dokument írta át...
Még próbálkozom
 

asnobli

Állandó Tag
Állandó Tag
S.O.S.
Nem tudom mi állítódott el a Word 2007-ben, de a bekezdés formázást nem cm-ben és pontban hanem px-ben adja meg és nem tudom visszaállítani!
Tegnap még tökéletesen működött :(
A word beállításai-specialis-megjelenítés-méröszámok cm-re van állítva
Próbáltam régi-új dokumentumot is, de az eredmény mindig px :confused:

Próbáld meg a következőt (a FELHASZNÁLÓNÉV=amivel bejentkezel):
1. a Normal.dotm filét nevezd át (esetleg helyezd is át máshová) helye: C:\users\FELHASZNÁLÓNÉV\Appdata\Roaming\Microsoft\Templates
2. indítsd el a Word-öt
3. Állítsd be a neked megfelelőket
4. Nyisd meg az átnevezett Normal.dotm-ot és másold át a benne lévő stílusokat, esetleg saját makrókat, ha van.
 
Oldal tetejére