Elektronikus könyvek készítésének technikai kérdései

Kovács Erika

Állandó Tag
Állandó Tag
"Többnyire megoldást nyújt az "ö" és "ü" betűk problémájára, nem utolsó sorban a pdf-ből konvertált anyagoknál az eredeti könyv oldalszámainak eltüntetésében, és gyakran a felesleges sortöréseknél is."
 

hampidampi

Állandó Tag
Állandó Tag
"Többnyire megoldást nyújt az "ö" és "ü" betűk problémájára, nem utolsó sorban a pdf-ből konvertált anyagoknál az eredeti könyv oldalszámainak eltüntetésében, és gyakran a felesleges sortöréseknél is."

Ah so. Az ilyenre azért inkább az OCR-ezést szoktuk ajánlani. Messze jobb eredményt lehet elérni.
 

dvlac

Állandó Tag
Állandó Tag
Pédául engemet takar, aki a pdf -ből szeret "normálisabb" prc anyagot készíteni (magának).
 

Koroknay bela

Állandó Tag
Állandó Tag
Sziasztok!
Bocsánat, ha már téma volt, próbáltam átböngészni a topic-ot, de konkrétan nem találtam csak részmegoldásokat.
Szóval egy koobe junior-t használok, aminek a dobozára ez van írva: "UTF - 8 és teljeskörű magyar karakter táblázat" és ez biztos igaz is lehet, mert vannak könyveim, amiknél tökéletesek a karakterek, viszont..... Vannak amik az előző olvasómmal jók voltak, a mostanival viszont nem. Továbbá van olyan, hogy letöltök egy könyvet, pl. PDF-ben, és a calibre tökéletesen átteszi epub-ba, máskor meg amit letöltök, a pdf-ben jók a karakterek, viszont a konvertált változatban már nem jó az Ő Ű. Ebből arra gondolok, hogy már az alapanyagnál lehet különbség. Sajnos az itteni epub-os topicból letöltött könyveknél is van ez a gond, pedig gondolom, aki készítette annak jók az említett karakterek.
Van erre valamilyen megoldás ami nem azzal jár, hogy ezerszer kell ilyen-olyan konverterrel millió programot használva trükközgetni? Én arra gondolok, ha az eredetivel tudnék valamit kezdeni, akkor már akár a calibre is elég lenne, mint ahogy sok esetben azért jól megcsinálja az e-pubot is.
 

hampidampi

Állandó Tag
Állandó Tag
Sziasztok!
Bocsánat, ha már téma volt, próbáltam átböngészni a topic-ot, de konkrétan nem találtam csak részmegoldásokat.
Szóval egy koobe junior-t használok, aminek a dobozára ez van írva: "UTF - 8 és teljeskörű magyar karakter táblázat" és ez biztos igaz is lehet, mert vannak könyveim, amiknél tökéletesek a karakterek, viszont..... Vannak amik az előző olvasómmal jók voltak, a mostanival viszont nem. Továbbá van olyan, hogy letöltök egy könyvet, pl. PDF-ben, és a calibre tökéletesen átteszi epub-ba, máskor meg amit letöltök, a pdf-ben jók a karakterek, viszont a konvertált változatban már nem jó az Ő Ű. Ebből arra gondolok, hogy már az alapanyagnál lehet különbség. Sajnos az itteni epub-os topicból letöltött könyveknél is van ez a gond, pedig gondolom, aki készítette annak jók az említett karakterek.
Van erre valamilyen megoldás ami nem azzal jár, hogy ezerszer kell ilyen-olyan konverterrel millió programot használva trükközgetni? Én arra gondolok, ha az eredetivel tudnék valamit kezdeni, akkor már akár a calibre is elég lenne, mint ahogy sok esetben azért jól megcsinálja az e-pubot is.

Igen, sokban függ a forrás pdf minőségétől (és ugye nem is erre lett eredetileg kitalálva a pdf).
Ahogy itt is írtam, a legjobb, legbiztosabb eredményt OCR programokkal lehet elérni.
"Egylépéses" megoldásként szerintem az ABBY Fine Reader (11) program használható a legjobban. Azzal közvetlenül Kindle-re is lehet OCR-ezni a forrásanyagot. Persze így is csak kompromisszumokkal. Nincs tartalomjegyzék, fejezethatárolás, metaadatok, csak a sima formázott szöveg.
Vannak különböző internetes konvertáló oldalak is, de azokkal nincs tapasztalatom.
Ha igényesebb eredményt szeretnél, sajnos nem úszod meg a több lépést és a barkácsolást.
 

miner

Állandó Tag
Állandó Tag
Sziasztok!
Bocsánat, ha már téma volt, próbáltam átböngészni a topic-ot, de konkrétan nem találtam csak részmegoldásokat.
Szóval egy koobe junior-t használok, aminek a dobozára ez van írva: "UTF - 8 és teljeskörű magyar karakter táblázat" és ez biztos igaz is lehet, mert vannak könyveim, amiknél tökéletesek a karakterek, viszont..... Vannak amik az előző olvasómmal jók voltak, a mostanival viszont nem. Továbbá van olyan, hogy letöltök egy könyvet, pl. PDF-ben, és a calibre tökéletesen átteszi epub-ba, máskor meg amit letöltök, a pdf-ben jók a karakterek, viszont a konvertált változatban már nem jó az Ő Ű. Ebből arra gondolok, hogy már az alapanyagnál lehet különbség. Sajnos az itteni epub-os topicból letöltött könyveknél is van ez a gond, pedig gondolom, aki készítette annak jók az említett karakterek.
Van erre valamilyen megoldás ami nem azzal jár, hogy ezerszer kell ilyen-olyan konverterrel millió programot használva trükközgetni? Én arra gondolok, ha az eredetivel tudnék valamit kezdeni, akkor már akár a calibre is elég lenne, mint ahogy sok esetben azért jól megcsinálja az e-pubot is.
Mivel olvasod az epubot? Ha gondod van az ő, ű betűvel akkor valószínűleg az epub parserrel, és nem a CoolReaderrel.
HTML:
http://koobejunior.blogspot.hu/2011/02/koobe-ujratoltve.html
 

hampidampi

Állandó Tag
Állandó Tag
Sziasztok!
Bocsánat, ha már téma volt, próbáltam átböngészni a topic-ot, de konkrétan nem találtam csak részmegoldásokat.
Szóval egy koobe junior-t használok, aminek a dobozára ez van írva: "UTF - 8 és teljeskörű magyar karakter táblázat" és ez biztos igaz is lehet, mert vannak könyveim, amiknél tökéletesek a karakterek, viszont..... Vannak amik az előző olvasómmal jók voltak, a mostanival viszont nem. Továbbá van olyan, hogy letöltök egy könyvet, pl. PDF-ben, és a calibre tökéletesen átteszi epub-ba, máskor meg amit letöltök, a pdf-ben jók a karakterek, viszont a konvertált változatban már nem jó az Ő Ű. Ebből arra gondolok, hogy már az alapanyagnál lehet különbség. Sajnos az itteni epub-os topicból letöltött könyveknél is van ez a gond, pedig gondolom, aki készítette annak jók az említett karakterek.
Van erre valamilyen megoldás ami nem azzal jár, hogy ezerszer kell ilyen-olyan konverterrel millió programot használva trükközgetni? Én arra gondolok, ha az eredetivel tudnék valamit kezdeni, akkor már akár a calibre is elég lenne, mint ahogy sok esetben azért jól megcsinálja az e-pubot is.

A Calibre olvasójával még látszanak az ékezetek?
Csak a könyvolvasó eszközödön nem látszanak?
Csak e-pubnál jelentkezik?
Ha igen a válasz, akkor valószínűleg az olvasód nem kezeli az (ű, ő) ékezetes karaktereket.
E-pub formátumú könyveknél viszont meg lehet aszt csinálni, hogy az elkészült anyagba beágyazol egy fontkészletet. Ilyen e-pubot már nagy valószínűséggel már minden, e-pub-képes olvasó jól jelenít meg.
Ezt lehet internetes konvertáló oldalakon is megtenni, de mivel amúgy is Calibre-t használsz, van hozzá egy nagyon klassz plugin, ami ezt automatikusan elvégzi.
Így persze minden könyv mérete nagyobb lesz, de legalább olvasható.
 

miner

Állandó Tag
Állandó Tag
A Calibre olvasójával még látszanak az ékezetek?
Csak a könyvolvasó eszközödön nem látszanak?
Csak e-pubnál jelentkezik?
Ha igen a válasz, akkor valószínűleg az olvasód nem kezeli az (ű, ő) ékezetes karaktereket.
E-pub formátumú könyveknél viszont meg lehet aszt csinálni, hogy az elkészült anyagba beágyazol egy fontkészletet. Ilyen e-pubot már nagy valószínűséggel már minden, e-pub-képes olvasó jól jelenít meg.
Ezt lehet internetes konvertáló oldalakon is megtenni, de mivel amúgy is Calibre-t használsz, van hozzá egy nagyon klassz plugin, ami ezt automatikusan elvégzi.
Így persze minden könyv mérete nagyobb lesz, de legalább olvasható.
Koroknay bela, most jobb, ha nekem hiszel.
Az ajánlott blogban leírtak szerint, cseréld le a gyári firmware-t.
Az LBook-os megfelelő.
HTML:
http://www.lbook.ua/support/firmware/updates_rom_for_v5_series/
De nézz körül itt, a legfrissebb CoolReaderrel kapcsolatban:
HTML:
http://www.the-ebook.org/forum/viewtopic.php?t=7509&postdays=0&postorder=asc&start=0&sid=ea92155a6eb62b94fcfa62016641bf60
Lesz CoolReadered, imádni fogod az fb2-t, de ha nincsenek a könyvben láb-, végjegyzetek, az epub még jobb.
Epub-ot pedig Atlantis word Processor-ral kell készíteni.
HTML:
http://www.atlantiswordprocessor.com/en/
Nagyon fontos tudnivalók:
HTML:
http://ekonyvolvaso.blog.hu/2010/06/27/igy_neveld_az_az_epubodat#more2114216
 

Kovács Erika

Állandó Tag
Állandó Tag
quote_icon.png
Eredeti szerző hampidampi

Ah so. Az ilyenre azért inkább az OCR-ezést szoktuk ajánlani. Messze jobb eredményt lehet elérni.
quote_icon.png




Ha van olyan ingyenes karakter felismerő program, amely megbirkózik a magyar betűkkel, és fel lehet vele egy komplett pdf. dokumentumot egyszerre dolgozni (nem oldalanként), akkor az valóban jobb lenne, mint az általam javasolt megoldás. Ha ismersz ilyet, kérlek, oszd meg velünk a lelőhelyét! Előre is köszönöm!
 

Koroknay bela

Állandó Tag
Állandó Tag
A Calibre olvasójával még látszanak az ékezetek?
Csak a könyvolvasó eszközödön nem látszanak?
Csak e-pubnál jelentkezik?
Ha igen a válasz, akkor valószínűleg az olvasód nem kezeli az (ű, ő) ékezetes karaktereket.
E-pub formátumú könyveknél viszont meg lehet aszt csinálni, hogy az elkészült anyagba beágyazol egy fontkészletet. Ilyen e-pubot már nagy valószínűséggel már minden, e-pub-képes olvasó jól jelenít meg.
Ezt lehet internetes konvertáló oldalakon is megtenni, de mivel amúgy is Calibre-t használsz, van hozzá egy nagyon klassz plugin, ami ezt automatikusan elvégzi.
Így persze minden könyv mérete nagyobb lesz, de legalább olvasható.
Igen pontosítanom kell: Tehát a pdf-ben még jó az ő és az ű, de a konvertálás után már a calibre olvasóján sem jók. Pedig telepítettem az ide vonatkozó plugint (embedfont_plugin.zip) Sőt ami még furább, hogy kiváncsiságból egy ilyen pdf-et konvertáltam pdf-be, és ott is eltüntek az említett karakterek. Ráadásul ha az olvasó nem tudná az ő és ű betűt, akkor gondolom sosem tudná, de vannak azért könyveim, amiknél ez nem gond. Viszont van, hogy a letöltött pdf konvertálása után tökéletes epubot kapok, ami a calibre olvasón is jó, ebből gondolom, hogy a forrásban lehet különbség. talán az alkalmazott kódlap, vagy nem tudom, ebben végképp nem vagyok otthon.
 

dvlac

Állandó Tag
Állandó Tag
Nem sikerült megtalálnom a hozzászólásaid között, hogy csinálod. (Persze, Te magadnak készíted.)
Szóval a pdf -ből az ABBY Finereader programmal "emészthetőbb" vagyis már szerkeszthető rtf vagy doc kiterjesztésű anyagot készítek. Ebben az anyagban lecserélem a hosszú gondolatjeleket rövid gondolatjelre, balra húzom a bekezdéseket, ha van energiám kijavítom a visszakonvertálás hibáit, majd az így elkészült rtf vagy doc anyagból elkészítem a Mobipocket Creator programmal a Kindle4 olvasóm számára már értelmezhető prc formátumot. A tároláshoz hard disk-re elmentem a kijavított html, rtf vagy doc, illetve prc anyagot. Hát dióhéjban így csinálom (magamnak).
 

dvlac

Állandó Tag
Állandó Tag
Szóval pdf -ből normálisabb prc készítési módszerem:
Az Abby Finereader programmal az eredeti pdf -ből szerkeszthető rtf, vagy doc anyag készítése.
A hibás karakterbeolvasások javítása, hosszú gondolatjelek rövidre cserélése,
bekezdések balra húzása, szóval javítgatás a saját igényességed és időd határáig.
Ezután a Mobipocket Creator programmal prc készítése.
A Mobipocket Creatorral készült html anyag, valamint a szerkesztett, javított rtf vagy doc anyag,
és a végtermék prc anyag hard diskre mentése. Lényeg, hogy nem az eredeti pdf anyagot
célszerű hosszú távra letárolni. Hát én így készítem magamnak.
Aki igényesebb, az elszórakozik a tartalomjegyzék készítésével is.
 

miner

Állandó Tag
Állandó Tag
Sziasztok!
Bocsánat, ha már téma volt, próbáltam átböngészni a topic-ot, de konkrétan nem találtam csak részmegoldásokat.
Szóval egy koobe junior-t használok, …
Új "Jotas"-féle firmware (jotas1+r5) a Koobe Juniorra (Hanlin V5) a legújabb CoolReaderrel (3.0.57-15).

HTML:
http://www.lectoreselectronicos.com/showthread.php?3086-FIRMWARE-jotas

A Koobe Classic Plus-ra (Hanlin V3+), és a Koobe Classic-ra (Hanlin V3ext) is frissített.
 
C

Chalamade

Vendég
Az ominózus pdf olyan fontkészletet használ, ami nincs a rendszeredben telepítve. És mivel konvertálni tudod, a pdf szöveges állományt tartalmaz. (Bármilyen OCR emiatt felesleges izzadtság.) A tulajdonságoknál megtalálod a használt beágyazott fontokat. Ha azokat telepíted, lesz ékezeted a konvertálás után is.
Mellesleg az egyik favorit OCR az AbbyFineReader, ami ugyanúgy "ingyenesen" fellelhető, mint az itteni könyvek.
 
C

Chalamade

Vendég
A pdf-ben szöveges állomány van, ami olyan fontokat használ, ami a rendszeredben nincs telepítve. A pdf-et megnyitva a tulajdonságoknál megnézheted, mik azok.
Ha telepíted a szükséges fontokat, lesz a konverzió után is ékezetes betűd.
Az AbbyFineReader, mint OCR program, az itteni könyvek ingyenességéhez hasonlóan elérhető.
 
C

Chalamade

Vendég
A pdf-ben szöveges állomány van, ami olyan fontokat használ, ami a rendszeredben nincs telepítve. A pdf-et megnyitva a tulajdonságoknál megnézheted, mik azok.
Ha telepíted a szükséges fontokat, lesz a konverzió után is ékezetes betűd.
Az AbbyFineReader, mint OCR program, az itteni könyvek ingyenességéhez hasonlóan elérhető.
 
C

Chalamade

Vendég
Amít írsz, abból két dolog is következik. Mivel tudod konvertálni, így szöveges a pdf. (Felesleges izzadság OCR-t használni.)
Az ékezeteid pedig azért "tűnnek" el, mert a pdf-ben használt font(ok) nincsenek a rendszereden telepítve.
 
Oldal tetejére