Elektronikus könyvek készítésének technikai kérdései

kegabor

Állandó Tag
Állandó Tag
Üdv Mindenkinek, anno találtam egy pdf-manipiuláló progit, ahol egy átméretezhető "ablak"-ot illesztve a megnyitott pdf-re be tudtam állítani, hogy a szöveg/oldal mekkora részét vegye figyelembe (pl. levágás, crop esetében) Sajnos nem emlékszek a program nevére, de nagy szükségem lenne rá. Nincs ötlete Valakinek? (ui. azért lenne fontos, mert egy pdf OCR-ezéshez alapul szolgáló pdf-ben a MINDEN oldal lap alján található oldalszámok, illetve pl. a lap tetején található "cím-szerző" fejlecek így lennének (számomra) a legkönnyebben eltávolíthatóak...) Előre is köszi a választ! http://www.canadahun.com/forum/images/smilies/icon_razz.gif
 

Atyaman

Állandó Tag
Állandó Tag
@kegabor:

Szerintem a PDFCropra gondolsz.

Amúgy sokkal egyszerűbb dolgod lenne az ABBYY FineReader Proval. Automatikus felismeri a fejléceket és az oldalszámozást, ha pedig azt adod meg neki, akkor ezek nem fognak bekerülni az OCR-ezett szövegbe.

A másik módszer, amit még előszeretettel alkalmazok (alkalmaztam, mikor még több időm volt olvasni, és kevesebb könyvet lehetett megvenni legálisan), az MS Word keresés/csere lehetősége (fejléc eltávolítására), plusz ezt egy kis programozási tudással és "for i ciklussal" még megbolondítva simán egy makróval kikapom az oldalszámokat.
 

weyland-yutani

Állandó Tag Silver tag
Állandó Tag
rossz betűk

Kedves weyland-yutani,
Nem allitom, hogy minden betujet elolvastam az anyagodnak, ami egyebkent egy komoly ismerteto. Van valami otleted arra, hogyan lehet a Calibre-vel MOBI-ra konvertalt fajlbol hianyzo "ő" betuket automatikus modszerrel beilleszteni ?
Koszonettel



Itt nem ragozom tovább, küldök neked egy linket, ahol esetleg olvass a javításokról, talán segítségedre lesz.
(Elnézést a késlekedésért, de ritkán járok erre.)

weyland-yutani
 
C

Chalamade

Vendég
A pdf bizony e-book formátum, ez nem vita téma. Kifejezetten arra fejlesztették ki, hogy plattform függetlenül mindig ugyanazt a tartalmat jelenítse meg a felhasználó felé, Jelenleg a legmodernebb tartalommegjelenítő formátum.
Emiatt kellőképpen bonyolult és emiatt nem vállalkoznak egyes eszközgyártók a támogatására és a megfelelő formában a létrehozása sem pillanatok alatt megtanulható.
Tipikusan erre az oldalra jellemzően csak szöveget és képet jelenítenek benne meg és ezek pdf-ben történő szerkesztésére csak kezdők és mazochisták vállalkoznak.
Az áttördelhetőség és egyéb maszlag csak egy szükséges kompromisszum, mert nem léteznek még akár Pravda méretű kezelhető olvasók, ahol ez nem lenne már igény.
 

hampidampi

Állandó Tag
Állandó Tag
"A pdf bizony e-book formátum, ez nem vita téma. Kifejezetten arra fejlesztették ki, hogy plattform függetlenül mindig ugyanazt a tartalmat jelenítse meg a felhasználó felé"
Nem. ...plattform függetlenül ugyanazt a tartalmat ugyanúgy jelenítse meg. Hatalmas különbség. Az e-könyvnek pedig épp az a lényege, hogy a tartalom bármilyen készülékre igazítható legyen A reflow ehhez nem elég. A pdf szellemisége pont ellentmond az e-könyv rugalmasságával.
"Az áttördelhetőség és egyéb maszlag csak egy szükséges kompromisszum, mert nem léteznek még akár Pravda méretű kezelhető olvasók, ahol ez nem lenne már igény."
Nem bug, feature :). Nem azért nincsenek nagyméretű olvasók (pedig vannak), mert nem lehet, hanem mert a kisebbek könnyebben kezelhetők. Én sem szívesen olvasnék a buszon egy 10"-os könyvolvasón.
 
C

Chalamade

Vendég
"Nem bug future" a jellegzetesen magyar mentalitás. A felszínes hozzánemértés párosulva a nagyarccal. Hogy az e-könyvnek mi a lényege, ahhoz pedig elsősorban többet kell olvasni, és nem csak a mai zömében szennyet.
 

weyland-yutani

Állandó Tag Silver tag
Állandó Tag
A pdf egy ideje nem a legmodernebb formátum.
A gyártók a támogatott formátumot úgy választják meg, hogy ne kelljen magyarázkodniuk a részvényesek vagy befektetőknek.
A pdf szerkesztés (készítés) hozzáértőknek való, lévén rétegelt, képalapú tárolási forma.
 

hampidampi

Állandó Tag
Állandó Tag
"Nem bug future" a jellegzetesen magyar mentalitás.
Nem. Ezt akkor szokták mondani, amikor egy tudálékos nagy arcú valaki olyan dolgot szól le amihez nem is konyít.

Hogy az e-könyvnek mi a lényege, ahhoz pedig elsősorban többet kell olvasni, és nem csak a mai zömében szennyet.
Ezt akkor olvasd át még egyszer. Ennek a mondatnak semmi értelme. Hogy jön az e-könyv "lényegéhez" az, hogy ki mit olvas? És miért kéne ahhoz többet olvasni? És honnan veszed, hogy a mai irodalom főleg szenny? Ki mondja meg, mi a szenny - te? Ugye nem?
 

hampidampi

Állandó Tag
Állandó Tag
A pdf egy ideje nem a legmodernebb formátum.
A gyártók a támogatott formátumot úgy választják meg, hogy ne kelljen magyarázkodniuk a részvényesek vagy befektetőknek.
A pdf szerkesztés (készítés) hozzáértőknek való, lévén rétegelt, képalapú tárolási forma.

Igen, arra találták ki, hogy bármilyen nyomtatón kinyomtatva ugyanúgy nézzen ki.
 

weyland-yutani

Állandó Tag Silver tag
Állandó Tag
Igen, arra találták ki, hogy bármilyen nyomtatón kinyomtatva ugyanúgy nézzen ki.


A papír alapú iroda megszüntetésének gondolata vezérelte a pdf használatának bevezetését - tudomásom szerint.

Nem hiszem, hogy a többieket érdekli az elméleti bölcselkedés (ez épp úgy vonatkozik az én okoskodásomra is), ők szerintem csak olvasni akarnak. Ezzel nem segítünk nekik.
 

gyulus45

Új tag
Kedves Író!

Nagyon jó, hogy ezeket mind leírtad, mert így a próbálgatások helyett módszer van a kezemben a Kindle olvasóm táplálására.

Köszi:

gyulus45
 
C

Chalamade

Vendég
Nos részemről ennyi, bátran "tanítgassátok egymást". Ahhoz kell egyébként többet olvasni, hogy a repülő nem busznak látszó tárgy amit traktorral húznak a betonon.
Nyilván még csak ilyen-olyan összezagyvált pdf-et láttatok csak, amit itt egymás közt megosztotok, az a néhány jobb minőség meg csak "talált" tárgy.Magyarázzatok csak egymásnak kódtáblákról font beágyazás helyett és nem sorolom, lényeg, hogy az általatok favorizált és megideologizált tökéletesnek tartott csecsebecséiteket sem ismeritek.További jó hályogkovácsolást, jó is ez a langyos víz....
 

srf

Állandó Tag
Állandó Tag
A pdf bizony e-book formátum, ez nem vita téma. Kifejezetten arra fejlesztették ki, hogy plattform függetlenül mindig ugyanazt a tartalmat jelenítse meg a felhasználó felé, Jelenleg a legmodernebb tartalommegjelenítő formátum.


A stílusodon azért volna még mit javítani. És még csak igazad sincs...
Mindenesetre elgondolkodtató, hogy a tárgyi tévedéseid száma fordítottan arányos az udvariasságoddal.

Ezzel együtt az igenis vitatéma, hogy mi az "e-book formátum" kifejezés meghatározása. Van-e értelme egyáltalán, és vajon ugyanarra gondoltok-e, mikor egy masszívan Kindle-túlsúlyos világban meg akarod határozni az e-book fogalmát. Valamint a "reflow" az igenis perdöntő ebben a témában, a PDF pedig, - nemhiába a PostScript leszármazottja - egy (elsősorban nyomdai) lapleíró "nyelv", s mint ilyen szándékoltan megváltoztathatatlan, szerkeszthetetlen (ahogy nagyon helyesen írtad), s az oldal képét tartalmazza, nem az ott elhelyezett objektumok egyéb attribútumait. Így pl. egy paragrafus tulajdonságai, - a "stílusa", - is elvész, sőt az is, hogy egy paragrafus meddig tart.
De ezt te, - mint a PDF szakértő ismerője - nyilván pontosan tudod.
És akkor itt is vagyunk annál a pontnál, hogy miért nem vállalkoznak egyes eszközgyártók a támogatására.
Hogy ti. ez így ebben a formában szintén nem igaz. Mert igenis vállalkoznak a támogatására, amennyiben megmutatják a PDF oldal képét. A Nokia telefonod is, meg a Kindle is. Csak egy telefonon semmit nem fogsz látni belőle, mert olyan kicsi lesz. De való igaz: áttördelni az oldalt nem fogják. De más sem fogja. A nyomda sem fogja áttördelni. Nem arra való, nincs meg benne az ehhez szükséges információk többsége, sőt tulajdonképpen azért lett kitalálva, hogy ne változzon az oldal attól, hogy más eszközre került!

Az áttördelhetőség és egyéb maszlag csak egy szükséges kompromisszum,
Ez pedig, már ne haragudj, csacsiság. :) Ez maga az ebook egyik legfőbb ismérve. Manapság. Régebben, mondjuk 10-15 éve, még a PDF volt valóban a "legmodernebb tartalommegjelenítő formátum", de ma már korántsem. Ha nem így érzed - mi természetesen jogodban áll, - akkor nézz meg egy epub-ot, méginkább egy epub3 mintaállományt, lehetőleg több, - kisebb-nagyobb, színes, e-inkes - különféle eszközön. Aztán próbálkozz egy A4-es színes PDF-el is ugyanazokon az eszközökön!

Aztán gyere vissza, és szívesen beszélgetek az élményeidről. :)

srf
 
C

Chalamade

Vendég
Minek? A tájékozatlanság nem karakterfüggő, egysoros vagy féloldalas. Amit egy (ez) kalózoldal (reklámalany) látogatói többségben gondolnak attól még nem válik sem ténnyé sem igazsággá. Nyugodtan folytassátok, bár a látható eredmény zömében siralmas.
 

hampidampi

Állandó Tag
Állandó Tag
Minek? A tájékozatlanság nem karakterfüggő, egysoros vagy féloldalas. Amit egy (ez) kalózoldal (reklámalany) látogatói többségben gondolnak attól még nem válik sem ténnyé sem igazsággá. Nyugodtan folytassátok, bár a látható eredmény zömében siralmas.

Persze, mindenki hülye, csak te vagy helikopter.
Mind1, részemről a téma lezárva. Elmondtuk, amit el lehetett mondani.
 

Kovács Erika

Állandó Tag
Állandó Tag
Leszögezve a hiányt, a bölcsek kövének zsebemben létéről, és a tudományosságot még csak színlelni sem akarva, de talán segítve a hozzám hasonlóan olvasni akaró társaimat szeretném megosztani veletek a tapasztalatomat.

Sok, itt talált, különböző formátumban lévő könyvet "toltam" át a Mobipocket-tel, és a Calibre-vel. Így ismerősek számomra is a szokásos problémák. Kísérleteztem a jegyzettömbben való szerkesztéssel, különböző webes konvertálók beiktatásával az ebook gyártásban, több, kevesebb sikerrel. A legolvashatóbb megoldást - anélkül, hogy HTML szerkesztésbe merülnék - az alábbi módon sikerült elérnem. Az itt található anyagok kb. 80 %-ban olvasható (nem tökéletes) könyvet kaptam. Többnyire megoldást nyújt az "ö" és "ü" betűk problémájára, nem utolsó sorban a pdf-ből konvertált anyagoknál az eredeti könyv oldalszámainak eltüntetésében, és gyakran a felesleges sortöréseknél is. Megosztom veletek, hátha segíthetek ezzel más, hozzám hasonlóan informatika területén analfabétának is.

Az anyagot előbb a Mobipocket creatorral kezdem el konvertálni. Betallózom az alapanyagot, kijelölöm, hogy hová szeretném konvertálni, majd az "import"-ra klikkelek. Itt befejezem, illetve megszakítom a konvertálást.
Mikor készen van, megkeresem a mappát, amit a Mobipocket létrehozott. A mappában van egy HTML fájl a könyvről. Ezt teszem be a Calibrebe, majd konvertálom MOBI-ba.
Szinte minden esetben jobb az eredmény, mintha valamelyik konvertálót önmagában használnám. Próbáljátok ki. ;)
 
Oldal tetejére