Elektronikus könyvek készítésének technikai kérdései

akernar

Állandó Tag
Állandó Tag
Nem tudnám megmondani, hogy kevésbé/jobban megterhelő-e egy parser számára a div. Lehetségesnek lehetséges, mivel bizonyos fajta optimalizálások előfordulhatnak a parserek-nél, hisz egy div terjedelmileg sokkal változatosabb méreteket vehet fel (néha csak egy két elemet foglal keretbe, néha szinte az egész oldalt), míg egy "p" tag alapvetően egyetlen paragrafust tárol, aminek az átlagterjedelme szűk határokon belül mozog (egyszerűen azért, mert az életszerű paragrafusoknál az hogy nagy, körülbelül azt jelenti, hogy pár oldalas [sarkítva]). Emellett a "p" tag logikailag arra szolgál, hogy szöveget tároljon (+ pár másik tag-et, míg a div gyakorlatilag 1-2 kivételtől eltekintve bármelyiket, és ráadásul szélesebb formázási lehetőséget birtokol). Biztos lehetsz benne, hogy a jövőbeli parse-rek többé-kevésbé megfelelően értelmezik a dolgokat, mivel a "p" tag-nek ez a dolga.

Az én meglátásom szerint a vers sorait "p" tag-fel kellene körbezárnod, ami elég formázási szabadságot ad akár a vertikális pozicionáláshoz is (például ha egy mondat középső szava új sorban, egyedül és középen helyezkedik el, azt is meg tudod oldani). Vagy ahhoz, hogy sor természetes törésekor a fennmaradó rész kicsit beljebb kerüljön (a kiindulási probléma).

Az hogy raksz-e versszak köré egységbezárást? Ha szükséged van rá és könnyen meg tudod oldani, végülis miért ne. De jelenleg egyetlen felhasználási mód sem jut eszembe. Főleg mivel én is azokkal az emberekkel értek egyet, akik bekezdések közötti távolságra az üres sorokat preferálják (biztonságosabb információhordozó).

Köszönöm!
A versszakok egységbe zárása eszembe se jutott volna, csak a diás minta miatt írtam. De az értelmére az ő megoldásukban már rájöttem. Ugyanis szakaszok közti üres sort ők sem használnak, tehát a versszakok közti teret a stílus adja (igazad van abban, hogy előbbi biztonságosabb, másfelől ez meg ellenkezik az általánosan elfogadott elvvel, hogy minden ilyesmit a css-re kell bízni és lehetőleg csak valós tartalommal bíró egységeket használni). Mivel a verssorok behúzása eltérő, lehet, hogy a versszak közben van, lehet, hogy az utolsó sor, vagy éppen az első, gyakorlatilag minden behúzásméretet háromféleképpen kellett volna megcsinálniuk („sima” sor, meg olyan, aminek a tetején margó van, meg olyan, aminek az alján van). Ennél sokkal egyszerűbb, hogy a verssorra vonatkozó stílusban a margó 0, csak a behúzást állítja, és a versszak div stílusa meg megkapja a margókat. Legalábbis én így okoskodtam :) És ha így van, akkor ezt sokkal egyszerűbb megvalósítani, akár p-vel, akár div-vel. De persze újabb dobozokat jelent, már megint a parser teljesítménye a kérdés...

Mindenesetre a véleményed sokat segít, elvi szinten legalább értem, hogy mi a különbség, és mivel a szöveg megjelenítésére ezek szerint valóban a p a szabvány, nyilván igazad van abban is, hogy az semmivel sem igényel több erőforrást. Márpedig ha így van, jobban járok vele, merthogy mégiscsak igazodom az elméleti megfontolásokhoz.

Na majd kiderül, ha egyszer eljutok odáig. Egyébként meg arra is gondoltam, hogy nem nagy dolog kicserélni egy kész tartalomban a p-t div-re (vagy viszont), tehát akár az olvasón is lehet tesztelni majd. Csak mostanában nem sokat tudok ezzel foglalkozni, az egyéb dolgaink összesűrűsödtek.
 
...igazad van abban, hogy előbbi biztonságosabb, másfelől ez meg ellenkezik az általánosan elfogadott elvvel, hogy minden ilyesmit a css-re kell bízni és lehetőleg csak valós tartalommal bíró egységeket használni...

Igazából ez nálam kicsit cseles, mivel lehetőségem van saját programokat írni, így a HTML tisztítási lépésben az üres sorokat leveszem, és mint inline css adok térközt helyette a következő bekezdésre (mivel nálam csak bekezdések vannak).

De egyébként a DIA-s megoldás is teljesen jó. Sőt igazából adott is egy ötletet, hogy tudom majd megoldani azt, hogy ha egy olyan bekezdés van az üres sorom után, aminek már van felső margója. Ehhez kicsit problémásabb pluszba még hozzáadni X-et (bár a gyakorlatban nem fordult még elő a probléma).
 

srf

Állandó Tag
Állandó Tag
Nem tudnám megmondani, hogy kevésbé/jobban megterhelő-e egy parser számára a div. Lehetségesnek lehetséges, mivel bizonyos fajta optimalizálások előfordulhatnak a parserek-nél, hisz egy div terjedelmileg sokkal változatosabb méreteket vehet fel (néha csak egy két elemet foglal keretbe, néha szinte az egész oldalt), míg egy "p" tag alapvetően egyetlen paragrafust tárol, aminek az átlagterjedelme szűk határokon belül mozog (egyszerűen azért, mert az életszerű paragrafusoknál az hogy nagy, körülbelül azt jelenti, hogy pár oldalas [sarkítva]). Emellett a "p" tag logikailag arra szolgál, hogy szöveget tároljon (+ pár másik tag-et, míg a div gyakorlatilag 1-2 kivételtől eltekintve bármelyiket, és ráadásul szélesebb formázási lehetőséget birtokol). Biztos lehetsz benne, hogy a jövőbeli parse-rek többé-kevésbé megfelelően értelmezik a dolgokat, mivel a "p" tag-nek ez a dolga.

Az én meglátásom szerint a vers sorait "p" tag-fel kellene körbezárnod, ami elég formázási szabadságot ad akár a vertikális pozicionáláshoz is (például ha egy mondat középső szava új sorban, egyedül és középen helyezkedik el, azt is meg tudod oldani). Vagy ahhoz, hogy sor természetes törésekor a fennmaradó rész kicsit beljebb kerüljön (a kiindulási probléma).

Az hogy raksz-e versszak köré egységbezárást? Ha szükséged van rá és könnyen meg tudod oldani, végülis miért ne. De jelenleg egyetlen felhasználási mód sem jut eszembe. Főleg mivel én is azokkal az emberekkel értek egyet, akik bekezdések közötti távolságra az üres sorokat preferálják (biztonságosabb információhordozó).

A parserek számára már most sem megterhelők a div-ek.
Ugyanis nem pont ugyanarra szolgálnak, mint a p tag, bár sok tekintetben lehet egymás helyett használni őket.
Az sem áll, hogy terjedelmi korlátja volna a p tagnek, ha akarod, egy egész könyvet is betehetsz egyetlen p tag-be. (Pl. Hrabal Táncórák... c. kisregénye egyetlen mondat.) Az már más kérdés, hogy a parserek valóban kiakadhatnak, ha nem tudják egyszerre a memóriába olvasni a paragrafust, de ez a divvel is így van, - ezért kell maximálni az egyes html dokumentumok méretét egy epubban és a mobiban is.
Az alapvető különbség a p és a div között, hogy a p csak szöveg tárolására szolgál, a div pedig bármilyen logikai egységet tartalmazhat, képet felirattal, címet alcímmel és mottóval, táblázatot magyarázattal, vagy akár egy versszakot. CSS segítségével mindkettőt igen szabadon lehet formázni, inkább logikailag érdemes dönteni egyik, vagy másik mellett.
Konkrétan versnél az egyes sorokat p taggel érdemes kiíratni, aztán versszakonként divek közé zárni, hogy a versszakok között spácium legyen.
A bekezdések közötti üres sorokkal meg az a fő baj, hogy néhány parser egyszerűen eldobja az üres paragrafusokat. Meg randa is, ha a sorköz nagyobb, mint egyszeres.
 

srf

Állandó Tag
Állandó Tag
Igazából ez nálam kicsit cseles, mivel lehetőségem van saját programokat írni, így a HTML tisztítási lépésben az üres sorokat leveszem, és mint inline css adok térközt helyette a következő bekezdésre (mivel nálam csak bekezdések vannak).

De egyébként a DIA-s megoldás is teljesen jó. Sőt igazából adott is egy ötletet, hogy tudom majd megoldani azt, hogy ha egy olyan bekezdés van az üres sorom után, aminek már van felső margója. Ehhez kicsit problémásabb pluszba még hozzáadni X-et (bár a gyakorlatban nem fordult még elő a probléma).
Ja és az inline CSS szintén nem ajánlott, mert ha valami akkor az inline formázások szokták a parsereket zavarba hozni. Ráadásul a programozó is bele tud zavarodni, aztán elkezd az ember important property-t használgatni, hogy mégis működőképesre farigcsálja a kódot, és a vége egy ronda áttekinthetetlen html forrás.
Szóval jobb, ha szépen stílusokkal logikailag elválasztva CSS-ben dolgozik az ember. :)
 
A parserek számára már most sem megterhelők a div-ek.
Ugyanis nem pont ugyanarra szolgálnak, mint a p tag, bár sok tekintetben lehet egymás helyett használni őket.
Az sem áll, hogy terjedelmi korlátja volna a p tagnek, ha akarod, egy egész könyvet is betehetsz egyetlen p tag-be. (Pl. Hrabal Táncórák... c. kisregénye egyetlen mondat.) Az már más kérdés, hogy a parserek valóban kiakadhatnak, ha nem tudják egyszerre a memóriába olvasni a paragrafust, de ez a divvel is így van, - ezért kell maximálni az egyes html dokumentumok méretét egy epubban és a mobiban is.
Az alapvető különbség a p és a div között, hogy a p csak szöveg tárolására szolgál, a div pedig bármilyen logikai egységet tartalmazhat, képet felirattal, címet alcímmel és mottóval, táblázatot magyarázattal, vagy akár egy versszakot. CSS segítségével mindkettőt igen szabadon lehet formázni, inkább logikailag érdemes dönteni egyik, vagy másik mellett.
Konkrétan versnél az egyes sorokat p taggel érdemes kiíratni, aztán versszakonként divek közé zárni, hogy a versszakok között spácium legyen.
A bekezdések közötti üres sorokkal meg az a fő baj, hogy néhány parser egyszerűen eldobja az üres paragrafusokat. Meg randa is, ha a sorköz nagyobb, mint egyszeres.

Kicsit talán félreértetted a dolgokat (de általában csak én nem tudom jól kifejezni magam), nem úgy akartam fogalmazni, hogy ezek között szemmel látható különbség van, csak hogy elvi szinten megfogalmazva a mélyén lehetséges-e.
Például abból következőleg, hogy a p tag-nél lehet arra építeni, hogy nem nagy terjedelmű dolgot tárol, kisebb formázási eszköztárral lesz használva, ezek mind lehetséges optimalizálási pontok. Persze lehet az egész könyvet egy p tag-be rakni, úgyanúgy ahogy a weboldalakat szerkezetét is table-lel kialakítani...

Az üres soros megoldást is megvédeném, mert amit te írsz az teljességgel igaz, csak nem ebben a formában érdemes használni. Nálam ez az információt addig hordozza, amíg a HTML átalakítás közben ki nem derül, hogy milyen eszközön és milyen formában kell megjelennie. Az hogy ez most üres paragrafus marad, inline css-sé vagy különálló css-é alakul-e, az aktuális cél olvasó(k) dönti el. A végső mobi, epub nálam csak megjelenítési forma, a konkrét tárolást egy pár lépéssel hátrébb lévő forma végzi (docx vagy html attól függően, hogy van e a dokumentumban automatikus nem átalakítható rész).
Visszatérve erre az inline css-re, szerintem ez is egy teljesen jól használható eszköz, ha az ember a saját szabályait betartva használja és megfelelően használható arra az egyszerű feladatra, amire az ember szánja (és persze, ha az adott olvasónak sem okoz gondot). A különálló CSS-t is ugyanúgy túl lehet bonyolítani, ha valaki nincs tisztában a használatával. Persze az is igaz, hogy az utóbbinál a hozzá nem értő felhasználás esetén is később következik be a dolog általában.

Ezeket a dolgokat persze lehet, hogy csak azért látom máshogy, mert kézzel igazából utoljára a Word-ben nyúlok bele a dolgokban, onnantól a megírt programjaim végzik a megfelelő dolgokat. Az egyedi szabvány miatt például pontosan tudom, hogy a kf8-as és a különálló mobi központi css egyaránt teret engednek az inline css-beli formázásnak*.

## Utólagos kiegészítés:
*Mármint természetes, hogy teret enged, mivel magasabb a precedenciája, de úgy raktam össze a dolgokat, hogy ez az egész természetes része legyen.
 

akernar

Állandó Tag
Állandó Tag
Urak, a vitátok lassan eléri azt a pontot, ahol már nem tudom követni :) , lévén nem vagyok programozó. De mindkettőtöknek köszönöm a hozzászólásokat, a magam kis problémájára szerintem megkaptam a választ, így kettőtöktől. Ki is fogom próbálni hamarosan (legalábbis remélem). Kösz még egyszer!
 

Anna14

Állandó Tag
Állandó Tag
Sziasztok!
Ismét belefutottam egy könyvbe, amit nagyon szeretnék elolvasni, de a Kindle olvasóm nem tud mit kezdeni a DJVU formátummal.
Tudom, hogy számítógépen tudnám olvasni valamilyen programmal, de sajnos arra nincs lehetőségem. Online programokkal is próbálkoztam, de az sem hozott eredményt.
Már többször segítettek nekem itt ügyes emberek abban, hogy készítettek nekem egy korrektúra nélküli word fájlt a djvu-ból.
Most 2 kérésem lenne, az egyik hogy a csatolt könyvből megtenné e ezt nekem most is valaki, a másik hogy elmondanátok e nekem, hogy hogy kell ezt megcsinálni?

Van egyébként egy pdf scan (ez van ráírva, jelentsen bármit is) formátumú könyvem is (Lionel Shriver: Beszélnünk kell Kevinről), ezt is nagyon szívesen feltenném, nagyon sokan keresték is már, de a mérete miatt (195 mb) nem tudok vele semmit sem kezdeni. Ezt sem tudom egyébként olvasni az olvasón.

Remélem érthető voltam, mint az gondolom kiderült nem vagyok egy technikai zseni :)

Köszönöm a segítséget!
 

Csatolások

  • Mara Anoni Bűn vagy bűnhődés.djvu
    2.7 MB · Olvasás: 71
Sziasztok!
Ismét belefutottam egy könyvbe, amit nagyon szeretnék elolvasni, de a Kindle olvasóm nem tud mit kezdeni a DJVU formátummal.
Tudom, hogy számítógépen tudnám olvasni valamilyen programmal, de sajnos arra nincs lehetőségem. Online programokkal is próbálkoztam, de az sem hozott eredményt.
Már többször segítettek nekem itt ügyes emberek abban, hogy készítettek nekem egy korrektúra nélküli word fájlt a djvu-ból.
Most 2 kérésem lenne, az egyik hogy a csatolt könyvből megtenné e ezt nekem most is valaki, a másik hogy elmondanátok e nekem, hogy hogy kell ezt megcsinálni?

Van egyébként egy pdf scan (ez van ráírva, jelentsen bármit is) formátumú könyvem is (Lionel Shriver: Beszélnünk kell Kevinről), ezt is nagyon szívesen feltenném, nagyon sokan keresték is már, de a mérete miatt (195 mb) nem tudok vele semmit sem kezdeni. Ezt sem tudom egyébként olvasni az olvasón.

Remélem érthető voltam, mint az gondolom kiderült nem vagyok egy technikai zseni :)

Köszönöm a segítséget!

Ha a keresőbe beírod, hogy DJVU converter, elég sok megoldási javaslatot találsz. Én - kíváncsiságból - kipróbáltam egy online djvu-pdf konvertert, működött is minden további nélkül. Wordot viszont szerintem legfeljebb csak valamilyen karakterfelismerő programmal lehet belőle kreálni, miután a csatolt fájlban az oldalak képként (raszterképként) vannak elmentve, így a pdf is ilyen lesz (emiatt a mérete is jó nagy lett, nekem 52 MB) .
Az elnevezés alapján a pdf scan is szkennelt képeként tartalmazhatja a könyv oldalait - erre utal a nagy fájlméret is. Szerintem szöveget ebből is csak valamilyen karakterfelismerő programmal lehet kinyerni.
 

Anna14

Állandó Tag
Állandó Tag
Ha a keresőbe beírod, hogy DJVU converter, elég sok megoldási javaslatot találsz. Én - kíváncsiságból - kipróbáltam egy online djvu-pdf konvertert, működött is minden további nélkül. Wordot viszont szerintem legfeljebb csak valamilyen karakterfelismerő programmal lehet belőle kreálni, miután a csatolt fájlban az oldalak képként (raszterképként) vannak elmentve, így a pdf is ilyen lesz (emiatt a mérete is jó nagy lett, nekem 52 MB) .
Az elnevezés alapján a pdf scan is szkennelt képeként tartalmazhatja a könyv oldalait - erre utal a nagy fájlméret is. Szerintem szöveget ebből is csak valamilyen karakterfelismerő programmal lehet kinyerni.


Köszönöm a választ!
DJVU konvertert én is próbáltam, működött is, de sajnos az eredmény olvasása a Kindle-en élvezhetetlen. Valami más megoldást kell találnom...
 

AndreaBeszedes

Állandó Tag
Állandó Tag
Nekem is lenne egy kérdésem..
Hogyan lehet Kindle-t átállitani, hogy az oldalszámot mutassa és ne százalékban jelenjen meg?
 

hampidampi

Állandó Tag
Állandó Tag
Nekem is lenne egy kérdésem..
Hogyan lehet Kindle-t átállitani, hogy az oldalszámot mutassa és ne százalékban jelenjen meg?
Nem kell állítani semmit. Akkor jelenik meg, ha előhozod a menüt. Persze ebben az esetben csak akkor látható, ha a könyv is támogatja.
A legegyszerűbb, ha a Calibre-rel küldöd a könyvet az olvasóra. Akkor biztos lesz oldalszámod.
Egyébként egy apnx kiterjesztésű file tárolja az oldalszámokat.
 

AndreaBeszedes

Állandó Tag
Állandó Tag
köszönöm, a legközelebbi konyvnél kipróbálom a Calibre-t.
Ezek szerint a könyv nem támogatja az oldalszámot, mert a menüben nem jelent meg ez az opció.
 

hampidampi

Állandó Tag
Állandó Tag
köszönöm, a legközelebbi konyvnél kipróbálom a Calibre-t.
Ezek szerint a könyv nem támogatja az oldalszámot, mert a menüben nem jelent meg ez az opció.
Azért túl sokat ne várj az oldalszámtól. Nem egy egzakt érték és nem is fog megegyezni a nyomtatott könyvvel. Igazából csak arra jó, hogy kb. megtudod állapítani milyen "vastag" a könyv.
Az oldalszámozás az e-könyveknél külön műfaj, már ki lett itt vesézve egypárszor.
 

AndreaBeszedes

Állandó Tag
Állandó Tag
Azért túl sokat ne várj az oldalszámtól. Nem egy egzakt érték és nem is fog megegyezni a nyomtatott könyvvel. Igazából csak arra jó, hogy kb. megtudod állapítani milyen "vastag" a könyv.
Az oldalszámozás az e-könyveknél külön műfaj, már ki lett itt vesézve egypárszor.
Ha belegondolok, ezelőtt fél évvel azt hangoztattam, hogy soha nem olvasnék e-book-ot, mert a könyv az könyv. Most meg nem tudom letenni a Kindle-t.
Tehát, a százalék megszokása is csak idő kérdése.
Majd átolvasom a "vesézéseket" is, hátha...
 

mastop01

Állandó Tag
Állandó Tag
Sziasztok!

Hogyan tudom azt megcsinálni, hogy az első oldalon a "Tartalomjegyzék" címszó csak egy link legyen, de maga a tartalomjegyzék a könyv végére essen?
 
C

Chalamade

Vendég
Rég jártam erre, sziasztok!
A Calibre-t használók figyelmét szeretném felhívni, hogy a saját példányom mai frissítése után leltem rá benne a szerkesztés lehetőségére. Immár az AZW3 és ePub formátum szerkeszthető is benne.
Emiatt állt le a Sigil további fejlesztése.
 

saga3

Állandó Tag
Állandó Tag
Rég jártam erre, sziasztok!
A Calibre-t használók figyelmét szeretném felhívni, hogy a saját példányom mai frissítése után leltem rá benne a szerkesztés lehetőségére. Immár az AZW3 és ePub formátum szerkeszthető is benne.
Emiatt állt le a Sigil további fejlesztése.

Frissíteni is régen frissíthettél, mert ez már jó ideje benne van.
:)

Igen, sajnos leállt a Sigil fejlesztése... én azóta is azt használom (egyelőre) nem jött be a Calibre belső Editora.
 
C

Chalamade

Vendég
Igen, sajnos leállt a Sigil fejlesztése... én azóta is azt használom (egyelőre) nem jött be a Calibre belső Editora.

Sajnos az időből van a legkevesebb, és mivel aktuális könyvem nagy és csak pdf alá van értelme, csak aktualizátam a progikat, most használni épp nem kell.
A wisiwyg szerkesztő nyilván kényelmesebb, bár itt egy előző témát olvasva azért html-ben van némi homály, amit a calibre használata szerkesztésre kicsit oszlathat...
 

asnobli

Állandó Tag
Állandó Tag
Csak ötletelek, mert tényleg macerás :)
Ha a word ismeri a regexp kifejezéseket, akkor meg lehet adni, hogy a nem mondatvégi karaktereket (pont, felkiáltójel, kettőspont, stb) követő sorvégeket cserélje ki szóközre. Vagy a betű- ás számkaraktereket követőeket, vagy lehet próbálkozni variációkkal. Rá kell kerestetni a megadott kifejezésre, és ha azt találja meg, amit szeretnél, akkor lehet cseréltetni, akár egyszerre az összeset is. De mivel szoktak hibák lenni a szövegekben, azért a végeredményben is biztosan lesz hiba.
Na és attól tartok, a word ezt nem tudja. A libreoffice pl. igen.

Szerintem próbákozz a LibreOffice MyTXTCleaner nevű pluginjával. Egész jó eredménnyel alakítja át, de nem árt utána végignézni és az esetleges hibákat kézzel javítani.
 
Oldal tetejére