Бизнес план - Бухгалтерия. Договор. Жизнь и бизнес. Иностранные языки. Истории успеха

Отличие форматов fb2 и epub. Что такое epub и почему он не заменит fb2

Коротко о главном
Если вы хотите составить себе адекватное представление о epub, представьте, что вы сохранили на диск какую-нибудь (например, эту) веб-страницу вместе с используемой на ней графикой и стилями. Для всех современных браузеров это стандартная функция, например в FireFox это делается через меню «Файл → Сохранить как → Веб-страница полностью». Можно сохранить рядом не одну, а несколько страниц. Затем вы кладете рядом с вашими страницами два служебных XML-файла. Один просто метка «это epub» (container.xml), второй содержит перечень всех файлов - .html, .css, .jpg, etc (обычно это файл content.opf).
Осталось поместить всё это в zip-архив и сменить ему расширение с.zip на.epub.
Всё.
Книга готова, а вы уже знаете, что такое epub. Это не шутка и не преувеличение - epub это просто архивированный в zip html. Ни больше, ни меньше.

Про формат подробно
Размещение содержимого в epub-архиве

Как мы уже выяснили, epub - это zip-архив с несколькими файлами. Когда вы архивируете файлы ZIP-архиватором и вкладываете в архив XML-файл container.xml, вы говорите прозой создаете файл в формате «Open Container». Несмотря на убийственно-пафосное название этого мероприятия (IDPF стоило знать, что есть ISO-стандарт OPC и не изобретать велосипед), за «Open Container Format» (OCF) вполне можно поставить IDPF «зачот» (почему - выясним ниже).
Помимо файл container.xml (должен лежать в META-INF) epub обязательно содержит еще один служебный файл, где перечислены все прочие файлы, размещенные в архиве, и указан их тип, как правило называется content.opf.
Вся конструкция для знающего человека сильно напоминает java-пакеты вообще и OpenDocument в частности. И в самом, деле IDPF ищет пути объединения с OpenDocument. Не очень понятно, что мешало стартовать с клоном OD, ведь OpenDocument на два года старше OCF, но, видимо, велосипеды - неизбежный удел дилетантов, вовремя доки почитать не удосужились. Вот и xpointer IDPF так же, по всем судя, твердо намерены реизобрести в рамках EPUB3 . Версии к 5-й догадаются использовать стандартизованный w3c формат для ссылок и тоже будут искать пути объединения.

Какие данные хранятся в epub
epub обычно содержит следующую информацию:

  • Мета-данные: название, язык, авторы, etc.
  • Средства навигации: порядок листания для xhtml-файлов и « карта сайта содержание»
  • Собственно текст в виде нескольких xhtml-файлов, которые могут использовать стили css, картинки в jpg, gif и png а так же векторную графику svg и шрифты. Последняя версия epub декларирует поддержку MathML.
  • Помимо этого epub может включать ряд дополнительных узкоспециализированных файлов разметки, PDF-версию книги для печати и т. п. экзотику, реально не используемую, не поддерживаемую читалками и среднему читателю неинтересную.
Мета-информация в epub
Минимальная мета-информация epub включает название, ID документа и язык. Помимо этого можно указать авторов, переводчиков и других участников создания книги, дату публикации/написания, тему книги (в свободной форме), plain-text описание и данные об издательстве.
Ключевая мета-информация хранится в стандартной схеме Doublin Core , немного расширенной. Описание авторов, тематики и всех других полей (за исключением дат и языка) дается в свободной текстовой форме, что, фактически, исключает эффективную автоматическую каталогизацию epub из разных источников.

Средства навигации
epub, как мы помним, может включать множество html-файлов. И файлов будет множество. Не потому, что этого требует IDPF, а потому, что от больших файлов epub-читалки падают и все делают много маленьких. И вот для того, чтобы привычное читателю «пролистывание» работало, создатель epub указывает порядок, в котором файлы следует предъявлять. «При открытии показываем 3.html, когда читатель пролистает его до конца открываем 1.html, затем 8.html. А файл footnotes.html при прямом пролистывании недостижим, туда читатель будет попадать по сноскам», что-то в таком роде. Содержится обычно в файле content.opf.
Еще одно средство навигации внутри книги - содержание. Если присутствует, то, как правило хранится в toc.ncx. Технически это более аналог функции «карта сайта», чем привычного «содержания». Cодержание в бумажной книге (или электронном документе) повторяет структуру текста, а.ncx не связан с общим порядком следования текстовых фрагментов и может прямо им противоречить. Впрочем, в реальности файл как правило используется именно в качестве содержания и оформляется «штатно», повторяя порядок, заданный для листания.
Вообще, повторное хранение и переписывание на разные лады одних и тех же данных - фирменный знак epub. Мета-данные храняться в четырех местах: в описании OPF контейнера container.xml, в описании epub-пакета content.opf, в файле содержания toc.ncx и в html-файлах (в тегах meta). Содержание описывается трижды - «карта книги» из toc.ncx спорит с перечислением фрагментов в content.opf кто из них главнее, а заголовки h1-h6 в html смотрят на все это, и думают о реванше.

Текст книги
Разумеется, в epub присутствуют и собственно html-файлы с текстом книги. Так же в архиве хранятся используемые в тексте элементы - графика, стили, скрипты, шрифты.
Никаких существенных «надстроек» или «ограничений» в отношении html, css и т.п. epub не задает. Берем современный Web-контент, ставший уже даже не «динамическим», а «текучим» (epub декларирует поддержку html5, больше смахивающего на ОС , чем на язык разметки, его и браузеры-то пока поддерживают ограниченно), сохраняем на диск, архивируем - и вуаля, электронная книга готова.
«Дорогой, я сохранила интернет на диск, что дальше?»

История вопроса
Чтобы лучше понять основную силу и основную слабость epub, вернемся на 12 лет назад. В 2000-м году, когда ваш покорный слуга только-только приобщился к электронному чтению (если быть точным, был коварно подсажен на оное небезызвестным the-ebook), в сети уже существовали «Библиотека Мошкова », «Альдебаран », «Литпортал » и бог знает сколько еще мелких библиотек. Довольно много текстов было, в принципе, доступно. В основном именно в виде HTML.
HTML уже тогда давал широчайшие возможности для оформления. Благодаря этому люди, готовившие тексты, создавали иногда подлинные шедевры верстки. Достаточно вспомнить, что абзацы в библиотеке Мошкова были (и сейчас Мошков жжет в таком же роде, по-моему) оформлены миксом из тегов

и
Однако, реально существовавшие читалки (iSilo , Microsoft Reader , Mobipocket , устройства типа REB и т.п.) понимали только ограниченный диалект HTML и еще более ограниченное подмножество CSS. Конечно же, каждая читалка строила «расширения» над форматом, но никто не верстал под конкретную читалку.
В финале, после соединения творческих прорывов создателей текстов, вдохновленных мощью HTML+CSS и ничем не ограниченных в полете своей фантазии, с реальными читалками, на экране пользователя получалась, как правило, ерунда. В лучшем случае книга была неказиста, но читаема. В худшем - текст вообще превращался в месиво.
Моим первым ответом на это стала программа ClearTXT , убирающая из текста «творчество». Однако, достаточно быстро стало ясно, что никакой эвристический анализ не угонится за фантазией создателей html-книг. В итоге все равно приходилось работать руками, больше или меньше.

Проблемы с диалектом были не единственными. Программы-читалки имели не только индивидуальные «выразительные средства» и «языковые предпочтения». Ни одна не читала HTML напрямую (в этом плане мало, что изменилось, кстати, предлагаю поразмышлять - почему). Каждая программа использовала свой, обычно закрытый, метод подготовки и упаковки данных. lit, rb, lrf, chm - каждый создатель читалки и разработчик устройства считал своим долгом «изобрести» новый закрытый «формат» и своё, личное, DRM-решение. Средства для конвертации в этот закрытый формат часто были либо недоступны, либо выпускались в виде приложений и/или библиотек под конкретную платформу, с ограниченной документацией или вовсе без нее.

Две проблемы в 2000-м, одна проблема в 2012
Итак, в 2000-м году взять произвольный html и скормить его читалке нам мешали две вещи:

  1. Необходимость использовать громоздкие сторонние средства для упаковки HTML в понятный читалке формат
  2. Несовместимость читалки с используемой разметкой и стилями
epub предлагает решения для обеих проблем:
  1. Средства упаковки стандартизированы и технологичны - можно даже вручную, минут за 20, собрать весьма сложную книгу используя OCF, notepad и zip-архиватор.
  2. Как мы уже видели, epub совместим со всеми и всяческими диалектами, стилями и методами разметки. Сохраняй из web, архивируй и читай.
Казалось бы, все хорошо.
И по поводу упаковки к epub претензий, помимо эстетических, нет. Используется, пусть нестандартное и не самое удачное, но адекватное задаче решение, к тому же простое, как палка.
А вот относительно отображения текста в читалках нас ждут плохие новости. Сам «формат» совместим со всем и всяческим HTML, это да. Куда как просто было написать в стандарте «см. спецификацию html». Соблазн был велик и IDPF не устоял. Но вот мы открываем наш «какой угодно» HTML в «какой угодно читалке» и...
И обнаруживаем, что мы ни на йоту не сдвинулись относительно 2000-го года. Как и в конце прошлого века, каждая конкретная читалка понимает только свой, ограниченный, диалект html+css. Как и в прошлом веке, диалект обычно недокументирован. По-прежнему в каждой читалке для решения даже таких стандартных проблем, как сноски, вводятся свои, ни с чем не совместимые, расширения (поищите epub footnotes в google , методики создания, помимо превращения сносок в ссылки, варьируют от совершенно кислотного CSS до javascript). Простейшие вещи сделать практически невозможно, сложные вещи либо не работают, либо роняют читалки.

Вот вам домашнее задание: не подглядывая в epub от ЛитРес, сделайте epub с пустой строкой между двумя абзацами (текст, пустая строка, снова текст, как перед этим абзацем), одинаково отображаемый в iBooks , ADE , Sony и Nook . Китайские чудо-читалки и прочую экзотику оставим в стороне, чтобы задача оставалась выполнимой. И даже выравнивания по ширине и переносов со сносками не попросим. Просто пустая строка, тег в fb2. Время пошло.

Вердикт по делу epub
Явные плюсы формата - простота и технологичность zip-пакета, открытость.
Так же как плюс можно рассматривать единое DRM-решение. IDPF стыдливо делает вид, что DRM в epub типа открыт и типа любой может сделать свой. Все типа верят. И ясно понимают, что epub существует на 99% благодаря тому, что Adobe поддерживает для него DRM-инфраструктуру. DRM-зло, но один DRM на всех это меньшее зло, чем по DRM на магазин.
Да, глупо, когда архивированный HTML с взламываемым за одну минуту DRM выдается за невесть какую инновацию. Но zip и прочая стандартизация это какой ни на есть, а прогресс.
Касаемо плюсов это все.

А вот в области создания сложной разметки epub совсем никуда не годится и дальше будут только минусы. Формат не дает создателю книги ни гарантий относительно того, что увидит конечный читатель на экране, ни надежных средств контроля, которые позволят отсечь хотя бы заведомо «нерабочие» варианты, ни готовых решений для стандартных задач. Мой первый epub, только что прошедший валидацию, уронил две читалки из трех, на которых я его тестировал (слишком большой html - 2Мб, и слишком много ссылок, как я потом установил). Создатели документов вынуждены либо игнорировать «фичи» отдельных epub-читалок, либо предлагать несколько epub, чтобы читатель мог взять файл, совместимый именно с его устройством. Ради такого финала и огород городить не стоило - что толку верстать html5 зная, что читать его будут в IE3?

Чего нам ждать от epub в будущем
Наиболее благоприятный для epub сценарий - вытеснение из ниши программ-читалок мелких разработчиков несколькими крупным игроками. Сделать полнофункциональный html5-парсер с постраничной разбивкой как минимум не проще, чем сделать современный браузер, а отдача несопоставимо меньше, и случайных людей тут не будет. Однако ни google, ни Мicrosoft, ни Opera пока что не бегут делать новые движки epub-читалок чтобы Adobe мог как следует поднять бабла на своем чудо-DRM. И сама Adobe вполне ясно свой потенциал по развитию ридеров показала - ADE до сих пор не имеет ни поддержки сносок, ни нормально типографики, ни переносов.
Так что гораздо вероятнее, что лет за пять вокруг epub сформируется некий «неписанный IDPF» неформальный свод правил верстки, рабочих решений по оформлению, опробованных на ведущих читалках «хаков» и «фокусов». Сетевое сообщество уже формирует «истинный» epub-стандарт поверх всепрощающего «html5+css3+все_чего_хочется_еще». Описываются реальные решения для реальных проблем в реальных ридерах. Потом эти «фокусы», будучи стандартом де-факто, станут обязательными и для разработчиков новых читалок. Те, кто в IT достаточно давно, чтобы успеть наглотаться дыма браузерных войн и поработать с IE4, NN4 и Opera 3, отлично представляют себе, что именно нас ждет - по этим граблям сетевое сообщество уже ходило и икается эта прогулка до сих пор. Поэтому когда я вижу «этот epub оптимизирован под iBooks» я испытываю не просто де-жа-вю, а острый рвотный рефлекс.

И вот за то, что нас пытаются выпихнуть «назад в 90-е» я ставлю epub незачет. Нам не нужны хаки, становящиеся неработоспособными в новой версии софта. Нам не нужны неписанные правила, по крупицам отлавливаемые методом тыка. Не нужны узаконенные баги. Не нужна «валидация тестированием» по всем читалкам - «покажет или не покажет». Всё это мы проходили.
Нам нужна надежная и удобная технология, четкий стандарт и рабочие средства контроля качества. И epub этого нам дать не смог, к сожалению.

Чего от epub ждать бесполезно
Среди недостатков epub есть и еще один, который мы пока не затрагивали - принципиальная несовместимость с другими форматами. epub рожден быть монополистом. Извлечение данных из epub и конвертация в другой формат даже для нехитрого html является непростой задачей. Когда же epub заматереет, обрастет хаками под устройства и замысловатыми решениями, типа подстраничных сносок на CSS, извлечь из него что-либо будет задачей практически неразрешимой. Какой бы формат Adobe не разрабатывала, получается PDF - вход рубль, а выход пять.
А ведь нам все еще нужна поддержка разных (в т.ч. старых) читалок и устройств. Нужна полноценная поддержка альтернативных форматов, которые уже приобрели вес (mobipocket на Kindle) и будут еще появляться на рынке.

В добавок нам нужны средства каталогизации, обмена цитатами и заметками и прочая и прочая, чего epub даже на декларативном уровне пока что не обещает. Иными словами, нам нужен fb3, которому и будет посвящена следующая статья.

2015-03-11 | Без рубрики

Человек, любящий книги, стремится читать везде и всюду. Именно поэтому в последние годы чтение с ридеров или мобильных телефонов приобрело такую огромную популярность. Конечно, мы можем сколько угодно говорить о прелестях запаха новой бумажной книги, о приятных моментах в книжном, при выборе пополнений для вашей библиотеки, но факт остается фактом - в повседневной суете читать электронные книги проще, чем таскать с собой привычные бумажные томики. Если же вы пишите и хотите, чтобы ваше творчество стало удобным и доступным для читателей, мало выкладывать тексты на открытых ресурсах, хорошо бы еще и приложить к ним файловые версии, чтобы люди смогли скачать ваше творение и оценить его на досуге.

Вне зависимости от того, читатель вы, писатель или «два в одном», при скачивании или выкладывании текстов с файлами, вы можете столкнуться с тем, кто ваш телефон или ридер не поддерживают этот формат (или же ваши читатели жалуются на то, что файлы такого формата у них не читаются). Чтобы разобраться с тем почему так происходит, мы написали для вас небольшое пояснение о том, какие бывают форматы электронных книг, чем они отличаются и в чем преимущество и недостаток каждого из них.

Виды форматов:

Для начала необходимо заметить, что наиболее распространенные форматы электронных книг это: FB2, EPUB, MOBI, PDF, RTF, TXT, DOC/DOCX и DjVu. Естественно, когда непосвященный человек сталкивается с таким многообразием, сложно разобраться что к чему и какой формат выбрать для чтения или конвертации своих файлов.

Microsoft Windows, только вот, к сожалению, DOC/DOCX не поддерживаются большинством ридеров, да и на мобильных телефонах могут не всегда открыться, а в TXT читать книги очень и очень неудобно.

Впрочем, давайте обо всем по порядку:

FB2 (FictionBook)

Преимущества: Один из наиболее распространенных форматов в русскоязычном сегменте интернета. В нем удобно структурировать документ большого объема, делить на главы и т. п. Файлы FB2 занимают немного места и легко конвертируются в другие форматы.

Недостатки: FB2 - разработанный в России формат. Он не поддерживается большинством ридеров и неизвестен по всему миру. Открывается только на устройствах с русской прошивкой и чужд брендовым ридерам, лидирующим по всему миру: Sony, Amazon Kindle, Barnes&Noble, Kobo и т. п. Да, вы можете поспорить, что на Sony FB2 открывается, но официальная прошивка, позволяющая открыть этот формат на ридерах Sony, вышла в свет всего пару лет назад и установлена далеко не на всех моделях. Если же говорить о том, чтобы продавать свои произведения на Amazon или Itunes, тот тут ответ однозначен - FB2 не подходит для международных площадок.

PDF (Adobe Portable Document Format) и DjVu (произносится «дежавю́») - не будем рассматривать каждый в отдельности и объединим их одним пунктом.

Преимущества: Оба формата используются для хранения сканированных книг. В PDF можно создавать очень красочные файлы. DjVu просто довольно неплохо сжимает файлы, благодаря чему они меньше «весят».

Недостатки: Файлы PDF получаются очень громоздкими. Если же речь идет о сканировании, то в любом случае сканированные книги неудобно читать с экрана, поскольку их качество оставляет желать лучшего вне зависимости от того в PDF выложен скан или в DjVu.

Преимущества: TXT открывается на любом ридере. DOC/DOCX известные всем форматы Microsoft Word.

Недостатки: Читать книги в TXT ужасно неудобно, поскольку в нем отсутствует форматирование текста (выравнивание по ширине, перенос абзацев, деление на главы и т.п.). DOC/DOCX поддерживается очень малым количеством устройств для чтения.

RTF (Rich Text Format)

Преимущества: Удобный и компактный формат для хранения текстовых файлов.

Недостатки: Крайне редко поддерживается ридерами и мобильными телефонами, планшетами и т. п.

Преимущества: LRF специальный формат электронный книг от Sony. MOBI формат книг для Amazon Kindle.

Недостатки: В настоящее время и Sony поддерживают более популярный формат электронных книг - EPUB.

EPUB (Electronic PUBlishing)

Преимущества: EPUB - самый распространенный в мире формат электронных книг. Не имеет проблем с распознаванием, позволяет создать хорошо структурированный текст с иллюстрациями. Этот формат сам по себе уже архив, а потому компактный и не требует дополнительных архиваторов.

Как вы можете видеть, каждый из упомянутых выше форматов имеет свои преимущества и недостатки. К примеру, безусловно, наиболее «читаемым» форматом для электронных книг будет TXT, но при этом читать книги в таком формате - это практически издеваться над своими глазами. Такой текст невозможно структурировать, в нем отсутствуют абзацы, главы, в него невозможно вставить иллюстрации и т. п.

Наиболее распространенным и удобным форматом для чтения электронных книг, является EPUB. Однако, если речь идет о том в каком виде автору выкладывать свое произведение онлайн, наиболее рациональным решением будет выкладка сразу в нескольких форматах. К примеру: EPUB (читается везде, кроме Amazon Kindle) + MOBI (читается только на Amazon Kindle) + DOC/DOCX (для тех, кому привычно читать с компьютеров и ноутбуков). Конечно, бонусом можно выложить текст и в формате FB2, к которому так привыкла русскоязычная аудитория, однако, далеко не на всех устройствах откроется файл такого формата.

И конечно же, в завершение этой статьи и на правах рекламы, хотим вам сообщить, что недавно в СНГ начала работу новая интернет-система Booqla, предназначенная для удобной и, внимание, бесплатной конвертации рукописей в форматы EPUB и MOBI. Сайт предлагает пользователям со всего мира конвертацию своих рукописей в электронный формат и оказывает помощь в продаже электронных книг, но для русскоязычной аудитории будет доступна только бесплатная конвертация рукописей.

Вы можете сами оценить простоту и удобство сервиса Booqla, зарегистрировавшись на

Формат электронной книги – это тип файла, который способно корректно распознать и воспроизвести устройство для чтения электронных книг — ридер или читалка. На сегодняшний день в интернет-магазинах и онлайн-библиотеках предлагается для чтения около 10 типов файлов. Непосвященные пользователи зачастую выбирают «наугад», что не всегда позволяет скачать на свой ридер книгу в оптимальном для чтения формате, а возможно, файл даже не откроется. С другой стороны, покупая ридер, далеко не всегда читатели знают, как выбрать читалку, исходя из типа поддерживаемых форматов электронных книг.

Для авторов владение информацией о том, какие форматы электронных книг наиболее популярны, также немаловажно. Ведь в настоящее время электронные устройства для чтения быстро вытесняют бумажные издания. Также при выпуске электронной версии своей бумажной книги надо быть уверенным, что электронную книгу примут все самые популярные интернет-магазины и большинство ридеров смогут без ошибок читать книгу в предложенном формате.

Таким образом, читателю важно знать, какую читалку покупать или книгу какого типа лучше скачать на свой ридер. А автору важно знать о том, в каком формате выпускать свою электронную книгу. Наша статья поможет определиться с выбором и автору, и еще не искушенному в данном вопросе читателю.

Какой формат выбрать автору для своей электронной книги

  1. Первое, что следует отметить, — есть только два формата электронных книг, для создания которых существуют профессиональные программы, а также разработаны строгие стандарты и независимые системы проверки их качества: PDF и EPUB.
  2. Формат PDF используется для получения услуги печати по требованию – когда заказавшему книгу печатается один экземпляр.
  3. Все остальные популярные форматы книг на практике создаются конвертированием из EPUB.
  4. Некоторые издательства и фрилансеры предлагают сделать любой формат очень дешево, простым сохранением из редактора Word, но при этом следует понимать, что этот формат большиство интернет-магазинов может отклонить и не на всех ридерах будет возможно комфортное чтение. На некоторых читалках — вообще может отображаться мешанина непонятных символов.

При выборе формата для своей электронной книги, автор может исходить из того, на какой площадке будет распространяться его произведение:

  • если Вы хотите попасть в Литрес и Озон – Вам нужны PDF, EPUB и FB2 версии;
  • для попадания в магазин iTunes для планшетов и телефонов Apple — iPhone и iPad – нужен тип EPUB, именно этот тип поддерживает программа для чтения iBooks на всех устройствах Apple;
  • для магазинов Barnes & Noble и Amazon.com актуален EPUB — из него Amazon.com автоматически создаст MOBI и AZW для ридеров Kindle;
  • для Google Play можно использовать PDF или EPUB.

Если Вы хотите создать для ридеров научное произведение, которое содержит формулы, таблицы, графики, то лучший формат — только PDF. Можно сделать еще и EPUB, но трудоёмкость такой работы достаточно велика. Кроме того, при увеличении размера страницы формулы и таблицы могут принимать вид, который затруднит их восприятие.

Основные форматы электронных книг

Современные библиофилы благодаря специальным устройствам для чтения электронных книг – ридерам или читалкам — имеют прекрасную возможность носить с собой тысячи произведений, которые можно читать в дороге, на отдыхе или в обеденный перерыв.

Предлагаем краткий обзор основных существующих форматов электронных книг.

FB2 (FictionBook)

Самый распространенный формат в России.
Преимущества:

  • Контент книги на ридерах структурирован (главы, содержание, обложка и т.д.).
  • Пользователь может сортировать файлы по автору, жанру, названию и другим тэгам, содержащимся в исходном файле.
  • Файл весит немного и может быть заархивирован.
  • Файл может быть легко конвертирован в другие форматы.
  • Русский текст имеет переносы слов.

Недостатки:

  • Не предназначен для книг с иллюстрациями: изображения, вставленные в текст, на многих читалках невозможно рассмотреть.
  • Данный формат создан российскими разработчиками и не предусматривает использование зарубежом, так как не поддерживается Apple, Google, Barnes & Noble и Amazon.

EPUB (Electronic PUBlication)

Пожалуй, самый часто используемый электронный тип файлов, поддерживаемый ридерами всех известных производителей: Barnes & Noble, Sony, Pocketbook, Kindle, Onyx, Wexler, приложение iBooks для устройств Apple, iPhone и iPad.
Структура верстки такого документа аналогична заархивированной HTML-странице с текстами, графикой, встроенными шрифтами и т.п.

MOBI

Изначально поддерживался только ридерами Kindle, достаточно популярными в России.

KF8 (Kindle Format 8)

Новый формат от Amazon – улучшенная версия MOBI.

PDF (Portable Document Format)

Особенности:

  • файлы достаточно тяжелые для недорогих ридеров;
  • в большинстве случаев страница соответствует А4, в то время обычные читалки размером А5;
  • есть возможность изменить исключительно масштаб (но не шрифт);
  • вероятнее всего станицу на ридере можно будет читать лишь фрагментами, если только это не версия формата страницы А6 или у Вас не читалка с 9-ти дюймовым экраном.

DJVU

Разработан в качестве хранилища сканов документов. Особенности функционала полностью аналогичны PDF.

LRF

LRF старый формат для читалок Sony очень плохо конвертируется в файлы других типов.

AZW

Применяется Amazon.com только для ридеров Kindle. Данный формат используется для защиты от копирования.

TXT

Преимущества:

  • дает возможность скопировать текст любого формата из другого источника;
  • поддерживается почти всеми ридерами;
  • файл очень мало весит.

Между тем, такой формат не предусматривает наличие элементов форматирования и выравнивания, что делает его не самым лучшим вариантом для полноценной виртуальной книги.

RTF (Rich Text Format)

Не самый удобный для читалки тип файла по причине громоздкости файла, а значит и низкой скорости работы с ним читалки.

DOC (DOCX)

Формат редактора Word. Немногие устройства-читалки обеспечивают удобное чтение полноценной электронной книги в таком формате.

Какой формат электронной книги выбрать автору и читателю

Традиционные «книжные форматы», поддерживаемые большинством читалок, это — EPUB и FB2. Читателю при покупке ридера важно обращать на это внимание. Разумеется, чем больше форматов сможет читать ридер, тем лучше. Обязательно покупайте читалку с подсветкой — можно будет комфортно читать в помещениях с недостаточным освещением.

Автору же при выпуске своего произведения также необходимо принимать во внимание именно эти форматы EPUB и FB2, кроме того, безусловно, необходим файл типа PDF — без него невозможно правильно напечатать книгу для любителей чтения на бумаге.


Электронные книги (ридеры, читалки) уже давно стали привычными устройствами для широкого круга пользователей. Их достоинства: доступность контента (скачать необходимую книгу из интернета можно за считанные минуты), не портящий зрение экран E-ink, возможность иметь в ридере коллекцию из тысяч книг, долгая работа на одной зарядке, настройки типа и размера шрифта. Не так давно появились электронные книги с подсветкой экрана - они позволяют читать в полной темноте. В общем, преимущества ридеров можно перечислять очень долго.

Однако при знакомстве с читалками у пользователей часто возникает одна проблема. Люди, которые решают приобрести ридер в первый раз, сталкиваясь с понятием "форматы электронных книг", часто не понимают о чем идет речь. Проблема особенно актуальна для начинающих, которым аббревиатуры "FB2", "EPUB" или "MOBI" совершенно ничего не говорят.

Так называемые форматы - это различные типы электронных текстовых файлов, которые поддерживаются (воспроизводятся) тем или иным . В электронных библиотеках интернета часто предлагается большой набор типов файлов: FB2, EPUB, MOBI, PDF, DOC, RTF, TXT и других. Выбор широк, и это ставит перед новичками определенные проблемы. Мы опишем основные форматы электронных книг, расскажем о том, чем отличаются друг от друга, какими читалками поддерживаются, и на каком формате лучше остановить свой выбор, если у вас мультиформатный ридер, читающий все форматы.

Разновидности форматов

1. FB2 (FictionBook) - формат электронных книг, который был создан группой российских разработчиков. Книги в этом типе файлов имеют структурированный вид (то есть содержат разбивку по главам, содержание, иллюстрации, обложку). Кроме того, этот стандарт хранит информацию о файле (так называемые тэги: автор, название, жанр), которая считывается ридером и позволяет пользователю удобно сортировать файлы на устройстве. Данный типа файлов занимает небольшой объем, может быть заархивирован, а еще он хорошо конвертируется в другие форматы. Из особенностей: в виду того, что формат изначально был разработан под кириллицу, тексты на русском языке в FB2 имеют переносы слов.

Формат был изначально рассчитан на российских пользователей, и он практически не используется за границей. Именно поэтому FB2 не поддерживается популярными мировыми производителями читалок - Amazon и Barnes & Noble. Зато это основной формат файлов для популярных в России читалок от Pocketbook, Onyx и Wexler. Кроме того, ридеры Sony теперь поддерживают FB2 - после выхода на российский рынок компания разработала официальную прошивку для ридера , которая позволяет читать книги в FB2.

2. EPUB (Electronic PUBlication) - самый популярный в мире электронный формат для читалок. С ним работают ридеры Barnes & Noble и Sony. По структуре верстки этот тип файла напоминает заархивированную веб-страницу, содержащую текст, графику, встроенные шрифты, иллюстрации.

Помимо западных брендов, формат EPUB поддерживается моделями производителей, ориентированных на российских рынок (Pocketbook, Onyx, Wexler) по причине стремительного роста популярности в нашей стране. Кроме того, данный стандарт электронных книг используют iPhone и . Фирменная эппловская программа для чтения iBooks поддерживает именно EPUB.

3. MOBI - формат электронных книг ридеров . Получает распространение в российских онлайн-библиотеках по мере того, как Kindle становится все более популярным в России. Другие ридеры имеют поддержку этого формата "для галочки". MOBI по своим свойствам схож с EPUB. Недавно Amazon представил еще один формат электронных текстов Kindle Format 8 или KF8 (его отличает более богатое форматирование) с уточнением, что новые и старые читалки Amazon не перестанут поддерживать MOBI.

4. TXT - формат простых текстовых документов. Преобразовать текст из другого формата в TXT можно простейшим действием "копировать-вставить". Несмотря на то, что данный тип файла поддерживает практически всеми читалками и занимает в памяти очень мало места, читать в нем книги на ридерах мы бы не рекомендовали. В TXT отсутствует форматирование, разметка, переносы, выравнивание. Он подходит для коротких текстовых заметок, но не для полноценных электронных книг.

5. PDF (Portable Document Format) - формат электронных документов, созданный компанией Adobe Systems. Неудобен для использования на ридерах по ряду причин. Во-первых, файлы этого форматах очень громоздкие, так как рассчитаны под мощности компьютера, и на читалках открываются достаточно медленно. Во-вторых, если файл специально не сверстан под экран 6-дюймового ридера, имеющий формат аналогичный бумажному листу размера A6, то читать на нем PDF формата A4 (а большинство PDF-файлов представлены именно в размере стандартного бумажного листа), будет очень трудно. В PDF можно увеличить только масштаб, но не размер шрифта, а значит, на экране получится разместить только какую-то часть страницы. Читать страницы придется по частям, а это очень неудобно.

Для чтения PDF приспособлены , размер экрана которых позволяет воспроизвести страницу в масштабе, достаточно крупном для комфортного чтения.

6. DJVU - формат, разработанный для хранения сканированных документов - книг, статей, рукописей. Книга в DJVU фактически представляет собой набор сканированных страниц. В плане комфортности чтения на 6-дюймовых читалках - все аналогично истории с PDF. Вы не увеличите размер шрифта, а только масштаб. При зумировании страница вылезет за пределы экрана, и надо будет постоянно перемещать область увеличенного текста для чтения - о комфортном чтении говорить не приходится. Для чтения DJVU выбирайте риедры с экраном 9 дюймов. Впрочем, даже на 9-дюймовых читалках возможности удобного чтения DJVU зависят от того, насколько качественно отсканирована книга, представленная в этом формате.

7. LRF - в прошлом фирменный формат ридеров Sony. На новых моделях (начиная с PRS-T1) уже не используется, так как уступил свое место EPUB. Очень плохо конвертируется в другие типы файлов. Несмотря на то, что кое-где в библиотеках еще представлен, использовать его рекомендуется исключительно владельцам старых моделей Sony.

8. RTF (Rich Text Format) - формат для хранения текстовых документов. Относится к категории "компьютерных", а не "книжных". На ридерах читать в RTF не слишком удобно - это большие по объему файлы, и скорость работы читалки на порядок снижается.

9. DOC (а также DOCX ) - текстовые документы Microsoft Office. Эти форматы поддерживают достаточно много ридеров, но именно для чтения документов, а не книг. Файлы большого объема в этом формате могут быть велики по размеру, и работать с ними на ридерах непросто. Многостраничные книги в DOC лучше конвертировать в FB2 или EPUB.

Основные форматы электронных книг мы перечислили. Совсем экзотические типы файлов, которые иногда встречаются в интернете, мы рассматривать не станем, а лучше определимся, в каких из вышеперечисленных форматов удобнее всего читать книги на электронных ридерах.

Какой формат электронных книг выбрать

Если у вас читалка с поддержкой всех форматов, то остановить свой выбор на определенном типе файла, можно исходя из ряда факторов. Допустим, Вы покупаете свою первую электронную книгу, и у вас нет предварительно собранной коллекции книг, например, в FB2. В этом случае выбирайте тот формат файла, который лучше всего воспроизводится вашим ридером. Традиционные "книжные" форматы EPUB или FB2 для ридера (да и для пользователя) более предпочтительны и удобны, чем "компьютерные" PDF, TXT, DOC, DOCX и RTF.

В случае с 9-дюймовыми читалками и необходимостью чтения DJVU и PDF при прочих равных советуем отдавать предпочтение последнему, так как PDF представляет собой более современный формат, а книги в DJVU часто бывают плохого качества.

С точки зрения удобства использования плюсы "книжных" форматов очевидны: EPUB, FB2 или MOBI визуально лучше выглядят в меню Вашего ридера (отображаются обложки книг), их удобнее сортировать (есть тэги: автор, название, жанр), они занимают в памяти гораздо меньше места и скорость работы читалки с такими форматами будет существенно выше.

Нужна ли поддержка всех форматов

На наш взгляд, совсем необязательно выбирать всеформатный ридер. Многие пользователи, имеющие читалки с поддержкой всех форматов, загружают книги одном-двух типах файлов. У всех читалок (в том числе у мультиформатных), так или иначе, есть основной формат, и размениваться на другие вы в итоге не станете. Для Pocketbook, Onyx и Wexler основные форматы - это FB2 или EPUB, для Barnes & Noble () и Sony - EPUB, для Kindle - MOBI.

В случае с читалками Amazon и Barnes & Noble, если нужная книга оказывается в формате, который эти ридеры не поддерживают, можно воспользоваться конвертером (например, Calibre). Это программа, устанавливаемая на компьютер и позволяющая переконвертировать тот же FB2 в MOBI или EPUB за считанные минуты.

Читать книги в родном для ридера формате лучше, чем использовать установленные на читалку дополнительные программы. Наш совет: потратьте несколько минут для того, чтобы преобразовать книгу, например, из RTF в EPUB с помощью конвертера Calibre . Это удобней, чем читать ее "в оригинале" с помощью дополнительно установленной программы (на Sony PRS-T1 или Kindle) или столкнуться с более медленной работой устройства (например, на ридерах Pocketbook).

Помните, что главное - удобство пользования электронной книгой, а не количество форматов, заявленных у нее в параметрах.

Приятного чтения!

В статье будет дан обзор двух книжных форматов, коснёмся плюсов и минусов, дадим ответ: что на сегодня лучше: epub или FB2.

Сравнивать в середине 2014 года FB2 и epub — всё равно, что сравнивать windows XP и “семёрку” в конце 2009. (для тех, кто не в теме: октябрь 2009 — первый выпуск Win 7). Короче, что я хочу этим сказать?

Epub — более современный и технологичный, наиболее “правильный” формат, который пользуется большей популярностью в Европе. К сожалению, в России он не так распространён. Ведь большинство электронных книг у нас именно в FB2.

Что такое epub и fb2?

Как упоминала выше, файлы с расширениями.epub и fb2 — являются файлами электронных книг. В их основе лежит язык разметки XML. Т.е. обычный “голый” текст книги заключен в теги (спец. команды, которые делают шрифт, например, жирным , или подчеркнутым или КРУПНЫМ и т.п.)

Открыть форматы можно такими программами, как CoolReader, FB2reader, под линукс подойдёт Calibre.

Первое, что хочу отметить, это большую функциональность Epub.

Заключается она в возможности редактировать конкретные главы (ведь файлы книги идут не единым архивом, как FB2, а отдельными)

2. Так же, если захотите выдрать понравившийся картинку — сделать это будет проще, чем в FB2, т.к. все изображения, опять таки, лежат отдельно.

3. О возможности вставки формул в epub и невозможности сделать это в FB2 — упоминаю вскользь, рядовому пользователю это не пригодится.

В чём ещё заключаются различия?

FB2 — читается в блокноте, епуб — нет.

Зато Epub занимает чуть меньше места на жестком диске. И ещё его можно разорхивировать, т.к. он, по сути, zip архив.


А что касается Вас? Что лучше по-вашему?