创建电子书:关于文档格式的提示

经过多年的边际接受,电子书终于开始日食其印刷和绑定的祖先。休闲和复杂的读者都长势更习惯于从一个设备读取 - 点燃,智能手机,iPad或笔记本电脑。他们还赶上对业务和技术受众 - 例如,HR部门可以通过数字分发员工手册,而IT人员可以随身携带自己喜爱的编程语言或800页引用操作系统,而无需脱臼肩膀。

这个过程最吸引人的特点之一是,你不必是一个专业的出版商,以生产一个有用的和格式良好的电子书。几乎任何人都可以将现有的手稿——技术手册、公司白皮书甚至个人传记——转换成电子书。

但是,你需要的不仅仅是你的文件更多。您还需要合适的软件和技术诀窍 - 因为生产电子书是一点点比它应该是更复杂。电子书格式的广度在那里,你的源文件转换成这些目标格式之一的怪癖,可以使转换过程绝不是简单的。

从格式源文档阅读成品 - 在下面的文章中,我已经从头到尾看电子书创建过程试图解开特定的结。我将讨论你需要启动和转换什么格式,详细一些你可能一路上遇到的,并提出了一些应用软件,可以帮助的问题。

电子书创作技巧

制作一本电子书可能是一个艰难的过程,通常没有预先设置从原始文档到最终产品的路径。为了确保给定的项目正确呈现,预先告诉您可能需要做什么或不需要做什么是很困难的。然而,在开始转换过程之前,有一些方法可以使事情进行得更顺利。

先从清洁的输入文档。应该没有程式化,格式化或元素呈现你不希望在最终产品中。如果事情不能在目标格式的支持,它可能会得到自动剥离出来,但有时它可能只是被翻译成你不想要的东西。你可能没有选择,只能用手工清理原来的,但它很可能是可能的脚本,这取决于你使用撰写原件什么的清理过程。

考虑在所有情况下使用HTML作为中间目标格式。由于大多数电子书格式都围绕着HTML的某个变体,因此将HTML标准化为首先从用于编辑文档的任何程序导出的格式可能是一个好主意。这就减少了电子书转换器本身必须完成的处理量。此外,如果您需要对文件执行任何手动编辑以使其正确处理,HTML是一种方便的格式:您可以通过纯文本编辑器直接访问源代码。

测试在多个设备上的结果。把你的手尽可能多的阅读设备尽可能 - 或者,做不到这一点,你取得联系谁拥有许多不同的阅读设备,并从他们那里得到反馈的人。桌面Kindle应用,例如,有怪癖,实际的设备没有(例如,它们如何处理非西方字符),所以它有助于知道什么时候这样的问题是相关的。

做好必要时重复的准备。几乎可以肯定的是,你必须在一本电子书中进行多次转换,以确保所有内容翻译正确。很有可能不会——至少第一次不会——你将不得不回去手工修改许多不同的东西。在某种程度上,这是使用HTML作为中间格式的另一个争论,因为可能需要进行的许多调整可以部分地自动化。记下每次休息的地方,这样你就不用重复你的错误了。

源格式

任何电子图书的创作开始于一个源文件:一份手稿,你已经写或者别人已经为你提供。就在那里,问题开始的,因为即使是“干净”的文件可能会造成转换困难。你的目标是确保文档的格式将被完好地保存下来。

大多数用作电子书源的文档都必须经过至少两次转换:首先转换为转换软件可以使用的格式,然后转换为实际的电子书格式——或称格式。有时,这可以缩减到一个阶段,但目前最好假设您需要两个步骤来完成这项工作。

这里是最有可能的格式,你会开始一个破败的:

HTML

我已经在上一节中提到这一点,但它再次强调:如果你正在寻找一个标准,HTML是多还是少了。首先,它是无处不在的;几乎所有的文本处理程序可以生成或读取HTML。它也支持许多功能,电子书将使用:超链接,字体控制,节标题,图片等。

棘手的是,如果您一开始就不使用HTML。如果你正在整理博客或维基上的帖子,并将它们汇编成一本电子书,你就不用再忍受那么多的苦差事了。但是,如果您从Microsoft Word (DOC或DOCX)或Open文档格式(OpenDocument或ODF)文档开始,最好的办法是将其直接从源应用程序导出到HTML中。(Word用户应该使用“Web Page, Filtered (HTML)”选项来选择“另存为…”,这样可以去掉Word生成的大部分废话。)

从源程序导出为HTML帮助保护最关键的格式和一般还保留篇章:轮廓头都变成H1 / H2 / H3标签,其中大部分转换程序正确识别。有些甚至能够自动生成的,从这些标签内容表。不过,我一直在使用Word生成的TOC之前,我的文档发送到电子书程序,因为Word中通常为您提供了格式选项范围更广了良好的效果。

微软的Word(DOC或DOCX)

如果你写的是原稿,很有可能是微软的Word格式。尽管Word可能是专有的,但地球上几乎所有的设备都可以读取或写入Word文档。而且这种格式对你能想到的几乎所有东西都有原生支持:公式、分页、脚注、索引——换句话说,任何可能出现在电子书中的东西。

也就是说,Word文档作为一个起点,中间转换格式,最有可能的HTML,而不是可以直接转换成电子书的格式看得最清楚。事实上,大多数的电子书转换程序本身不接受Word作为源文件类型。他们可能会接受Word的格式兄弟,RTF,但毕竟是已经转换的至少一个阶段从原来的路程,增加了机会,某些功能可能无法撑过转换过程。例如,RTF格式不支持的功能,如部分和脚注,但口径[会链接到检查下面]电子书创作套件,一,没有正确处理它们时,我测试了它的这篇文章。

ODF (ODF)

开放文档,或ODF,是由使用的格式OpenOffice.org。(Microsoft Word也支持ODF,尽管它不是Word的默认格式——它只是它读写的一种格式。)第三方OpenOffice提供扩展,可以让你直接导出到e-pub格式;还有许多独立的应用程序,例如ODFToEPub,这也将这样做。如果您在创建ODF文档的习惯是已经,您创造一个成品电子书路径可能会略有缩短,因为这一点。

PDF

Adobe的PDF格式几乎是不可能不遇到和使用始终不够作为电子书格式,这将是愚蠢那就更不用说了。许多程序(如Word和OpenOffice.org)直接导出为PDF,并将这些文件可以打开和在许多应用中阅读。事实上,之前的专用电子书阅读器制造显著大举进入市场,最电子书是他们打印同行的只是PDF蒸馏。

然而,这通常不是一个好主意,尝试使用PDF作为源格式。因为它的设计精确地再现打印页面,采取PDF文档的需求分开,如果它被用作非PDF电子书源格式放回一起。其结果是,PDF只应如果你没有选择用作其他电子书格式的来源。

目的地的格式

奇怪的是,你不会有你的电子书只是一个目标格式,但有几个。如果你的目标读者是使用各种设备 - 一个角落,点燃,一iPad——它有助于支持尽可能多的这些设备。例如,Kindle就因为不支持Epub格式文件而臭名昭著。

这些是最常见的电子书下载格式和它们的怪癖。

EPUB

使用XHTML作为其文档格式的基础上开放,非专有格式,EPUB的广泛支持,通过各种电子书制作应用程序的输出格式 - iTunes的,例如,只接受电子版作为源格式。事实上,它不能伤害渲染你的产品为电子版的副本,无论什么其他格式您也打算到输出。

EPUB有几个缺点。其格式方法假设文本将回流到适合目标设备,因此需要PDF风格页保真书不会在电子版很好地工作。此外,还有除了把它们插入图片方程不支持 - 特克斯或MATHML,用于表示数学两个常用的语言,不被支持。和EPUB没有一个标准的方式来诠释或共享注释,这可能是为人们出版电子课本另一个缺点。

为此,最好的“直”的文字,或者回流格式将不再是一个问题的文件。

MOBI和Kindle

或Mobipocket的 - - 的EPUB,MOBI的早期版本的变种是由该公司的同名发展成为一个格式,其电子书阅读器的软件,最初设计用于PDA和以后使用智能手机。亚马逊收购了该公司后,这让MOBI到了Kindle阅读器本身的电子书格式的基础。MOBI支持数字版权管理(DRM),但不加密MOBI文档可以在Kindle上没有问题读取。

PDF

PDF文件可以理解为,是在大多数电子书阅读器,其中包括了Kindle。图像,字体,等等 - 导出为PDF时,要保持绝对的忠诚于页面布局是最好的。

讽刺的是,这是非常功能,可以使PDF文件在某些​​情况下,这是我在之前暗示一个问题。其他电子书格式的设计工作独立于任何特定的设备分辨率,因此页面的每个设备自动回流。这是Kindle的没有利用页码起初的原因之一,因为特定图书的页码可能取决于使用什么设备或屏幕尺寸,你还在读它而改变。

PDF文件,在另一方面,重现尽可能接近原页面的格式,不管是什么目的设备的尺寸。甲PDF格式的一个8.5×11英寸页面可能是一个大型显示屏上相当的可读性,但看起来局促上的Kindle或Nook的。一些的PDF阅读器,如Adobe自己的Acrobat Reader软件应用程序,能够重新流通的PDF以适合任意屏幕尺寸 - 但这不是一个普遍可用的功能,你不应该在它存在计数。

如果你正在致力于使用PDF文件,你可能要考虑使用不同的页面大小导出您的文档使用电子阅读器与小屏幕的人礼貌。这可能需要一些研究,以找出页面大小呈现最好与流行的电子书阅读器。

元素包括

当你建立了一本书,内容是你已经包括在原始文档中可能需要一些额外的工作,以正确地转化为成品。此外,对于印刷出版物可在电子书更有用一些元素似乎并不重要。

内容表

未正确chaptered电子书是难以导航 - 双所以用其中一本书去到任意点设备并不容易,因为它应该是。Kindle的,例如,有没有触摸屏,所以在一本书中跳来跳去没有表的内容是件苦差事。

字体的变化

例如,在等宽字体的代码示例 - 如果你想从文本的其余部分分开设置的某些元素,这是最重要的。这与其说是一个格式化的问题,因为它是一个转换的问题,因为字体选择可有时会完全在转换过程中剥离出来,或者根本没有在一些目标设备的支持。

一定要在文档中尝试至少两种不同的字体类型——一种标准主体文本字体和一种等宽字体——以查看它们如何在不同的设备和不同的图书格式中呈现。有时字体声明完全不能工作:例如,对于Kindle,你需要在电子书中使用HTML

标签来可靠地以等宽字体显示文本。

插图

这对于一些书一个至关重要的问题。您需要确保任何插图正确转换取决于你使用的系统。导出到HTML作为一个中间步骤有助于在这里,因为在HTML图像引用在整个转换过程非常一致荣幸。

脚注

相关:
12 第1页
第1页共2页
IT薪资调查:结果在