• Thứ Hai, 09/05/2011 06:30 (GMT+7)

    Tạo e-book: Những thủ thuật định dạng

    Huy Thắng
    Ai cũng có thể tạo một cuốn sách điện tử (e-book) từ những tài liệu sẵn có, nhưng để e-book có định dạng tốt và đọc được trên nhiều loại thiết bị, cách làm sẽ có phần phức tạp hơn.

    Sau nhiều năm chịu phận "chầu rìa", sách điện tử (e-book) cuối cùng cũng đã bắt đầu bước vào thời kỳ “đe dọa” sách in đóng bìa. Người đọc bình thường, cũng như người chuyên đọc sách đang ngày càng quen đọc trên các thiết bị như Kindle, các loại smartphone, iPad hay MTXT. Các thiết bị này ngày càng được ưa chuộng trong giới kinh doanh và kỹ thuật. Thí dụ, bộ phận nhân sự có thể phát cho nhân viên những cẩm nang kỹ thuật số, và các nhân viên CNTT có thể "đút túi" các tài liệu tham khảo tương đương 800 trang giấy về các ngôn ngữ lập trình hay các hệ điều hành được ưa chuộng mà không phải mang vác nặng nề như sách in.

    Một trong những đặc điểm hấp dẫn nhất của quá trình này là bạn không cần phải là một nhà xuất bản chuyên nghiệp để làm ra một e-book có định dạng tốt và hữu ích. Hầu như ai cũng có thể lấy một bản thảo có sẵn, như cẩm nang kỹ thuật, sách trắng (white paper) của công ty, hay ngay cả tiểu sử cá nhân, để chuyển đổi nó thành e-book.

    Nhưng bạn cần nhiều thứ hơn là chỉ một bản tài liệu. Bạn sẽ cần phần mềm thích hợp và cách thực hiện, vì để tạo ra một e-book hơi phức tạp hơn bạn tưởng. Có rất nhiều định dạng e-book, các cách chuyển đổi tài liệu nguồn sang một trong những định dạng đích, chúng có thể làm quy trình chuyển đổi không dễ thực hiện.

    Trong bài này, tác giả cố gắng làm sáng tỏ vấn đề bằng cách xem xét quy trình tạo e-book từ đầu đến cuối, từ lúc định dạng tài liệu nguồn cho đến lúc ra thành phẩm. Bài viết sẽ bàn về định dạng nguồn và đích, các vấn đề bạn có thể sẽ gặp phải và giới thiệu vài phần mềm hữu dụng.

    Các thủ thuật tạo e-book

    Tạo e-book có thể là một quy trình khó khăn, thường không có một lối định sẵn từ tài liệu gốc đến thành phẩm. Khó nói trước bạn có thể cần phải làm gì hay không cần làm gì, để đảm bảo một quá trình nào đó có kết quả chính xác. Tuy nhiên, trước khi bắt đầu quy trình chuyển đổi, có nhiều cách để làm mọi việc suôn sẻ.

    Hãy bắt đầu với một tài liệu đầu vào rõ ràng nhất có thể. Không nên có phần cách điệu hóa, định dạng nào hay các yếu tố nào mà bạn không muốn xuất hiện trong thành phẩm. Nếu có yếu tố nào mà định dạng đích không hỗ trợ, chúng có thể được tự động loại bỏ, nhưng đôi khi các yếu tố này cũng có thể được chuyển đổi thành thứ mà bạn không muốn có. Không có chọn lựa nào khác, bạn chỉ cần tự mình “làm sạch” bản gốc, nhưng bạn cũng có thể phải soạn thảo quy trình làm sạch tài liệu tùy theo định dạng bạn dùng để tạo tài liệu gốc.

    Hãy cân nhắc xem bạn có thể dùng HTML làm định dạng mục tiêu trung gian trong mọi trường hợp. Vì đa số định dạng e-book đều xoay quanh một dạng HTML nào đó, tốt hơn là bạn nên lấy HTML làm định dạng chuẩn để trước hết xuất tài liệu từ chương trình mà bạn đã dùng để biên tập tài liệu. Việc này giúp giảm thiểu khối lượng xử lý mà chính chương trình chuyển đổi phải thực hiện. Hơn nữa, nếu bạn cần phải tự tay biên tập để tập tin này được xử lý đúng cách, HTML là một định dạng thuận tiện cho bạn làm việc này. Bạn không có phương tiện nào khác ngoài trình soạn thảo văn bản gốc (plain-text editor), để tiếp cận trực tiếp mã nguồn.

    Hãy thử kết quả trên nhiều thiết bị. Bạn nên có càng nhiều thiết bị đọc càng tốt, nếu không, bạn hãy liên lạc với những người có các thiết bị đọc khác nhau và xin ý kiến phản hồi của họ. Thí dụ, ứng dụng Kindle cho máy tính để bàn có những tính năng mà chính thiết bị chuyên dụng không có (thí dụ, tính năng xử lý ký tự non-Western), nên ứng dụng này giúp bạn biết khi nào xảy ra các vấn đề như thế.

    Chuẩn bị chuyển đổi lại nếu cần. Bạn phải kiểm tra nhiều lần một e-book để đảm bảo mọi thứ đều được chuyển đổi đúng cách. Có khả năng là tài liệu không được chuyển đổi đúng cách và bạn sẽ phải bắt đầu lại và phải tự mình chỉnh sửa nhiều thứ. Dưới một khía cạnh nào đó, đây là một lý do khác để bạn dùng HTML làm định dạng trung gian, vì nhiều chỉnh sửa có thể phần nào được tự động hóa. Hãy ghi chú yếu tố nào bị lỗi để sau này bạn không vấp lại.

    Định dạng nguồn

    Việc tạo e-book nào cũng bắt đầu với một tài liệu nguồn: đó là một bản thảo bạn đã soạn hay do người khác cung cấp cho bạn. Ngay lúc này đã có vấn đề rồi, vì ngay cả một tài liệu “sạch” cũng có thể gây ra khó khăn trong việc chuyển đổi. Mục tiêu của bạn là phải đảm bảo việc định dạng tài liệu phải còn nguyên vẹn.

    Có thể hầu hết các tài liệu được sử dụng làm nguồn để tạo e-book sẽ phải được chuyển đổi 2 lần: lần đầu là chuyển sang một định dạng mà phần mềm chuyển đổi có thể sử dụng, và lần 2 là chuyển sang định dạng e-book thật sự. Đôi khi bạn có thể giảm thành một bước, nhưng tốt hơn hết nên xem như bạn phải cần 2 bước để thực hiện hoàn toàn việc chuyển đổi.

    Sau đây là danh sách các định dạng bạn có thể dùng:

    HTML (HyperText Markup Language)

    Định dạng này đã được nói đến ở phần trên, nhưng cũng cần lặp lại. Nếu bạn cần một định dạng chuẩn thì HTML là định dạng bạn cần. Lý do là định dạng này rất phổ biến; hầu hết chương trình xử lý văn bản nào cũng có thể tạo hay đọc được HTML. Nó cũng hỗ trợ nhiều tính năng mà e-book sẽ sử dụng, như tính năng siêu liên kết (hyperlink), kiểm soát phông chữ, tiêu đề, hình ảnh...

    Sẽ khó khăn nếu bạn không sử dụng HTML lúc bắt đầu. Nếu bạn đang đối chiếu các bài viết từ một trang blog hay trang wiki và kết hợp chúng lại thành một e-book, bạn sẽ không bị vất vả nhiều. Nhưng nếu bạn bắt đầu với một tài liệu có định dạng DOC hay DOCX của Microsoft Word hay ODF (OpenDocument Format), tốt hơn hết bạn nên xuất tài liệu này trực tiếp từ ứng dụng nguồn sang HTML (Người dùng Word nên lưu tài liệu theo tùy chọn “Web Page, Filtered HTML”, theo đó, hầu hết các yếu tố không cần thiết do Word tạo ra được loại bỏ).

    Xuất chuyển tài liệu sang định dạng HTML từ chương trình nguồn giúp giữ lại các định dạng cốt yếu nhất và thường giữ lại được chương, đoạn của tài liệu: các tiêu đề của dàn bài được chuyển đổi thành các thẻ (tag) H1 / H2 / H3 mà hầu hết các chương trình chuyển đổi có thể nhận dạng chính xác. Có vài chương trình cũng có thể tự tạo được bảng mục lục từ các thẻ này. Tuy nhiên, sử dụng Word để tạo bảng mục lục TOC (Table Of Contents) trước khi dùng chương trình chuyển đổi tài liệu thành e-book cũng có kết quả tốt, vì Word thường có nhiều tùy chọn định dạng hơn.

    DOC hay DOCX của Microsoft Word

    Bản thảo gốc thường có định dạng của Microsoft Word. Word là định dạng độc quyền sở hữu, nhưng hầu hết các thiết bị đều có thể đọc hay soạn thảo tài liệu Word. Và định dạng này được thiết bị hỗ trợ cho hầu hết mọi thứ như công thức, phân chương, chú thích cuối trang, hay chỉ mục cuối sách; nói cách khác, bất kỳ yếu tố nào có trong một e-book.

    Tuy nhiên, tài liệu Word nên được xem là khởi điểm dùng làm định dạng chuyển đổi trung gian, giống như HTML, hơn là một định dạng dùng để trực tiếp chuyển đổi thành e-book. Thật vậy, hầu hết các chương trình chuyển đổi e-book không chấp nhận Word làm kiểu tài liệu nguồn. Các chương trình này có thể chấp nhận định dạng “anh em” của Word là RTF, nhưng đó đã là ít nhất một bước chuyển đổi từ tài liệu gốc và càng có khả năng là một vài tính năng sẽ có thể không được chấp nhận qua quy trình chuyển đổi. Thí dụ, RTF có hỗ trợ các tính năng như phân đoạn và chú thích cuối trang, nhưng chương trình tạo e-book Calibre có lúc không xử lý chính xác các tính năng này khi thử nghiệm.

    OpenDocument (ODF)

    OpenDocument (ODF) là định dạng được OpenOffice.org sử dụng (Microsoft Word cũng hỗ trợ ODF, dù đó không phải là định dạng mặc định cho Word, đó chỉ là một trong các định dạng mà Word đọc và soạn thảo được). OpenOffice thuộc công ty thứ ba cung cấp các định dạng, cho phép bạn xuất chuyển trực tiếp sang các định dạng Epub; cũng có một số các ứng dụng sử dụng độc lập, như ODFToEPub, có thể chuyển đổi trực tiếp. Nếu bạn đã có thói quen tạo tài liệu của bạn ở định dạng ODF, bạn có thể tạo một e-book hoàn chỉnh nhanh hơn một chút.

    PDF (Portable Document Format)

    Không thể không nhắc đến định dạng PDF của Adobe. Trước giờ, nó vẫn được sử dụng làm một định dạng e-book. Nhiều chương trình (như Word và OpenOffice.org) xuất chuyển trực tiếp sang PDF, có thể mở và đọc được trong nhiều ứng dụng. Trong thực tế, trước khi các thiết bị đọc sách điện tử chuyên dùng xâm nhập thị trường, phần lớn e-book là file PDF được thực hiện từ các bản sách in tương ứng.

    Tuy nhiên, không nên cố dùng PDF làm định dạng nguồn. Vì được thiết kế để sao chép chính xác lại các trang in, một tài liệu dạng PDF cần được "dỡ" ra rồi kết hợp lại nếu nó được dùng làm định dạng nguồn cho một e-book có định dạng khác PDF. Chỉ nên dùng PDF làm định dạng nguồn cho các định dạng e-book khác nếu bạn không còn lựa chọn nào khác.

    Định dạng đích

    Có thể bạn sẽ không dùng một định dạng đích cho e-book của mình mà là nhiều định dạng. Nếu bạn muốn nhắm vào đối tượng người đọc sử dụng nhiều loại thiết bị khác nhau như Nook, Kindle hay iPad, cần hỗ trợ càng nhiều thiết bị càng tốt. Thí dụ, thiết bị Kindle không hỗ trợ các tập tin có định dạng Epub.

    Sau đây là các định dạng đích e-book thường dùng nhất và đặc điểm của chúng.

    Epub

    Là một định dạng mở, không độc quyền sở hữu, dùng XHTML làm cơ sở cho định dạng tài liệu, Epub được hỗ trợ rộng rãi dùng làm định dạng đầu ra của các ứng dụng tạo e-book. Thí dụ như iTunes chỉ chấp nhận ePub làm định dạng nguồn. Thật vậy, rất thuận lợi khi tạo được một bản sao sản phẩm của bạn theo định dạng Epub bất kể bạn đang tính chuyển đổi sang các định dạng nào khác.

    Epub có vài điểm bất lợi. Phương pháp định dạng của nó giả định văn bản sẽ được sắp xếp lại (reflowed) cho vừa với thiết bị, nên các sách đòi hỏi phải trung thực với trang theo kiểu PDF sẽ không hợp với định dạng Epub. Ngoài ra, nó cũng không hỗ trợ cho các phương trình trừ phi chèn các phương trình này dưới dạng hình ảnh. TeX hay MathML, 2 ngôn ngữ thường được dùng để trình bày tài liệu toán học, đều không được hỗ trợ. Epub không có phương pháp chuẩn để thể hiện hay chia sẻ các chú giải, đây cũng có thể là một điểm hạn chế khác cho người xuất bản giáo trình điện tử.

    Vì lý do trên, định dạng này dùng tốt nhất cho văn bản “chay”, hay tài liệu mà kiểu định dạng sắp xếp lại không làm ảnh hưởng gì.

    MOBI và Kindle

    Một dạng khác của phiên bản ban đầu của Epub là MOBI (hay Mobipocket), được công ty cùng tên phát triển làm định dạng để sử dụng với phần mềm đọc e-book của họ, ban đầu được thiết kế cho các thiết bị trợ giúp kỹ thuật số cá nhân PDA (personal digital assistant) và sau này dùng cho smartphone. Sau khi Amazon mua lại công ty này, họ đã dùng MOBI làm cơ sở cho định dạng e-book riêng của thiết bị đọc sách Kindle. MOBI hỗ trợ quản lý bản quyền kỹ thuật số DRM (Digital Rights Management), nhưng các tài liệu MOBI không được mã hóa vẫn có thể đọc được trên Kindle mà không gặp vấn đề nào.

    PDF

    Định dạng PDF có thể đọc được trên hầu hết các thiết bị e-reader, gồm cả Kindle. Xuất chuyển sang định dạng PDF là cách tốt nhất khi bạn muốn giữ lại y hệt cách trình bày của trang, gồm cả hình ảnh, kiểu chữ...

    Tuy nhiên, chính đặc điểm trên lại gây khó khăn cho PDF trong vài trường hợp như đã trình bày ở trên. Các định dạng e-book khác được thiết kế để dùng độc lập, không phụ thuộc vào độ phân giải của thiết bị, và các trang được sắp xếp lại khi hiển thị trên mỗi thiết bị khác nhau. Đây là một trong những lý do mà thiết bị Kindle lúc đầu không đánh số trang sách, vì cách đánh số trang cho một cuốn sách nào đó có thể thay đổi tùy theo loại thiết bị hay cỡ màn hình mà bạn sử dụng để đọc sách.

    Ngược lại, PDF sao chép lại càng giống càng tốt cách định dạng của trang gốc, bất kể thiết bị đích có kích thước nào. Một văn bản PDF có kích thước trang 8,5x11” có thể đọc được trên màn hiển thị lớn, nhưng lại khó đọc trên thiết bị Kindle hay Nook. Một vài trình đọc PDF, như ứng dụng Acrobat Reader của chính Adobe, có thể sắp xếp lại trang một văn bản PDF cho vừa với cỡ màn hình bất kỳ nào đó - nhưng đây không phải là một tính năng lúc nào cũng có thể dùng được, và bạn không nên dựa vào tính năng này.

    Nếu buộc phải dùng PDF, bạn nên xem nên xuất chuyển tài liệu của bạn theo cỡ trang khác để phù hợp người sử dụng e-reader có màn hình nhỏ. Việc này đòi hỏi bạn phải tìm hiểu xem cỡ trang nào là thích hợp nhất với các e-reader thông dụng.

    (Xem tiếp trang 2)

    Xem tiếp : 12>
    Nguồn: Computerworld, 27/4/2011