[Kiến thức chung về ebook định dạng epub] Viết lại ngại quá, các bạn xem đỡ file đính kèm bên dưới. Giải nén file rar để có file pdf. Sample.epub là một ví dụ tham khảo cấu tạo file epub. Sau khi đọc xong có gì thắc mắc các bạn comment ở đây tui sẽ giải đáp. Chỉ sau khi có comment của các bạn (về mấy nội dung cơ bản trong file pdf) mới chuyển sang nội dung tiếp theo (các công việc cần chuẩn bị và đóng gói ebook cho cuốn sách này "Về Giấc Mơ Và Diễn Giải Giấc Mơ").
Bản này mình lót OCR nhanh (PDF searchable) bằng OCRmyPDF. Có thể dùng đối chiếu khi soát chính tả. Phần mềm này ít dính các lỗi chính tả đặc trưng của Abbyy do dùng engine khác với Abbyy, đó là Tesseract, anh này ban đầu do HP phát triển giờ đã thành mã nguồn mở rồi Nhân tiện @machine: phần mềm NAPS2 mà cụ hay dùng cũng dùng Tesseract để OCR tạo PDF searchable.
Mình thấy bài này quá nhiều lỗi chính tả rồi bạn ạh mình nghĩ bạn nên tìm cách khác thôi chứ soát như này quá là lâu luôn áh. Mình cũng muốn giúp bạn nhưng ca này mình bó tay luôn. Sorry bạn nha.
Tức là về cơ bản là quá trình từ text (file docx) chuyển sang epub là chỉ cần covert sang bằng Calibre à bác?
OCR bằng Abbyy cần xử lý text thêm nữa soát mới nhẹ được. Vẫn được, nhưng convert sẽ tạo ra rất nhiều rác bên trong epub
Trước e thử vọc từ text sang epub thấy định dạng lại file text quá trời à rồi mới thêm vào code được...
Mình đã nói rõ rồi mà bạn: ocr bằng vFlat sẽ tốt hơn nhiều (nhưng mất thêm công sức định dạng in nghiêng, in đậm) Vui lòng đăng nhập hoặc đăng ký để xem link
Gì ghê vậy, mất công định dạng in nghiêng, in đậm (nếu ocr bằng vFlat) và "đánh dấu" heading với đánh dấu chú thích sau đó dùng 5-7 lệnh thay thế hàng loạt trong Word là thành code rồi.
Có 2 cách tạo ebook từ file Word: C1: convert file Word thành ebook (định dạng file Word đẹp chút, tạo Heading, endnote rồi dùng Calibre convert thành ebook (epub, azw3)) C2: đóng gói ebook (phức tạp hơn nhưng không cần định dạng file Word đẹp, chỉ cần "đánh dấu" heading, chú thích, canh lề...) Không rõ bạn muốn làm ebook theo cách nào?
Nhanh hơn đó bạn, nhưng phải định dạng file Word đẹp chút. Cách convert "từ docx sang thẳng epub" nhanh hơn, dễ hơn nhưng có nhược điểm là sau này phát hiện thêm lỗi chính tả mà muốn cập nhật thì lại phải sửa file Word rồi convert lại, nếu muốn sửa trực tiếp trên ebook thì khi dùng Sigil/Calibre Editor mở ra nhìn rất chán, một đống code rác, sửa chính tả vẫn được. Đóng gói ebook bằng Sigil hoặc Calibre Editor thì mất công sức tìm hiểu một thời gian đầu nhưng sẽ "chuyên nghiệp" hơn, hiểu rõ các thứ.
Em mở dự án fail quá, có mod nào đổi giúp e title với xoá mấy bài em đăng về dự án được không? Đổi thread thành Hướng dẫn làm Ebook cũng được ạ. Mod nào hứng thú với cuốn này mở thread mới cũng được ạ.
Vậy các bạn cài mấy phần mềm/app mà tui đã liệt kê. Nếu không cài được thì báo lại. (lưu ý cài trên máy tính và điện thoại không liên quan đến bảo mật hoặc thông tin nhạy cảm vì Abbyy và vFlat ở 2 link đó đều không có bản quyền). Bạn nên ocr bằng vFlat sẽ ít lỗi chính tả, ocr bằng Abbyy nhiều lỗi chính tả lắm. Ngoài ra các bạn đọc file kiến thức chung về ebook, có gì không rõ thì comment ở đây.
Cá nhân mình nghĩ bạn @gustavschlomo chọn c2 đi, ban đầu phức tạp tý nhưng sau này đỡ nhức đầu khi gặp các lỗi ... Các bước làm ebook thì bạn @machine đã hướng dẫn đó. Không khó đâu @gustavschlomo. TVE có rất nhiều bạn giỏi về ebook, nên có khó khăn gì bạn cứ còm ở đây mọi người sẽ hỗ trợ.
bác nào tổng hợp các threads chuẩn chỉ về các bước làm ebook rồi cho vào một chỗ để newbie bọn em tham khảo được không? Từ OCR đến chia chương, tạo chú thích, soát lỗi chính tả,...