1. Click vào đây để xem chi tiết

Thảo luận Tổng hợp hướng dẫn làm ebook cho Beginner

Thảo luận trong 'Bàn Trà' bắt đầu bởi gustavschlomo, 12/8/23.

Moderators: amylee
  1. machine

    machine Sinh viên năm I

    [Kiến thức chung về ebook định dạng epub]
    Viết lại ngại quá, các bạn xem đỡ file đính kèm bên dưới.
    Giải nén file rar để có file pdf.
    Sample.epub là một ví dụ tham khảo cấu tạo file epub.
    Sau khi đọc xong có gì thắc mắc các bạn comment ở đây tui sẽ giải đáp.

    Chỉ sau khi có comment của các bạn (về mấy nội dung cơ bản trong file pdf) mới chuyển sang nội dung tiếp theo (các công việc cần chuẩn bị và đóng gói ebook cho cuốn sách này "Về Giấc Mơ Và Diễn Giải Giấc Mơ").
     

    Các file đính kèm:

    Chỉnh sửa cuối: 13/8/23
  2. tran ngoc anh

    tran ngoc anh Cử nhân

    Bản này mình lót OCR nhanh (PDF searchable) bằng OCRmyPDF. Có thể dùng đối chiếu khi soát chính tả. Phần mềm này ít dính các lỗi chính tả đặc trưng của Abbyy do dùng engine khác với Abbyy, đó là Tesseract, anh này ban đầu do HP phát triển giờ đã thành mã nguồn mở rồi :D

    Nhân tiện @machine: phần mềm NAPS2 mà cụ hay dùng cũng dùng Tesseract để OCR tạo PDF searchable.
    [​IMG]
    [​IMG]
     

    Các file đính kèm:

    Chỉnh sửa cuối: 14/8/23
    machine, amylee and Anan Két like this.
  3. Trân ngoc kg

    Trân ngoc kg Mầm non

    Mình thấy bài này quá nhiều lỗi chính tả rồi bạn ạh mình nghĩ bạn nên tìm cách khác thôi chứ soát như này quá là lâu luôn áh. Mình cũng muốn giúp bạn nhưng ca này mình bó tay luôn. Sorry bạn nha.
     
  4. Trân ngoc kg

    Trân ngoc kg Mầm non

    Mình cũng mới tập tành tham gia thôi mình nghĩ nên tìm cách nào hiệu quả bạn àh.
     
  5. gustavschlomo

    gustavschlomo Lớp 4

    Tức là về cơ bản là quá trình từ text (file docx) chuyển sang epub là chỉ cần covert sang bằng Calibre à bác?
     
  6. tran ngoc anh

    tran ngoc anh Cử nhân

    OCR bằng Abbyy cần xử lý text thêm nữa soát mới nhẹ được.
    Vẫn được, nhưng convert sẽ tạo ra rất nhiều rác bên trong epub :D
     
    Chỉnh sửa cuối: 14/8/23
    machine thích bài này.
  7. gustavschlomo

    gustavschlomo Lớp 4

    Trước e thử vọc từ text sang epub thấy định dạng lại file text quá trời à rồi mới thêm vào code được...
     
    tran ngoc anh thích bài này.
  8. machine

    machine Sinh viên năm I

    Mình đã nói rõ rồi mà bạn: ocr bằng vFlat sẽ tốt hơn nhiều (nhưng mất thêm công sức định dạng in nghiêng, in đậm)
    Vui lòng đăng nhập hoặc đăng ký để xem link
     
  9. machine

    machine Sinh viên năm I

    Gì ghê vậy, mất công định dạng in nghiêng, in đậm (nếu ocr bằng vFlat) và "đánh dấu" heading với đánh dấu chú thích sau đó dùng 5-7 lệnh thay thế hàng loạt trong Word là thành code rồi.
     
  10. gustavschlomo

    gustavschlomo Lớp 4

    Ý em là vậy mà, chỉ đang thắc mắc covert từ docx sang thẳng epub có nhanh hơn không thôi.
     
  11. machine

    machine Sinh viên năm I

    Có 2 cách tạo ebook từ file Word:
    C1: convert file Word thành ebook
    (định dạng file Word đẹp chút, tạo Heading, endnote rồi dùng Calibre convert thành ebook (epub, azw3))
    C2: đóng gói ebook
    (phức tạp hơn nhưng không cần định dạng file Word đẹp, chỉ cần "đánh dấu" heading, chú thích, canh lề...)

    Không rõ bạn muốn làm ebook theo cách nào?
     
    sucsongmoi thích bài này.
  12. gustavschlomo

    gustavschlomo Lớp 4

    Em thì muốn làm cách 2 rồi bác. Ebook convert từ file Word dù đọc tốt nhưng k thể bằng
     
  13. machine

    machine Sinh viên năm I

    Nhanh hơn đó bạn, nhưng phải định dạng file Word đẹp chút.
    Cách convert "từ docx sang thẳng epub" nhanh hơn, dễ hơn nhưng có nhược điểm là sau này phát hiện thêm lỗi chính tả mà muốn cập nhật thì lại phải sửa file Word rồi convert lại, nếu muốn sửa trực tiếp trên ebook thì khi dùng Sigil/Calibre Editor mở ra nhìn rất chán, một đống code rác, sửa chính tả vẫn được.
    Đóng gói ebook bằng Sigil hoặc Calibre Editor thì mất công sức tìm hiểu một thời gian đầu nhưng sẽ "chuyên nghiệp" hơn, hiểu rõ các thứ.
     
    sucsongmoi thích bài này.
  14. machine

    machine Sinh viên năm I

    Chưa dùng bao giờ :( Để thử xem sao.
     
    tran ngoc anh thích bài này.
  15. gustavschlomo

    gustavschlomo Lớp 4

    Em mở dự án fail quá, có mod nào đổi giúp e title với xoá mấy bài em đăng về dự án được không? Đổi thread thành Hướng dẫn làm Ebook cũng được ạ. Mod nào hứng thú với cuốn này mở thread mới cũng được ạ.
     
  16. machine

    machine Sinh viên năm I

    Vậy các bạn cài mấy phần mềm/app mà tui đã liệt kê. Nếu không cài được thì báo lại.
    (lưu ý cài trên máy tính và điện thoại không liên quan đến bảo mật hoặc thông tin nhạy cảm vì Abbyy và vFlat ở 2 link đó đều không có bản quyền).
    Bạn nên ocr bằng vFlat sẽ ít lỗi chính tả, ocr bằng Abbyy nhiều lỗi chính tả lắm.

    Ngoài ra các bạn đọc file kiến thức chung về ebook, có gì không rõ thì comment ở đây.
     
    sucsongmoi thích bài này.
  17. machine

    machine Sinh viên năm I

    Cần gì đổi thread, cứ thảo luận ở đây sau này nhiều nội dung thì đề nghị tách thread sau.
     
    sucsongmoi thích bài này.
  18. tran ngoc anh

    tran ngoc anh Cử nhân

    Vậy thì liên hệ @vinaguy, có regex để dọn rác trong epub convert từ docx.
     
    sucsongmoi thích bài này.
  19. sucsongmoi

    sucsongmoi Lớp 8

    Cá nhân mình nghĩ bạn @gustavschlomo chọn c2 đi, ban đầu phức tạp tý nhưng sau này đỡ nhức đầu khi gặp các lỗi ... Các bước làm ebook thì bạn @machine đã hướng dẫn đó. Không khó đâu @gustavschlomo. :D
    TVE có rất nhiều bạn giỏi về ebook, nên có khó khăn gì bạn cứ còm ở đây mọi người sẽ hỗ trợ.
     
    machine thích bài này.
  20. ai biet gi dau

    ai biet gi dau Lớp 4

    :D bác nào tổng hợp các threads chuẩn chỉ về các bước làm ebook rồi cho vào một chỗ để newbie bọn em tham khảo được không? Từ OCR đến chia chương, tạo chú thích, soát lỗi chính tả,...
     
Moderators: amylee

Chia sẻ trang này