PC Giới thiệu ngôn ngữ đánh dấu markdown và calibre editor để làm epub

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi tran ngoc anh, 5/9/21.

  1. tran ngoc anh

    tran ngoc anh Cử nhân

    Tiếp tục triển khai vấn đề mã hóa định dạng trên docx để chuyển sang epub sạch nhất có thể, hôm nay mình giới thiệu đến các bạn một phương pháp khác nữa, markdowncalibre editor.

    - Mình đính kèm file mẫu docx có đánh dấu syntax theo mẫu markdown kết hợp với html, các đánh dấu này rất trực quan và có thể làm ngay trong quá trình soạn thảo văn bản chứ không chỉ dùng cho trường hợp có sẵn định dạng. Mình có giải thích đầy đủ công dụng của các syntax trong phần comment tương ứng trong file docx.

    [​IMG]

    - Sau khi đánh dấu trên .docx ta save as thành file .txt rồi đổi đuôi .txt thành .md hoặc đổi đuôi trực tiếp thành .md trong lúc chọn save ở mục plain text txt (mục đích cho phần mềm calibre editor nhận diện các cú pháp bên trong là markdown .md), sau đó mở .md bằng notepad++ và xử lý sơ bộ như sau:

    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    - Mở editor:

    [​IMG]

    - Nhập file .md vào editor:

    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    - Nhấn ok là xong, editor sẽ nhập .md vào và có ngay các tag html sạch đẹp đúng form đúng dạng mà chúng ta đánh dấu từ docx và xử lý sơ bộ ở file plain text .md:

    [​IMG]

    [​IMG]

    [​IMG]

    - Mọi thứ trông rất tươm tất đúng không ^ ^

    [​IMG]

    => ok vậy là chúng ta có: đánh dấu trên docx, chèn dòng trên .md và nhập vào editor thôi. Mình khuyến khích dùng cách này, các bạn có thể kiểm soát mọi thứ, cách này có thể thú vị và trông gọn ràng hơn pandoc, huống hồ có bạn sẽ ngại dùng cmd, cmd là một cái gì đó nghe thôi đã ngán :D

    Mình sẽ ủng hộ hơn nữa nếu các bạn chuyển hẳn sang soạn text bằng file plain text đuôi .md này, vì nó nhẹ nhàng, có thể edit bởi bất kỳ trình soạn text đơn giản nào, online offline đều ổn, sync nhiều máy để soát chính tả ở công ty hoặc ở nhà đều được, các kết quả làm việc đều đồng bộ vào nhau rất chặt chẽ. Bạn sẽ không cần một bộ office word nặng nề hay với googledoc cũng nặng nề không kém.

    Cú pháp mardown gọn gàng, dễ đọc, dễ chuyển đổi bằng calibre editor như trên. Chúc các bạn làm epub tốt nhé!
     

    Các file đính kèm:

  2. Mạc Vấn

    Mạc Vấn Lớp 4

    Mình thường dùng Vui lòng đăng nhập hoặc đăng ký để xem link để soát lỗi. Rất nhẹ nhàng, nhanh chóng. Như cách mà @tran ngoc anh đã bày cho:
    - Ocr pdf bằng FineReader, sau đó xuất thành file epub.
    - Dùng Calibre chuyển file epub này thành file md.

    Sau khi soát lỗi bằng Ghostwriter thì có nhiều lựa chọn. Nếu có cài pandoc thì sẽ xuất được luôn thành các định dạng được hỗ trợ. Thậm chí nếu dùng cấu trúc chú thích của md thì file epub xuất ra có thể dùng được luôn rồi. Hoặc cũng có thể copy mã html sạch từ Ghostwriter vào Calibre Editor để đóng gói như thông thường.
     
    Chỉnh sửa cuối: 16/10/21
  3. tran ngoc anh

    tran ngoc anh Cử nhân

    Còn tớ thì chưa dùng được Ghostwriter lần trước cậu giới thiệu thấy hay quá nên test thử nhưng chưa biết cách sử dụng.
     
  4. chanhvan1987

    chanhvan1987 Lớp 11

    Mình dùng Calbire có chuyển được về file md đâu nhỉ?
     
  5. tran ngoc anh

    tran ngoc anh Cử nhân

    Phải thiết đặt bên trong như vầy nè Chánh ơi:
    upload_2021-10-16_9-45-28.png
     
    Lan Giao and chanhvan1987 like this.
  6. vinaguy

    vinaguy Lớp 11

    Các bác cho em thêm chút ý "kiến be bé" (chứ không phải "cò bé bé" nhé) :)
    Em mắc phải rồi, nên nói kinh nghiệm thôi.
    Làm list thì không có gì khó lắm và cũng sẽ chuốt được đẹp. Nhưng có trường hợp này, các bác gặp chưa nè.
    Nếu list mà là 1 đoạn văn và đánh list bằng cái gạch đầu dòng, *... thì không thành vấn đề, nhưng nếu list đánh số 1,2,3... hoặc a,b,c... và là 2 đoạn văn trở lên (ở file word) thì y như rằng lúc chuyển sang epub là nó đánh số lung tung phèng ra. Nói bằng tí ví dụ cho nó máu:
    Ví dụ:
    1. Paragraph....
    2. Paragraph....
    3. Paragraph....
    Trường hợp này không thành vấn đề.
    Nhưng:
    1. Paragraph 1....
    Paragraph 2....
    Paragraph 3....
    2. Paragraph 1....
    Paragraph 2....
    3. Paragraph 1....
    Paragraph 2....
    Y như rằng rách việc cho mà coi. Nên theo em, tốt hơn hết là bỏ dạng list đi cho rồi (bỏ trong word luôn nhé), cứ đánh số bằng tay cho khỏe. Sửa lại list mệt như gì á (cái bộ sách Dạy Con Làm Giàu (13 tập), em mệt mỏi vì vấn đề này lắm rồi, phải đi dò từng trang để sửa lại list).
     
    tran ngoc anh thích bài này.
  7. iamtnl

    iamtnl Lớp 4

    Ủng hộ dùng md để làm ebook.
    Screen Shot 2021-10-16 at 10.09.40.png
     
  8. Mạc Vấn

    Mạc Vấn Lớp 4

    Dễ dùng mà, các chức năng vừa đủ, không thừa thãi. Cứ mở file md lên rồi soạn thảo thôi.
     
  9. Mạc Vấn

    Mạc Vấn Lớp 4

    Soạn thảo dùng Word dễ thừa, lẫn, sai khác,... các định dạng khác nhau. Khi chuyển sang epub nhảy nhót là bình thường. Dùng md sẽ hạn chế được tình trạng này.
     
  10. Nhẫn nại

    Nhẫn nại Lớp 2

    Bạn đang dùng font gì trên trình editor vậy?
     
    Chỉnh sửa cuối: 29/8/23
  11. pronak123

    pronak123 Mầm non

    @tran ngoc anh bạn cho mình hỏi. mình thử theo cách của bạn nhưng import vào calibre editor thì các dòng không giãn mà vẫn dính liền (khác với hiển thị trên notepad++). Vậy là bị lỗi gì (import file markdown mẫu vẫn bị dính dòng)?
     

    Các file đính kèm:

  12. tran ngoc anh

    tran ngoc anh Cử nhân

    Trước tiên bạn thử để một dòng trống giữa các đoạn text rồi import lại thử xem. Markdown đòi hỏi một dòng trống giữa các đoạn text.

    Để thêm một dòng trống cho toàn bộ văn bản trong file, search \n replace \n\n (chế độ regex trên notepad++).
     
  13. pronak123

    pronak123 Mầm non

    Vẫn không được bạn ạ. Mình đang dùng editor của Calibre 7.2
     
  14. tran ngoc anh

    tran ngoc anh Cử nhân

    Cho mình xin một phần file của bạn để test.
     
  15. pronak123

    pronak123 Mầm non

    Các file đính kèm:

  16. tran ngoc anh

    tran ngoc anh Cử nhân

    Hóa ra từ đầu mình không nhìn kỹ vấn đề của bạn. Có phải sau khi import vào calibre thì các thẻ <p> dính nhau như vầy,

    [​IMG]

    thay vì như vầy,

    [​IMG]

    không?
     
    pronak123 thích bài này.
  17. tran ngoc anh

    tran ngoc anh Cử nhân

    Bạn chú ý định dạng list khi soạn md, dấu + cách khoảng với [NAT3] như vầy,

    [​IMG]

    1. cách với [NAT10] như vầy,

    [​IMG]

    thì calibre mới hiểu là list nha, ngay từ đầu nếu không có khoảng cách phía sau dấu + hay 1. thì import không ra đúng định dạng.
     
    pronak123 thích bài này.
  18. pronak123

    pronak123 Mầm non

    Đúng bạn ơi. Import vào không tách dòng. Thử mãi mà không biết trục trặc ở đâu
     
  19. tran ngoc anh

    tran ngoc anh Cử nhân

    Vậy không phải lỗi đâu bạn ơi. Trong editor của calibre bạn tìm ở khung edit code nút có hình hoa tulip, bấm nó đi các dòng text sẽ đẹp lại ngay. Dùng lệnh tìm \n thay bằng \n\n cũng sẽ có các dòng tách nhau như thế.

    Đây chỉ là vấn đề thẩm mỹ thôi, ngược lại có người từng hỏi tìm cách để các dòng đang tách nhau được xích lại nữa ấy :D
     
    pronak123 thích bài này.
  20. pronak123

    pronak123 Mầm non

    hehe được rồi. Tự mày mò nên dễ bí lối quá :D cảm ơn bạn nhiều
     
    tran ngoc anh thích bài này.

Chia sẻ trang này