Hỏi đáp Nối dòng bằng regex

Thảo luận trong 'Hỏi đáp - Góp ý' bắt đầu bởi thohnb, 12/12/23.

  1. thohnb

    thohnb Lớp 2

    À chào các thím. Không biết có bác nào gặp trường hợp xuống dòng tuỳ tiện như trong hình không ạ.
    Tình hình là mình đang tìm cách fix lại đống text như trong hình.
    Nếu 1 2 file thì sửa bằng tay cũng được. Nhưng mình check thử thì có cần 200 files bị lỗi xuống dòng tuỳ tiện như vậy.
    Ý tưởng của mình là dùng regex để làm . Tức là dùng ^[a-z] để lấy chữ cái không được viết hoa ( đã lấy được chữ cái đầu tiên mỗi dòng rồi mà không biết làm sao để nối vào dòng ở trên) :D .
    Xin các cao nhân giúp đỡ ạ
    upload_2023-12-12_19-26-47.png
     
  2. vanthach

    vanthach Lớp 2

    Cụ chủ dùng phần mềm gì mà nhìn hay thế ?
     
  3. thohnb

    thohnb Lớp 2

    Dạ em dùng Visual Studio Code để em làm ạ.
     
  4. Son Huynh

    Son Huynh Mầm non

    Bạn thử check thêm phía trước có new line char (\n|\r) thì replace bằng space.
     
  5. huydatvns

    huydatvns Lớp 7

    Bạn chịu khó search lại trong diễn đàn sẽ thấy vấn đề này đã được mọi người giải thích rõ, có cả file json tổng hợp các regex được cô giáo ngọt Anh :D share luôn. Lâu rồi mình ko đụng vào làm epub nên giờ lục nghề, quên hết :D
    Vui lòng đăng nhập hoặc đăng ký để xem link - kéo xuống #24 sẽ thấy file
    Xử lý xuống dòng thì cứ bấm next next thôi (làm trong calibre) :D
    upload_2023-12-12_20-53-1.png
     
    tran ngoc anh and thohnb like this.
  6. thohnb

    thohnb Lớp 2

    Để em xem sao. Hix em đang dùng vscode để làm ebook ấy ạ :D
     
    huydatvns thích bài này.
  7. Muốn làm, việc đầu tiên là bạn cần nhận dạng đặc điểm của các vị trí cần sửa (có gì nổi bật, khác các vị trí khác ở điểm nào...); sau đó bạn dùng biểu thức chính quy mô tả lại đặc điểm nhận dạng đó; rồi bước cuối cùng là find and replace.

    Theo như ví dụ bạn chụp ở trên, thì bạn tạm thời tìm trước các vị trí xuống dòng mà phía trước đó không có dấu chấm (.), dấu hai chấm :-)), dấu chấm hỏi (?), dấu chấm than (!)... rồi thay thế trước đã.
     
    thohnb thích bài này.
  8. vanthach

    vanthach Lớp 2

    thú vị ghê. Nhưng làm thế nào mà có cái tab view bên cạnh hiện nội dung lên vậy.
     
  9. tran ngoc anh

    tran ngoc anh Cử nhân

    Đó là tính năng của mấy cái code editor ý anh ơi. Notepad++ cũng có.
     
  10. vanthach

    vanthach Lớp 2

    Vậy hả bạn. Mình không biết cái đó. Cái notepage ++ mình dùng nó chỉ như cái notepage thường không thấy cái view đấy.
     
  11. BCAv1.0

    BCAv1.0 Mầm non

    Mới xử lý hôm rồi mà quên cú pháp rồi, đại ý căn bản là dùng regex mô tả "ký tự xuống dòng và từ tiếp theo là chữ cái thường" và thay thế bằng dấu khoảng trắng
     
    baothoa thích bài này.
  12. tran ngoc anh

    tran ngoc anh Cử nhân

    Text trơn khó xử lý hơn html một chút. Song hiểu nguyên lý thì ổn hết.
     
: ebook

Chia sẻ trang này