Hỏi đáp Nối dòng bằng regex

thohnb · 12/12/23

À chào các thím. Không biết có bác nào gặp trường hợp xuống dòng tuỳ tiện như trong hình không ạ.
Tình hình là mình đang tìm cách fix lại đống text như trong hình.
Nếu 1 2 file thì sửa bằng tay cũng được. Nhưng mình check thử thì có cần 200 files bị lỗi xuống dòng tuỳ tiện như vậy.
Ý tưởng của mình là dùng regex để làm . Tức là dùng ^[a-z] để lấy chữ cái không được viết hoa ( đã lấy được chữ cái đầu tiên mỗi dòng rồi mà không biết làm sao để nối vào dòng ở trên) .
Xin các cao nhân giúp đỡ ạ

vanthach · 12/12/23

thohnb nói: ↑

À chào các thím. Không biết có bác nào gặp trường hợp xuống dòng tuỳ tiện như trong hình không ạ.
Tình hình là mình đang tìm cách fix lại đống text như trong hình.
Nếu 1 2 file thì sửa bằng tay cũng được. Nhưng mình check thử thì có cần 200 files bị lỗi xuống dòng tuỳ tiện như vậy.
Ý tưởng của mình là dùng regex để làm . Tức là dùng ^[a-z] để lấy chữ cái không được viết hoa ( đã lấy được chữ cái đầu tiên mỗi dòng rồi mà không biết làm sao để nối vào dòng ở trên) .
Xin các cao nhân giúp đỡ ạ
View attachment 97462
Click to expand...

Cụ chủ dùng phần mềm gì mà nhìn hay thế ?

thohnb · 12/12/23

vanthach nói: ↑

Cụ chủ dùng phần mềm gì mà nhìn hay thế ?
Click to expand...

Dạ em dùng Visual Studio Code để em làm ạ.

Son Huynh · 12/12/23

Bạn thử check thêm phía trước có new line char (\n|\r) thì replace bằng space.

huydatvns · 12/12/23

Bạn chịu khó search lại trong diễn đàn sẽ thấy vấn đề này đã được mọi người giải thích rõ, có cả file json tổng hợp các regex được cô giáo ngọt Anh share luôn. Lâu rồi mình ko đụng vào làm epub nên giờ lục nghề, quên hết
Vui lòng đăng nhập hoặc đăng ký để xem link - kéo xuống #24 sẽ thấy file
Xử lý xuống dòng thì cứ bấm next next thôi (làm trong calibre)

thohnb · 12/12/23

huydatvns nói: ↑

Bạn chịu khó search lại trong diễn đàn sẽ thấy vấn đề này đã được mọi người giải thích rõ, có cả file json tổng hợp các regex được cô giáo ngọt Anh share luôn. Lâu rồi mình ko đụng vào làm epub nên giờ lục nghề, quên hết
Vui lòng đăng nhập hoặc đăng ký để xem link - kéo xuống #24 sẽ thấy file
Xử lý xuống dòng thì cứ bấm next next thôi (làm trong calibre)
View attachment 97463
Click to expand...

Để em xem sao. Hix em đang dùng vscode để làm ebook ấy ạ

NGUYEN Quoc Thang · 13/12/23

thohnb nói: ↑

Để em xem sao. Hix em đang dùng vscode để làm ebook ấy ạ
Click to expand...

Muốn làm, việc đầu tiên là bạn cần nhận dạng đặc điểm của các vị trí cần sửa (có gì nổi bật, khác các vị trí khác ở điểm nào...); sau đó bạn dùng biểu thức chính quy mô tả lại đặc điểm nhận dạng đó; rồi bước cuối cùng là find and replace.

Theo như ví dụ bạn chụp ở trên, thì bạn tạm thời tìm trước các vị trí xuống dòng mà phía trước đó không có dấu chấm (.), dấu hai chấm ), dấu chấm hỏi (?), dấu chấm than (!)... rồi thay thế trước đã.

vanthach · 13/12/23

thohnb nói: ↑

Dạ em dùng Visual Studio Code để em làm ạ.
Click to expand...

thú vị ghê. Nhưng làm thế nào mà có cái tab view bên cạnh hiện nội dung lên vậy.

tran ngoc anh · 13/12/23

vanthach nói: ↑

thú vị ghê. Nhưng làm thế nào mà có cái tab view bên cạnh hiện nội dung lên vậy.
Click to expand...

Đó là tính năng của mấy cái code editor ý anh ơi. Notepad++ cũng có.

vanthach · 13/12/23

tran ngoc anh nói: ↑

Đó là tính năng của mấy cái code editor ý anh ơi. Notepad++ cũng có.
Click to expand...

Vậy hả bạn. Mình không biết cái đó. Cái notepage ++ mình dùng nó chỉ như cái notepage thường không thấy cái view đấy.

BCAv1.0 · 13/12/23

Mới xử lý hôm rồi mà quên cú pháp rồi, đại ý căn bản là dùng regex mô tả "ký tự xuống dòng và từ tiếp theo là chữ cái thường" và thay thế bằng dấu khoảng trắng

tran ngoc anh · 13/12/23

Text trơn khó xử lý hơn html một chút. Song hiểu nguyên lý thì ổn hết.

Đăng nhập

Mời tham gia cuộc thi "CHIA SẺ KỶ NIỆM ĐÁNG NHỚ" nhân dịp TVE-4U 10 tuổi

Hướng dẫn chuyển đổi các định dạng eBook

Hướng dẫn xử lý lỗi không 'download - viết bài - xem link' được trên diễn đàn

Hỏi đáp Nối dòng bằng regex

thohnb Lớp 2

vanthach Lớp 2

thohnb Lớp 2

Son Huynh Mầm non

huydatvns Lớp 7

thohnb Lớp 2

NGUYEN Quoc Thang Lớp 2

vanthach Lớp 2

tran ngoc anh Cử nhân

vanthach Lớp 2

BCAv1.0 Mầm non

tran ngoc anh Cử nhân

Chia sẻ trang này