Bộ sách hơn 1.000 trang, chia thành 2 tập. Tập 1 viết về quá trình người Pháp đánh chiếm đất Nam Kỳ và công cuộc kháng Pháp kiên cường suốt gần 100 năm của dân tộc ta; về những thay đổi trong cách thức người Pháp tổ chức bộ máy hành chính các cấp ở Nam Kỳ, từ cấp quản hạt, địa hạt, thành phố đến cấp quận, tổng, làng. Tập 2 trình bày công cuộc cai trị và khai thác thuộc địa Nam Kỳ trên các lĩnh vực kinh tế, văn hóa, xã hội, y tế, thể thao... Đây là bộ sách đầu tiên trình bày một cách đầy đủ, hệ thống về cách thức tổ chức cũng như những thay đổi trong bộ máy chính quyền ở tất cả các cấp, chính sách cai trị trên hầu hết các lĩnh vực ở Nam Kỳ, xuyên suốt hơn 100 năm từ khi người Pháp bắt đầu đánh chiếm thành Gia Định (1859) đến khi ách thống trị của họ hoàn toàn sụp đổ (1954). Để hoàn thành công trình này, tác giả dựa trên rất nhiều tài liệu gốc bằng tiếng Pháp và tiếng Việt tại Vui lòng đăng nhập hoặc đăng ký để xem link II, trong đó phải kể đến trọn bộ Công báo của chính quyền Nam Kỳ thuộc Pháp (Bulletin Officiel de la Cochinchine Francaise và Bulletin Administratif de la Cochinchine Francaise). Càng đáng quý hơn khi hiện giờ bộ Công báo này đã bị mủn nát, không còn khai thác được nữa.(theo nld.com) Vui lòng đăng nhập hoặc đăng ký để xem link Vui lòng đăng nhập hoặc đăng ký để xem link
Hổm mình nén xong 2 cuốn này rồi mà tự nhiên hứng lên thanh trừng hết sau khi có epub ┐(‘~`;)┌
Mình tò mò không biết các bạn lấy sách từ nguồn nào nhỉ. Mình cực kỳ thích sách ebook bản pdf được dàn trang như sách giấy ví dụ như cuốn này. Chỉ tiếc là nó dạng ảnh. Nếu nó có lớp chữ gốc luôn thì là hoàn hảo, dễ đọc và ghi chú. Bản này đâu phải bản scan bình thường đúng không vì theo quan sát trên bản in này thì mình nghĩ nó được in lại từ 1 bản PDF đẹp? Mình có thể tự chạy OCR lại với ABBYY nhưng mình chưa rành dùng ABBYY lắm. Có lẽ mình đang bị được voi đòi tiên quá chăng.
Trời ơi đẹp quá! Bác cho xin cuốn 2 luôn được không? Bản PDF chuẩn có lớp OCR gốc luôn chứ! Mình inbox bác hỏi thêm được không?
Gửi bạn Vui lòng đăng nhập hoặc đăng ký để xem link. Mấy file này mình không OCR mà đó là lớp text gốc. Vì là lớp text gốc, nên khi bạn copy thì sẽ có một số trường hợp bị lỗi, như là ligature Th...
Đúng là svg rồi bạn. Kể cả swf trước đây cũng ra file pdf đẹp mà, chỉ là text trở thành vector, không copy được.
Mình dùng ffdec thì swf vẫn ra true text, nhưng có trang bị ẩn toàn bộ lớp text đó, chỉ có thể copy dán qua chỗ khác được thôi chứ PDF trắng tinh. Đang đau đầu với những cuốn swf cũ. Svg mới thì mình lại chưa dùng được script in hàng loạt svg thành pdf.
Nếu chỉ để in svg hàng loạt thì mình tạo file .bat: Mã: for %%f in (*.svg) do ( start /wait chrome --headless --disable-gpu --print-to-pdf-no-header --print-to-pdf="D:/test/%%f.pdf" "D:/test/%%f" ) Mình thử nhiều printer rồi, in từ Chrome cho kết quả tốt nhất.
Mình thử bỏ 2 cuốn bạn imcholanh gửi vào chạy OCR trong bản Vui lòng đăng nhập hoặc đăng ký để xem link thì khá hài lòng với kết quả mặc dù có nhiều vấn đề khác. ABBYY nhận diện được đúng các chữ "Th" nên không bị lỗi ligature như trong bản PDF gốc. Đổi lại thì có những lỗi từ việc OCR. Mình cũng không biết cái nào đỡ hơn cái nào, rà lại lỗi từ lớp OCR của ABBYY hay mò thay từng lỗi ligature của file PDF gốc ha ha. Tốt nhất có lẽ là kiếm ứng dụng cho thay thế hàng loạt thì có thể xử lý được lỗi ligature trong file PDF gốc, nhưng mình kiếm không có ứng dụng nào làm được trò đó cả. Mình đã thử qua Adobe, PDF X-Change Editor, LibreOffice.
OCR lại phải rà chính tả, hay là bản lấy text từ file gốc ý. File gốc là svg, mở bằng notepad++ chỉ toàn text và text thôi. Mở bằng trình duyệt web hiện được nguyên trang sách và cũng copy text được.