Ở phần ngôn ngữ Vietnamese bạn thêm cả English vào nữa sẽ khắc phục được mấy lỗi tiếng Anh. Một số lỗi tiếng Việt trong "dữ liệu" cho Text Crawler đã có sẵn rồi nên sau khi OCR bằng ABBYY chạy Text Crawler cũng đỡ lắm. Mình không có ý bênh vực ABBYY. Do đặc thù hay đọc sách non-fiction có một vài trăm cụm từ in nghiêng mà vFlat hiện chưa nhận dạng được nên mình tiếp tục dùng ABBYY. Ngoài ra ABBYY còn có ưu điểm là OCR được cả quyển sách vài trăm trang 1 lần và tự động loại bỏ được số trang và Header/Footer của sách giấy. Nếu sách dạng tiểu thuyết thì vFlat phù hợp hơn. Về độ chính xác khi nhận dạng, ABBYY kém hơn vFlat nhưng kết hợp cả 3 thao tác: chạy Text Crawler, soát lỗi trong Sigil, soát lỗi bằng Google Docs thì độ chính xác tăng lên đáng kể (còn sót khoảng 100-300 lỗi chính tả trên tổng số 100.000 từ) mà không mất quá nhiều công sức. Kết luận: mỗi phần mềm/ứng dụng sẽ phù hợp với những mục đích khác nhau
Đọc TUT hay bị mất cảm hứng lắm. Thà lúc bắt đầu cứ làm theo hứng, vướng ở đâu tìm tut đọc giải quyết ở đó thì lại theo bền hơn nhích từng nhích một.
Cho mình hỏi, mình nên cắt gáy sách thế nào để scan cho đẹp, và mình nên dùng máy scan nào để tự động scan được những cuốn sách dày cỡ 600-700 trang trở lên. Mình tính phương án thuê máy để scan sách. Cảm ơn mọi người.
Mình không dùng có máy scan nên không rõ. 600-700 trang dùng điện thoại có vFlat mất khoảng 2 giờ là xong. Muốn đẹp hơn nữa thì xử lý tiếp bằng ABBYY hoặc Scan Tailor Experiment.
Vấn đề là xử lý ở số lượng lớn. Nếu có 400-500 ảnh thì Keep note có cho phép nhập đồng thời trong một lần được không? hay chỉ được phép nhập mỗi lần 1 ảnh?
Có ai biết cách làm từ sách theo kiểu scan hai mặt, 4 trang khum nạ hướng dẫn mình với. Đang có mấy quyển 10 Vạn câu hỏi vì sao cũ năm 1995-1996 theo nội dung của TQ, giải thích khá khoa học, mình rất thích muốn rã ra làm ebook để lưu được lâu dài. Nếu làm được sẽ share lên diễn đàn cho mọi người cùng xem
Này chắc sách phải là loại khâu từng tép, tháo từng tép ra thôi. Mà cũng hơi lằng nhằng vì các trang sẽ không theo thứ tự, sau khi được file ảnh sẽ mất nhiều công sắp xếp lại. Ví dụ: tép đầu tiên có 20 trang (5 tờ gập đôi) thì tờ đầu tiên khi quét mặt trên sẽ là trang 2 và trang 19, mặt dưới là trang 1 và trang 20. Tờ thứ 2 mặt trên sẽ là trang 4 và 17, mặt dưới là trang 3 và 18... --> quét 2 mặt 4 trang có lẽ không khả thi vì sẽ mất nhiều công sức để sắp xếp lại ảnh chụp theo số trang tăng dần 1, 2, 3, 4, 5... Chắc chỉ còn cách cắt gáy quét 2 trang 1 thôi. Hoặc nếu làm túc tắc thì mua "đồ nghề" về chụp, vẫn giữ được sách, mỗi giờ được khoảng 300-500 trang. Tham khảo ở đây: Vui lòng đăng nhập hoặc đăng ký để xem link hoặc Vui lòng đăng nhập hoặc đăng ký để xem link
Mình cần tìm bạn nào ở Sài Gòn để chuyển giúp mình vài quyển sách giấy sang ebook ạ! Đa số sách mình chuyển là sách về tâm lý hành vi, tổ chức, marketing. Hic nếu bạn nào nhận được hay biết ai nhận làm thì nhắn giúp mình nhé. Mình cảm ơn nhiều!