1. Click vào đây để xem chi tiết

Thảo luận Dùng chatGPT làm (dịch) sách nào!.

Thảo luận trong 'Bàn Trà' bắt đầu bởi starman, 13/10/23.

Moderators: amylee
  1. starman

    starman Lớp 1

    Chào các bạn.

    Bạn có bao giờ thấy thất vọng vì chất lượng dịch sách của các nhà xuất bản? - ngay cả một số nhà xuất bản có uy tín như Alphabooks cũng làm rất nhiều cuốn rất chán - gần đây mình có đọc cuốn Skin in the game - các nhà làm sách dịch sang thành Da thịt trong cuộc chơi - mình đọc được một nửa rồi sau đó tìm bản tiếng Anh để đọc tiếp. Ý mình là, chất lượng dịch các cuốn sách không được tốt.

    Cũng có nhiều cuốn muốn đọc tiếng Việt cho khỏe mà chưa có :)

    Gần đây mình thử dùng ChatGPT và dịch (thủ công) vài đoạn - thấy dễ hiểu và hay hơn bản dịch của các nhà xuất bản :)

    Cơ mà làm tay thì cũng copy-paste thôi - cơ mà mỏi tay thật :).

    Minh nghĩ đến việc làm chương trình đơn giản - tương tác với chatGPT dịch luôn cả cuốn, và đóng gói lại thành sách luôn. OneClick or OneLine command.

    Có bạn nào làm chưa? - Nếu các bạn làm rồi cho mình xin với - hoặc mình có thể đóng góp cải thiện cùng.
    Có ai có cùng ý tưởng không?

    Cảm ơn các bạn đã đọc.
     
    ngotuanvutc, tlthaiha, Ikaika and 6 others like this.
  2. Numeron

    Numeron Lớp 5

    Nếu bạn có OpenAI API key thì có thể dùng
    Vui lòng đăng nhập hoặc đăng ký để xem link
    Cơ mà công cụ này dịch từng dòng một, rất chậm.
     
    tlthaiha, Ikaika, Anan Két and 3 others like this.
  3. starman

    starman Lớp 1

    Cảm ơn bạn. Mình muốn cả cuốn và thành sách bản tiếng Việt luôn. Để mình có thời gian làm thử.
     
    Ikaika and machine like this.
  4. tran ngoc anh

    tran ngoc anh Cử nhân

    Hổm có bạn chia sẻ một extension của Edge rồi thì phải, dịch xong ra epub luôn.
     
    starman and machine like this.
  5. Lan Giao

    Lan Giao Lớp 7

    Mới thử cái plugin của Calibre, bản dịch từ tiếng Anh sang Tiếng Việt nhiều sạn lắm. Mình không có API của Chatgpt, chỉ dùng Edge và Google . Chỉ được cái là dịch rất nhanh.
     

    Các file đính kèm:

    Chỉnh sửa cuối: 14/10/23
    Anan Két thích bài này.
  6. Wanderman

    Wanderman Lớp 5

    bác có thể hướng dẫn cụ thể hơn không? Em đang có nhu cầu dịch 1 cuốn
     
  7. Ikaika

    Ikaika Lớp 1

    Lót dép hóng chung. Hiện tại mình đang dịch thủ công, cực kỳ chậm vì mình thấy ChatGPT phải đi kèm với Google Translate chứ nó không hoàn hảo đến mức 1 phát ra luôn. Mình thường dùng Google Translate trước để ổn định câu cú, sau đó dùng ChatGPT, chủ yếu để check lại nghĩa những câu khó hiểu + có những câu ChatGPT dịch thoáng ra hay hơn Google Translate nhiều.

    P/s: nghe đồn con Claude AI xử lý văn bản rất tốt, không biết khả năng dịch như thế nào. Có ai sử dụng nó chưa?
     
    teonguyen, machine and Wanderman like this.
  8. huydatvns

    huydatvns Lớp 7

    Extention dịch trực tiếp song ngữ cho epub. (Ex này diễn đàn đã chia sẽ)
    Tên: Immersive Translate: Web Page&PDF Translation
    Edge Add-on: Vui lòng đăng nhập hoặc đăng ký để xem link
    Hướng dẫn cơ bản: xem video
     
    Free777, Ikaika, chanhvan1987 and 5 others like this.
  9. Wanderman

    Wanderman Lớp 5

    Mình đang thử, thấy có vẻ ổn hơn ChatGPT.

    "According to Freud, the decline of the olfactory sense was an inevitable outgrowth of the civilizing process, set in motion when man adopted an erect posture. From that point, he argues, “the chain of events would have proceeded through the devaluation of the olfactory stimuli and the isolation of the menstrual period to the time when visual stimuli were paramount and the genitals became visible and thence to the continuity of sexual excitation, the founding of the family and so to the threshold of civilization." (History of Shit, Dominique Laporte - translated by Nadia Benabid and Rodolphe el-Khoury HIST - The MIT Press)

    Claude AI:
    "Theo Freud, sự suy giảm của giác quan khứu giác là sự phát triển tất yếu của quá trình văn minh hóa, bắt đầu khi con người thích nghi với tư thế đứng thẳng. Từ điểm đó, ông lập luận, "chuỗi sự kiện sẽ diễn ra thông qua sự đánh giá thấp các kích thích khứu giác và sự cô lập của chu kỳ kinh nguyệt đến thời điểm khi các kích thích thị giác chiếm ưu thế và bộ phận sinh dục trở nên hữu hình và do đó đến sự liên tục của kích thích tình dục, sự thành lập gia đình và vì vậy đến ngưỡng cửa của nền văn minh. "
     
  10. Ikaika

    Ikaika Lớp 1

    Mình cũng thấy vậy, mới thử mấy hôm nay.

    Theo cảm nhận thì có lẽ Claude có nhận diện bối cảnh nên đại từ nhân xưng được dịch chính xác. Các câu liên quan cũng ít lộn xộn hơn. Quan trọng là thấy Claude dùng từ ngữ chuẩn hơn.
    Ngoài ra thì một số câu dài Claude nó tự viết lại theo thứ tự khác với câu gốc, mà mình thấy câu viết lại này dễ hiểu hơn nếu dịch theo câu gốc.

    Mới thử một ít nên cũng không chắc nhận định của mình có đúng không nữa.
     
    Anan Két and machine like this.
  11. starman

    starman Lớp 1

    Có thể tương tác qua API không bạn?
    Mình có thử google mà thấy có vẻ chưa cho phép. Mới cho thử.
     
    machine thích bài này.
  12. Wanderman

    Wanderman Lớp 5

    Hình như mới có API cho doanh nghiệp thôi, chưa cho cá nhân.
     
    machine and Ikaika like this.
  13. starman

    starman Lớp 1

    Mình làm được rồi - cơ mà thấy có vấn đề:
    - Quá chậm (Tốc độ phản hồi của OpenAI quá chậm - một cuốn sách có khi mất vài giờ) - vấn đang thử cuốn đầu tiên mà mấy tiếng rồi chưa xong - đang thử cuốn Elon Musk (Của Walter Issacson) - khá dài - mà mấy giờ rồi chưa xong. Thỉnh thoảng còn bị lỗi mất kết nối đến server của OpenAPI.

    - Chất lượng dịch như bên dưới - cũng có nhiều chỗ ko được mượt mà. có lẽ mình chưa biết cách tối ưu các tham số.

    --
    “We wasted a year doing these technical tap dances instead of building new features,” Levchin says.
    The recoding effort also prevented the company from focusing on the growing amount of fraud that was plaguing the service.
    “The only reason we remained successful was because there were no other companies being funded during that time.” Levchin had trouble knowing what to make of Musk.
    Was his arm-wrestling gambit serious? Were his bouts of maniacal intensity punctuated by goofball humor and game-playing calculated or crazed? “There’s irony in everything he does,” says Levchin.
    “He operates on an irony setting that goes up to eleven but never goes below four.” One of Musk’s powers was to entice other people into his irony circle so they could share an inside joke.
    “He turns on his irony flamethrower and creates this sense of exclusive Elon Club membership.” That didn’t work well on Levchin, who was shielded from irony flamethrowers by his earnestness.
    He had a good radar for detecting Musk’s exaggerations.
    During the merger, Musk kept insisting that X.com had close to twice as many users, and Levchin would check with its engineers and get the real number.
    “Elon didn’t just exaggerate, he made it up,” Levchin says.
    It was what his father would have done.
    And yet, Levchin began to marvel at the counterexamples, such as when Musk astounded him by knowing things.
    At one point Levchin and his engineers were wrestling with a difficult problem involving the Oracle database they were using.
    Musk poked his head in the room and, even though his expertise was with Windows and not Oracle, immediately figured out the context of the conversation, gave a precise and technical answer, and walked out without waiting for confirmation.
    Levchin and his team went back to their Oracle manuals and looked up what Musk had described.
    “One by one, we all said, ‘Shit, he’s right,’ ” Levchin recalls.
    “Elon will say crazy stuff, but every once in a while, he’ll surprise you by knowing way more than you do about your own specialty.
    I think a huge part of the way he motivates people are these displays of sharpness, which people just don’t expect from him, because they mistake him for a bullshitter or goofball.

    -- GPT Dịch--
    "Levchin nói: 'Chúng ta đã lãng phí một năm để thực hiện những vũ điệu kỹ thuật thay vì xây dựng các tính năng mới'.
    Nỗ lực ghi âm này cũng ngăn cản công ty tập trung vào việc ngày càng tăng của số lượng gian lận đang làm hỏng dịch vụ.
    'Lý do duy nhất mà chúng ta vẫn thành công là vì không có công ty khác được tài trợ trong thời gian đó'.
    Levchin gặp khó khăn khi quyết định cái gì đáng xem ở Musk.
    Liệu vụ đấu cù bắp tay của anh ấy có đáng tin cậy hay không? Các đợt tăng cường cơn cuồng nhiệt của anh ấy kết hợp với hài hước và trò chơi có phải là tính toán hay điên loạn? 'Trong mọi thứ anh ấy làm đều có sự nhạo báng', Levchin nói.
    'Anh ta hoạt động với một cấu hình nhạo báng từ mức 11 trở lên nhưng không bao giờ xuống dưới mức 4'.
    Một trong những sức mạnh của Musk là kích thích người khác vào vòng đồng cảm nhạo báng của anh ta để họ có thể chia sẻ một trò đùa nội bộ.
    'Anh ta bật bình xịt nhạo báng của mình và tạo ra cảm giác làm thành viên trong câu lạc bộ Elon độc quyền'.
    Điều đó không hoạt động tốt với Levchin, người được che chắn khỏi bình xịt nhạo báng bởi tính chân thành của mình.
    Anh ấy có sự nhạy bén tốt để phát hiện ra những phóng đại của Musk.
    Trong quá trình hợp nhất, Musk tiếp tục khẳng định rằng X.com đã có gần gấp đôi số người dùng, và Levchin sẽ kiểm tra với kỹ sư của nó và lấy số thực sự.
    'Elon không chỉ phóng đại, anh ta tạo ra điều đó', Levchin nói.
    Đó là những gì cha của anh ta đã làm.
    Và tuy nhiên, Levchin đã bắt đầu ngưỡng mộ những trường hợp phản chứng, như khi Musk làm ngạc nhiên anh ta bằng việc biết những điều.
    Một lúc nào đó, Levchin và các kỹ sư của anh ta đang vật lộn với một vấn đề khó khăn liên quan đến cơ sở dữ liệu Oracle mà họ đang sử dụng.
    Musk thò đầu vào phòng và, mặc dù anh ta chuyên về Windows chứ không phải Oracle, ngay lập tức hiểu bối cảnh cuộc trò chuyện, đưa ra một câu trả lời chính xác và kỹ thuật và đi ra ngoài mà không cần chờ xác nhận.
    Levchin và đội ngũ của anh quay lại cuốn sách hướng dẫn Oracle của mình và tìm kiếm những gì Musk đã mô tả.
    'Một lần một, chúng tôi tất cả nói: 'Trời ơi, anh ấy đúng rồi'', Levchin nhớ lại.
    'Elon sẽ nói những điều điên rồ, nhưng đôi khi anh ấy sẽ gây bất ngờ cho bạn bằng cách biết nhiều hơn bạn về chuyên môn của mình.
    Tôi nghĩ một phần lớn cách anh ấy thúc đẩy người khác là những màn trình diễn sắc bén này, mà người ta không ngờ từ anh ấy vì họ nhầm anh ta là kẻ vòi vĩnh hoặc kẻ hề."
     
    Dai ca superman and Anan Két like this.
  14. starman

    starman Lớp 1

    Với cuốn sách 700 trang (Elon Musk by Walter Issacson) - mà OpenAI xử từ sáng chưa xong các bạn ah. Và đã tiêu gần hết tiền được cho rồi :).
    Nên mình nghĩ rằng dùng OpenAI không hiệu quả :). Chất lượng dịch thì mình nghĩ cũng tạm được - nhìn tổng quan. Rất sát nghĩa.

    upload_2023-10-18_15-15-59.png
     
  15. Depressed

    Depressed Lớp 6

    Dùng google free thôi. Vừa nhanh vừa gọn.
     
    Anan Két thích bài này.
  16. hoangducvy

    hoangducvy Lớp 1

    Tại vì cũng hóng hớt nên mới nhiều chiện ở đây!
    Trước tiên mình dùng bing cho em nó dịch: We wasted a year doing these technical tap dances instead of building new features,” Levchin says thì kết quả ra cũng như bài post trên của Starman. Nhưng khi yêu cầu em nó dịch thoát nghĩa hơn cụm tap dances thì được
    “Chúng tôi đã lãng phí một năm để thực hiện những công việc kỹ thuật phức tạp này thay vì phát triển các tính năng mới,” Levchin nói.
    Ơ đây mình thấy suy nghĩ dùng AI làm một phát ăn ngay là không thể. Vì ngay cả con người còn nhiều sách dịch cũng đâu có mượt. Phải chăng nên suy nghĩ về cách dùng AI ở một mức độ nào đó để giảm thời gian, công sức trong dịch thuật thôi.
    Cuối cùng cũng là sự hàm hồ của bản thân mà mượn câu nói của Kant "từ một khúc gỗ cong queo thì chẳng có gì thẳng thớm được tạo ra cả"
     
    tran ngoc anh and Anan Két like this.
  17. starman

    starman Lớp 1

    Mình đã dịch xong.
    Chương trình chạy 13h thì xong - do OpenAI phản hồi quá chậm. Và tiêu tốn hết 2.9 usd cho cả cuốn sách 700 trang. :)

    Về kết quả, mình đánh giá là tốt hơn nhiều so với Google.

    từ kết quả này mình đánh giá là việc biên dịch sẽ bị AI lấy dần mất hihi.
     
  18. trilv

    trilv Mầm non

    Cảm ơn đã chia sẻ.
     
  19. Narga

    Narga Lớp 5

    Bạn có thể tham khảo bên VOZ, có bạn training AI để dịch truyện, hiện tại mới hỗ trợ truyện tiên hiệp và huyền huyễn, dịch khá mượt, nhiều đoạn hay hơn người dịch, biết xử lý điển cố, tình huống... Hơn nữa dịch khá nhanh. Như bộ Âm gian thương nhân mình nhờ dịch khoảng 700 chương chạy hết 3 tiếng, được file nén zip toàn text txt 10MB, dung lượng file text nói lên độ nhiều của kí tự nhé
    Tất nhiên là cần training thì mới dịch tốt được, có những cuốn chỉ dịch mồi vài đoạn ngắn thì chất lượng không thể tốt được.
     
    Chỉnh sửa cuối: 20/10/23
    Ikaika and tran ngoc anh like this.
  20. nguoiphuphep

    nguoiphuphep Mầm non

    Cẩn thận với hiện tượng "nhét chữ vào nguồn". Đó là chuyện cực kỳ tệ, dịch bằng ChatGPT từng bị quốc tế chỉ trích nặng nề về lỗi này.
     
Moderators: amylee

Chia sẻ trang này