Phiên bản mới nhất của ChatGPT "đỗ" bài thi chẩn đoán hình ảnh

ChatGPT liên tục được thử nghiệm qua các bài thi tiêu chuẩn về kiến thức y tế

Chủ đề ngành dược gây tranh cãi trước thềm Hội nghị G7

U22 Việt Nam giành HCĐ, trận chung kết SEA Games 32 xứng đáng bị dẹp bỏ

Đầu tư AI trong báo chí là vô cùng cần thiết

Trí tuệ nhân tạo giúp phát hiện ung thư phổi sớm?

ChatGPT-4 là phiên bản mới nhất của ứng dụng trí tuệ nhân tạo (AI) của công ty khởi nghiệp OpenAI. So với mô hình ChatGPT-3.5 trước đó, ChatGPT-4 được đánh giá là "sáng tạo hơn và độ hợp tác cao hơn bao giờ hết".

Để kiểm chứng sức mạnh của ChatGPT-4, các nhà khoa học đã thử nghiệm mô hình trí tuệ nhân tạo mới nhất từ OpenAI hoạt động như thế nào trong môi trường y tế. ChatGPT-4 vượt qua bài kiểm tra cấp phép hành nghề y ở Mỹ (USMLE) với số điểm đáng nể (52,4-75% số câu hỏi trong 3 phần, trong khi ngưỡng vượt qua bài thi là 60%).

Bài viết trên tạp chí Radiology của Hiệp hội Chẩn đoán hình ảnh Bắc Mỹ (RSNA) cho thấy, phiên bản mới nhất của ChatGPT còn vượt qua bài kiểm tra của Hội đồng Chẩn đoán hình ảnh Canada và Mỹ. Điểm số ChatGPT đạt được còn dư 10 điểm so với ngưỡng vượt qua bài thi là 70%.

Tuy nhiên, do ChatGPT mới được thiết kế để xử lý ngôn ngữ, bài thi dành cho ứng dụng này không có phần hình ảnh. Đây có thể coi là thiếu sót lớn của mô hình AI này, bởi ngành Chẩn đoán hình ảnh (với các mảng như X quang, Siêu âm, Chụp cắt lớp vi tính, MRI) là chuyên ngành liên quan đến việc sử dụng năng lượng bức xạ hoặc chất phóng xạ trong chẩn đoán và điều trị bệnh.

Thông tin mà mô hình trí tuệ nhân tạo ChatGPT đưa ra không thể thay thế chẩn đoán của con người

Thông tin mà mô hình trí tuệ nhân tạo ChatGPT đưa ra không thể thay thế chẩn đoán của con người

Theo Insider, ChatGPT đã chứng tỏ khả năng "làm bài kiểm tra" đáng nể: Vượt qua bài thi SAT (kiến thức tự nhiên và xã hội dùng để xét tuyển bậc Đại học), kỳ thi nhận chứng chỉ luật sư và kỳ thi master sommelier (bậc thầy về rượu).

Trong bài thi chẩn đoán hình ảnh, ChatGPT-4 làm tốt ở các câu hỏi tư duy bậc cao, không chỉ cần trí nhớ mà còn đòi hỏi kỹ năng phân tích, tổng hợp và đánh giá. Khả năng mô tả hình ảnh của ChatGPT-4 cũng nhận được đánh giá tốt (85%).

Thế nhưng, mô hình trí tuệ nhân tạo này lại trả lời sai một vài câu hỏi cơ bản nhất. Thậm chí, 12 câu ChatGPT-4 trả lời sai đã được người tiền nhiệm ChatGPT-3.5 trả lời đúng.

TS Rajesh Bhayana – chuyên gia chẩn đoán hình ảnh ổ bụng tại Bệnh viện Đa khoa Toronto chia sẻ với báo chí: "Ban đầu chúng tôi khá ngạc nhiên về những câu trả lời chính xác và tự tin của ChatGPT, trước những câu hỏi hóc búa về chẩn đoán hình ảnh. Nhưng sau đó, chúng tôi cũng ngạc nhiên không kém với những đáp án sai và phi logic nó đưa ra".

Về bản chất, ChatGPT được thiết kế để trò chuyện với người dùng, nên có thể dự đoán những từ ngữ sắp được người dùng nhập vào. Khi "đi thi", ChatGPT có thể trở thành một thí sinh rất tự tin, ngay cả khi trả lời sai.

Đôi khi, mô hình AI này vẫn mắc phải những sai lầm khá ngớ ngẩn, và điều này có thể dẫn đến những sai sót nghiêm trọng trong việc kê đơn hoặc chẩn đoán.

Các bác sỹ cảnh báo, không nên dùng ChatGPT để chẩn đoán hay điều trị cho bệnh nhân. Các thông tin y tế mà mô hình trí tuệ nhân tạo cung cấp luôn cần kiểm chứng bởi con người.

Tuy nhiên, các chuyên gia y tế cũng khám phá ra rằng, ChatGPT có thể trở thành công cụ tuyệt vời để cải thiện quá trình giao tiếp giữa bác sỹ và bệnh nhân. Lý do là công cụ này giỏi "tám chuyện" – cho thấy nó biết quan tâm hơn các bác sỹ lúc nào cũng bận rộn. 

 
Quỳnh Trang (Theo Insider)
Mời quý vị độc giả đọc tin hàng ngày về chủ đề sức khỏe tại suckhoecong.vn trong chuyên mục Bạn đọc viết