ChatGPT trả lời đúng từ 52,4-75% số câu hỏi trong ba phần của bài kiểm tra cấp phép chứng chỉ hành nghề y tại Mỹ mà không cần bất kỳ khoa đào tạo chuyên môn nào.
Biểu tượng của OpenAI và ChatGPT. (Ảnh: AFP/TTXVN)
Theo một nghiên cứu được công bố ngày 9/2, một "thí sinh" đặc biệt đã có thể đạt hoặc gần như đạt số điểm đủ để vượt qua kỳ thi cấp phép hành nghề y của Mỹ.
Điều đáng nói là người làm bài kiểm tra không phải là sinh viên, bác sỹ hay nhà khoa học mà là ChatGPT - công cụ xử lý ngôn ngữ do trí tuệ nhân tạo (AI) điều khiển.
Các tác giả nghiên cứu đánh giá việc đạt được số điểm để vượt qua kỳ thi nổi tiếng rất khó này mà không cần bất kỳ sự hỗ trợ nào của con người "đánh dấu một cột mốc đáng chú ý trong quá trình trưởng thành của AI về mặt lâm sàng."
Thông qua nghiên cứu kiểm tra năng lực của ChatGPT, các tác giả cho rằng các mô hình ngôn ngữ lớn có thể có khả năng hỗ trợ giáo dục y tế và cũng như có tiềm năng đưa ra các chẩn đoán lâm sàng.
Để đánh giá khả năng của ChatGPT, các nhà nghiên cứu tại AnsibleHealth, có trụ sở ở bang California (Mỹ), đã sử dụng ChatGPT để thực hiện bài kiểm tra cấp phép chứng chỉ hành nghề của các sinh viên tốt nghiệp trường y và bác sỹ thực tập ở Mỹ.
Đó là một trong những đề thi khó nhất vì những câu hỏi không đơn giản để tìm thấy câu trả lời trên Internet.
Đề thi chia làm 3 phần, kiểm tra kiến thức trong nhiều lĩnh vực y tế từ khoa học cơ bản đến hóa sinh, lý luận chẩn đoán đến đạo đức, tư duy phản biện và kỹ năng giải quyết vấn đề.
Thông thường, phần đầu tiên của kỳ thi, tập trung vào khoa học cơ bản và dược lý, dành cho các sinh viên y khoa, những người đã dành 300-400 giờ học tập chuyên dụng.
Phần thứ hai dành cho sinh viên y khoa năm thứ tư với nội dung trọng tâm là lý luận lâm sàng, quản lý y tế và đạo đức sinh học.
Phần cuối cùng dành cho các bác sỹ đã hoàn thành chương trình đào tạo y khoa sau đại học ít nhất từ 6 tháng đến 1 năm.
Nhóm nghiên cứu đã sử dụng 350 trong số 376 câu hỏi công khai trong kỳ thi hồi tháng 6/2022.
Các câu hỏi được trình bày ở nhiều định dạng khác nhau, bao gồm cả câu hỏi mở hay những câu hỏi bẫy. Ngoài ra còn có các câu hỏi trắc nghiệm.
Kết quả, ChatGPT trả lời đúng từ 52,4-75% số câu hỏi trong ba phần của bài kiểm tra mà không cần bất kỳ khoa đào tạo chuyên môn nào. Trong khi đó, để vượt qua bài kiểm tra này cần trả lời đúng khoảng 60%.
ChatGPT, do công ty OpenAI có trụ sở tại San Francisco phát triển. Từ khi ra mắt, công cụ này đã thu hút sự chú ý của thế giới nhờ khả năng viết luận, làm thơ hoặc viết code theo yêu cầu chỉ trong vài giây, đồng thời làm dấy lên lo ngại về nguy cơ lừa đảo hoặc AI có thể biến nhiều ngành nghề trở nên lỗi thời.
Tháng trước, Microsoft thông báo đầu tư vào OpenAI và đã bắt đầu tích hợp các tính năng của ChatGPT vào nền tảng Teams của hãng này, với mong muốn sẽ tích hợp ứng dụng này vào tổ hợp Office và công cụ tìm kiếm Bing.