OpenAI vừa chính thức công bố hai mô hình trí tuệ nhân tạo mới mang tên o3 và o4-mini, đánh dấu bước tiến quan trọng trong nỗ lực phát triển các hệ thống AI có khả năng suy luận vượt trội. Đây là những bổ sung mới nhất cho dòng mô hình "reasoning models" – các mô hình được huấn luyện để "nghĩ trước khi nói", tức dành nhiều thời gian hơn để xử lý yêu cầu đầu vào nhằm đưa ra những câu trả lời chất lượng cao hơn.
Mô hình o3, từng được xem trước vào tháng 12, được giới thiệu là hệ thống có khả năng lý luận mạnh mẽ nhất mà OpenAI từng phát triển. Trong khi đó, phiên bản o4-mini tuy nhỏ hơn nhưng lại được tối ưu hóa để vận hành nhanh hơn, chi phí thấp hơn, phù hợp với các tác vụ cần hiệu quả cao mà vẫn đảm bảo độ chính xác cần thiết. Sự kết hợp giữa hiệu năng và tốc độ đã khiến bộ đôi này nhanh chóng nhận được sự quan tâm từ cộng đồng công nghệ toàn cầu.

Với mô hình AI mới, ChatGPT không chỉ đọc được mà còn suy luận được bằng hình ảnh
Điểm nổi bật đáng chú ý trong lần ra mắt này là khả năng "suy nghĩ bằng hình ảnh" – một bước đột phá thực sự trong lĩnh vực trí tuệ nhân tạo. Nếu như trước đây các mô hình AI chỉ có thể "nhìn thấy" hình ảnh như một dạng dữ liệu đầu vào để phân tích thông tin cơ bản, thì nay o3 và o4-mini đã tiến xa hơn. Chúng có thể sử dụng thông tin thị giác như một phần trong quá trình suy luận, từ đó đưa ra các nhận định sâu sắc hơn và mang tính phản biện cao hơn. Đặc biệt, khả năng xử lý cả những hình ảnh mờ hoặc kém chất lượng mà vẫn hiểu được nội dung là minh chứng rõ ràng cho sự tiến bộ vượt bậc của công nghệ xử lý đa phương thức.
Không dừng lại ở đó, hai mô hình mới còn mở rộng khả năng tác nhân – cho phép chúng tự động sử dụng tất cả các công cụ hiện có của ChatGPT như duyệt web, chạy mã Python, hiểu và tạo hình ảnh để giải quyết các bài toán phức tạp một cách độc lập. Đây là lần đầu tiên người dùng chứng kiến một hệ thống AI có thể thực hiện chuỗi tác vụ nhiều bước mà không cần chỉ đạo cụ thể ở từng bước nhỏ, hướng tới một phiên bản ChatGPT có tính "chủ động" cao hơn, giống như một trợ lý số thực thụ.
Trong buổi livestream giới thiệu sản phẩm, nhóm nghiên cứu OpenAI đã thực hiện một thử nghiệm trực tiếp: họ cung cấp cho o3 một poster nghiên cứu khoa học và yêu cầu nó đưa ra một kết luận không được đề cập trong tài liệu. Mô hình đã chủ động phóng to các phần khác nhau của hình ảnh, kết hợp thông tin từ nhiều nguồn qua việc truy cập internet, và cuối cùng đưa ra một nhận định hợp lý – minh chứng rõ ràng cho khả năng sử dụng đa công cụ cùng lúc và phân tích hình ảnh một cách tinh vi.

Các bài kiểm tra cho thấy o3 và o4-mini có năng lực vượt trội hơn các mô hình tiền nhiệm
Theo đánh giá từ chính OpenAI, o3 và o4-mini vượt trội hoàn toàn so với các thế hệ trước không chỉ ở độ chính xác, mà còn ở khả năng tuân thủ hướng dẫn và đưa ra những câu trả lời có thể kiểm chứng. Dù không cần đến các công cụ hỗ trợ đi kèm, bản thân mô hình cũng đã đạt thành tích cao hơn trên các bài kiểm tra chuẩn hóa so với các phiên bản trước đó. Điều này cho thấy năng lực cốt lõi của hệ thống đã được cải thiện rõ rệt, mở ra nhiều ứng dụng tiềm năng trong giáo dục, nghiên cứu khoa học, y tế và nhiều lĩnh vực khác.
Một báo cáo từ tờ The Information cũng tiết lộ rằng các mô hình mới này có khả năng tổng hợp kiến thức từ nhiều lĩnh vực khác nhau để đề xuất các thí nghiệm mới mang tính sáng tạo. Những người đã thử nghiệm o3 và o4-mini cho biết hệ thống có thể ứng dụng trong các chủ đề phức tạp như phân hạch hạt nhân hoặc phát hiện mầm bệnh, mở ra triển vọng AI trở thành một cộng sự khoa học thực sự trong tương lai gần. Dù OpenAI chưa đưa ra phản hồi chính thức, nhưng tiềm năng của công nghệ này là điều không thể phủ nhận.
Hiện tại, o3 và o4-mini đã được triển khai cho người dùng ChatGPT Plus, Pro và Team, xuất hiện trong bảng chọn mô hình với ba mức hiệu suất: thấp, trung bình và cao. Người dùng phiên bản Pro sẽ sớm được tiếp cận với mô hình o3-pro trong vài tuần tới, còn các nhà phát triển đã có thể tích hợp các mô hình này thông qua API của OpenAI.
Trong bối cảnh các mối lo ngại về an toàn AI ngày càng được quan tâm, OpenAI khẳng định cả hai mô hình mới đều đã trải qua quá trình kiểm thử nghiêm ngặt trong khuôn khổ chương trình đánh giá an toàn và tuân thủ theo khung chuẩn bị rủi ro (Preparedness Framework) mới nhất. Người dùng quan tâm có thể tìm hiểu kỹ hơn qua tài liệu system card được công bố công khai.
Sự ra đời của o3 và o4-mini không chỉ cho thấy tham vọng dẫn đầu của OpenAI trong cuộc đua AI, mà còn đặt nền móng cho thế hệ hệ thống thông minh có khả năng hành động độc lập, tư duy sâu sắc và tương tác linh hoạt hơn bao giờ hết. Đây có thể là bước đầu tiên trong hành trình hướng tới một tương lai nơi trí tuệ nhân tạo không chỉ hỗ trợ con người, mà còn đồng hành như một đối tác thực sự trong cả sáng tạo lẫn giải quyết các vấn đề phức tạp của thế giới hiện đại.