Xin chào các bạn,
Sau một thời gian nghiên cứu và phát triển, nhóm đã có được những kết quả khả quan trong việc xây dựng AI dành cho việc giải các bài toán hình học Euclid. Giới thiệu qua một chút về mô hình AI lần này mà chúng mình đang xây dựng (Euclid Brain). Euclid Brain là một mô hình suy luận (reasoning model) hoạt động khá khác so với các mô hình phổ biến như Deepseek-R1..., Euclid Brain có cách suy nghĩ và khả năng suy luận riêng.
Euclid Brain được huấn luyện bằng Reinforcement Learning (RL) thuần túy, thay vì học theo cách "chưng cất" như các mô hình cũ, thì Euclid Brain phải học cách tự mình vật lộn với bài toán, thử, sai và tự tìm ra cách giải đúng đắn. Điều này khiến cho mô hình có khả năng suy luận sâu thay vì chỉ bắt chước. Các thuật toán RL cũng đã được tinh chỉnh để mô hình trở nên sáng tạo hơn bằng việc đã tháo bỏ "dây cương" (KL penalty). Bên cạnh đó AI cũng được khuyến khích thử những bước đi có xác suất thấp nhưng tiềm năng mang lại lớn. Điều này khiến AI không đi vào lối mòn, dám thử nghiệm những hướng giải quyết mới lạ và có khả năng tìm ra những lời giải đột phá mà các phương pháp an toàn có thể bỏ lỡ, đây cũng là cách mà Euclid Brain có khả năng dựng thêm các hình phụ khi bài toán đi vào ngõ cụt giống như cách con người làm khi giải các bài toán hình học Euclid phức tạp.
Hiện tại Euclid Brain đang làm khá tốt trong việc giải quyết các bài toán hình học Euclid của học sinh cấp 2, các bài hình học Euclid trong các đề thi HSG và thi chuyên và để có thể giải quyết các bài toán hình học trong đề thi IMO thì Euclid Brain vẫn cần một khoảng thời gian để tinh chỉnh và huấn luyện. Euclid Brain đã được chạy thử trên các đề thi HSG, chuyên Toán, tuyển sinh 10 của Hà Nội trong 6 năm gần nhất.
Kết quả cho được khi chạy trên cấu hình NVIDIA GeForce RTX 5090 GPU + AMD Ryzen Threadripper 7970X CPU
Kỳ thi HSG lớp 9: Giải được 6/6 bài + thời gian trung bình 22s/1bài
Tuyển sinh vào 10 không chuyên: Giải được 6/6 bài + thời gian trung bình 4s/1bài
Tuyển sinh vào 10 chuyên Toán: Giải được 6/6 bài + thời gian trung bình 23s/1bài
Nhóm xin gửi lời cảm ơn đến các bạn học sinh từ các trường THCS và THPT chuyên đã giúp nhóm có thêm dữ liệu và đã giúp nhóm trong việc đánh giá các lời giải của Euclid Brain. Chúc các bạn sẽ có một năm học mới đạt được nhiều thành công và mong muốn của bản thân. Cảm ơn các bạn rất nhiều
Các bạn có thể chạy thử mô hình tại đây: https://colab.research.google.com/drive/1sqqEP5xhc9aFFAwdxXRXWieIbe1oBxLF?usp=sharing
Do H. Son - University of Engineering and Technology, VNU
Tran B. Minh - School of Computer Science, The University of Sydney
Pham D. Khoi - School of Computer Science, The University of Sydney
Nguyen D. Nhan - School of Computer Science, The University of Sydney