TTC Việt Nam
Page Header Background

So sánh khả năng lập trình giữa Claude, ChatGPT và Gemini qua dự án mô phỏng

Trang chủ»So sánh khả năng lập trình giữa Claude, ChatGPT và Gemini qua dự án mô phỏng
So sánh khả năng lập trình giữa Claude, ChatGPT và Gemini qua dự án mô phỏng

Các LLM đang phát triển với tốc độ đáng báo động, và tùy thuộc vào quan điểm của mỗi người, điều đó có thể là tốt hoặc xấu. Các AI agent đang là xu hướng hiện nay, nhưng cuối cùng bất kỳ agent nào cũng bị giới hạn bởi mô hình cung cấp năng lượng cho nó. Vì vậy, bất kể bạn đang sử dụng thiết lập nào, rõ ràng việc bạn dùng mô hình nào đóng vai trò rất quan trọng.

Mọi người đã nghe rất nhiều về Claude. Dường như Claude luôn là lựa chọn hàng đầu cho những người thực sự muốn hoàn thành công việc - vượt ra ngoài việc biến ảnh thành phim hoạt hình hoặc trút bầu tâm sự với chatbot. Nhưng nhiều người đã đăng ký ChatGPT khi nó ra mắt và chưa bao giờ đủ can đảm để hủy bỏ. Thêm vào đó, một số người còn có gói đăng ký Google One đi kèm với Gemini. Việc trả tiền cho LLM thứ ba có vẻ... xa xỉ.

Vậy còn cách nào tốt hơn là so sánh các công cụ phổ biến trong việc sử dụng phần mềm mô phỏng hệ mặt trời?

Mục lục bài viết

  • Hãy cùng xây dựng một công cụ khám phá hệ mặt trời!
  • Gemini chạy nhanh và trông khá ấn tượng
  • ChatGPT đã suy nghĩ rất lâu và kỹ lưỡng, nhưng kết quả vẫn tệ
  • Claude ở một đẳng cấp khác hẳn
  • Sản phẩm duy nhất mang lại cảm giác hoàn thiện
  • Claude là LLM dành cho những người thực sự muốn hoàn thành công việc

Hãy cùng xây dựng một công cụ khám phá hệ mặt trời!

Có nhiều ý tưởng cho một bài kiểm tra hiệu năng LLM đúng nghĩa. Vì đây là những mô hình ngôn ngữ lớn, cách tốt nhất để kiểm tra chúng là cho chúng sử dụng một ngôn ngữ, và không có ngôn ngữ nào được tài liệu hóa rộng rãi hơn ngôn ngữ lập trình. Tất nhiên, ban đầu có thể xem xét những lựa chọn quen thuộc: Tạo một trang web, một bản sao của Flappy Bird hay một phần mềm mô phỏng giao thông. Nhưng nếu muốn một cái gì đó có nhiều yếu tố vật lý hơn, nhiều quy tắc hơn, và chưa từng được thực hiện nhiều đến mức nhàm chán, hãy chọn một công cụ khám phá hệ mặt trời hoàn chỉnh.

Một phần mềm mô phỏng hệ mặt trời 3D sẽ buộc LLM phải xử lý vật lý, đồ họa, logic mô phỏng, trải nghiệm người dùng và kiến ​​trúc cùng một lúc. Dự án sẽ dựa trên web, tự chứa trong một file duy nhất và không chỉ định ngăn xếp. Nếu muốn buộc sử dụng Babylon.js thay vì Three.js để làm cho mọi thứ thú vị hơn, việc chọn ngăn xếp sẽ là một phần của thách thức. Bạn cũng có thể thêm một quy tắc: Không thử lại, không chỉnh sửa, không vá lỗi. Kết quả đầu tiên sẽ là kết quả cuối cùng.

Dưới đây là prompt được sử dụng cho cả 3 công cụ. Cố gắng giữ cho nó càng giống với lập trình trực quan càng tốt và tránh đưa ra bất kỳ ràng buộc kỹ thuật cứng nhắc nào. Prompt tập trung gần như hoàn toàn vào hình thức và chức năng. Hãy chạy cả 3 trong giao diện trò chuyện web chính của chúng, chứ không phải ứng dụng desktop hoặc các công cụ lập trình chuyên dụng.

Xây dựng một công cụ khám phá hệ mặt trời dựa trên trình duyệt, chạy cục bộ trong trình duyệt web và mang lại cảm giác như một mô phỏng tương tác thực sự chứ không phải là một bản demo đồ chơi. Nó phải thể hiện chính xác cấu trúc và chuyển động của hệ mặt trời, với kích thước hành tinh, hành vi quỹ đạo, ánh sáng, sự quay và tỷ lệ không gian đáng tin cậy, đồng thời vẫn phải dễ sử dụng và trực quan rõ ràng. Trải nghiệm phải trông thực tế, trau chuốt và có tính thẩm mỹ cao, với khả năng điều hướng mượt mà, zoom và di chuyển camera trực quan, một bản trình bày làm cho không gian cảm thấy rộng lớn và chi tiết. Kết quả cuối cùng phải hoạt động đầy đủ chức năng, ấn tượng về mặt hình ảnh, có cơ sở khoa học và có thể chạy trực tiếp trong trình duyệt mà không cần bất kỳ backend hoặc dịch vụ bên ngoài nào.

Gemini chạy nhanh và trông khá ấn tượng

Gemini 3 Thinking hoàn thành đầu tiên, và tốc độ của nó thì không hề thua kém. Nó cũng là mô hình duy nhất không hiển thị kết quả dưới dạng giao diện kiểu Canvas, nhưng đó chỉ là một điểm nhỏ. Gemini chọn Three.js, và nhìn từ xa, nó trông khá tốt. Các hành tinh quay quanh mặt trời, ánh sáng trông rất thật, và có cả bóng đổ. Ở một trong những ảnh chụp màn hình, bạn có thể thấy các hành tinh che khuất lẫn nhau, đó là một điểm nhấn thú vị và ngay lập tức làm cho toàn bộ hình ảnh trở nên sống động hơn. Ít nhất, nó có thể hoạt động như một hình nền Wallpaper Engine thực sự đẹp. Các vấn đề xuất hiện khi phóng to. Thông báo trên màn hình nói rằng "nhấp chuột vào các hành tinh để lấy nét", nhưng việc nhấp chuột thực sự không có tác dụng gì. Và việc nhấp chuột vào một hành tinh đang di chuyển ngay từ đầu đã khó chịu hơn mức cần thiết. Kết cấu bề mặt các hành tinh là một điểm yếu khác - chỉ là những dải màu đơn giản, không có chi tiết bề mặt thực sự, và không có cách nào để biết liệu hành tinh nào có đang quay hay không. Việc chọn một hành tinh từ menu đã kích hoạt hiệu ứng camera đuổi theo khá đẹp mắt, nhưng lại đi kèm với một lỗi: Một khi đã khóa vào đối tượng, bạn không thể thu nhỏ lại. Bạn phải làm mới trang để khắc phục. Tính năng thú vị, nhưng việc thực hiện lại bị lỗi.

Xem sản phẩm của Gemini trên trang Vercel

ChatGPT đã suy nghĩ rất lâu và kỹ lưỡng, nhưng kết quả vẫn tệ

Một chương trình khám phá hệ mặt trời do ChatGPT tạo ra

ChatGPT là chương trình hoàn thành cuối cùng. Tác giả bài viết đã sử dụng ChatGPT 5.4 Thinking, và nó đã suy nghĩ khá lâu trước khi tạo ra code. Thật không may, kết quả đã bị lỗi nghiêm trọng ngay từ đầu. Tất cả các hành tinh đều xếp chồng lên nhau ở cùng một vị trí với mặt trời - không có quỹ đạo, không có khoảng cách, không có hành động quay, chỉ là một đống hình cầu chồng lên nhau tại gốc tọa độ. Vì yêu cầu ban đầu là không vá lỗi và không thử lại, vậy đây là kết quả sẽ được đánh giá. Đó chính xác là mục đích của bài kiểm tra. Nếu một agent dựa vào mô hình này để tạo ra code hoạt động mà không cần thêm prompt, thì đây là những gì bạn sẽ nhận được. Điều thú vị là, khi yêu cầu ChatGPT xem lại code của chính nó và xác định vấn đề, nó đã liệt kê khoảng một tá vấn đề tiềm ẩn và hoàn toàn bỏ sót vấn đề thực sự. Các nguyên nhân lỗi cơ bản bao gồm: Mô phỏng lưu trữ khoảng cách quỹ đạo bằng AU (đơn vị thiên văn) nhưng trình kết xuất lại mong đợi đơn vị kilômét, khiến các hành tinh nằm chồng lấn trong lòng Mặt Trời.

Xem kết quả của ChatGPT trên trang Vercel

Góc nhìn từ chuyên gia kỹ thuật của TTC Việt Nam

Trong kỷ nguyên số hiện nay, việc lựa chọn công cụ AI phù hợp cho các dự án lập trình không chỉ dựa trên thương hiệu mà là khả năng xử lý logic và tính chính xác của mã nguồn. Qua các bài kiểm tra thực tế như trên, chúng ta thấy rõ tầm quan trọng của việc tối ưu hóa thuật toán trong LLM. Các mô hình như Claude đang thể hiện khả năng hiểu sâu và thực thi cấu trúc phức tạp tốt hơn, giúp tiết kiệm thời gian phát triển và giảm thiểu sai sót kỹ thuật. Tại TTC Việt Nam, chúng tôi luôn khuyến nghị doanh nghiệp cần kiểm chứng chặt chẽ đầu ra của AI trước khi tích hợp vào hệ thống mạng hoặc viễn thông thực tế, nơi tính ổn định và chính xác luôn được đặt lên hàng đầu.

Claude ở một đẳng cấp khác hẳn

Sản phẩm duy nhất mang lại cảm giác hoàn thiện

Claude ra mắt sau Gemini nhưng trước ChatGPT khá lâu. Tác giả đã sử dụng Claude Sonnet 4.6, phiên bản miễn phí mới nhất. Khoảng cách về chất lượng giữa sản phẩm của Claude và các sản phẩm khác là rất rõ rệt. Giống như Gemini, nó cũng chọn Three.js, nhưng triển khai một cách kỹ lưỡng hơn nhiều. Điều đầu tiên gây ấn tượng là nó bao gồm cả vành đai tiểu hành tinh. Gemini thậm chí còn không bận tâm đến điều đó. Rồi đến phần kết cấu! Các hành tinh của Claude trông thực sự giống thật. Phần cuối cùng này đáng được nhấn mạnh. Đây vẫn chỉ là một file độc lập. Thông thường, bạn sẽ mong đợi các bản đồ kết cấu hoặc asset hình ảnh bên ngoài được load riêng biệt. Nhưng Claude đã tạo ra tất cả các họa tiết này một cách tự động bằng JavaScript, ngay trong file, và nó đã làm rất tốt. Các hành tinh được sắp xếp thực tế hơn, chúng quay với tốc độ tương đối hợp lý, và quỹ đạo của chúng quanh mặt trời cũng gần với thực tế hơn nhiều. Claude đơn giản là đã tiến xa hơn những tùy chọn khác. Đồ họa tốt hơn, trải nghiệm người dùng tốt hơn, và toàn bộ sản phẩm có cảm giác trau chuốt hơn cả về hình thức lẫn chức năng.

Xem kết quả của Claude trên trang Vercel

Claude là LLM dành cho những người thực sự muốn hoàn thành công việc

Thử nghiệm nhỏ này đã tiêu tốn 20 USD, vì giờ đây nhiều người gần như chắc chắn sẽ đăng ký sử dụng Claude. Các LLM trông có vẻ giống nhau trên bề mặt. Nhưng đáng để hỏi xem một mô hình cụ thể thực sự được tối ưu hóa cho điều gì. Nó được thiết kế để gây ấn tượng với bạn trong các bản demo? Để giữ bạn tương tác? Để tạo cảm giác gần gũi? Hay là để hoàn thành công việc? Rõ ràng, Claude thuộc vào loại cuối cùng: Giúp bạn hoàn thành công việc.

Bạn đang tìm kiếm các giải pháp mạng, hạ tầng viễn thông tối ưu hay các ứng dụng công nghệ AI tiên tiến cho doanh nghiệp? Hãy liên hệ ngay với TTC Việt Nam (ttcvn.net) để được tư vấn từ đội ngũ chuyên gia hàng đầu trong ngành.

NỘI DUNG

  • Đang tải Mục lục...

ĐĂNG KÝ TRẢI NGHIỆM
DỊCH VỤ

HƠN 5.000+ DOANH NGHIỆP ĐÃ VÀ ĐANG ĐỒNG HÀNH CÙNG TTC VIỆT NAM ĐỂ XÂY DỰNG HỆ THỐNG

NHẬN TƯ VẤN MIỄN PHÍ