Gemini 3 Pro vs Gemini 3 Ultra cho coding: khi nào cần Ultra

Chia sẻ bài viết

TL;DR

Gemini 3 Pro xử lý 80% task coding hằng ngày (refactor nhỏ, generate boilerplate, fix bug đơn giản) với tốc độ nhanh và chi phí thấp. Gemini 3 Ultra chỉ cần khi: refactor cross-file phức tạp, design system architecture, debug đa tầng, đọc codebase lớn vào context, hoặc reasoning chuỗi dài cho thuật toán. Dev VN nên default Pro, switch Ultra khi Pro fail 2 lần liên tiếp.

Khi mở Antigravity IDE lần đầu, dev thường lúng túng giữa hai option model: Gemini 3 Pro và Gemini 3 Ultra. Google không nói rõ khi nào dùng cái nào, chỉ ghi "Ultra mạnh hơn, chậm hơn, tốn quota hơn". Câu trả lời thực tế phức tạp hơn vậy, vì với coding task, sự khác biệt phụ thuộc vào dạng task chứ không chỉ độ khó cảm tính.

Bài viết này phân loại task lập trình thành 7 nhóm phổ biến, so sánh hiệu quả Pro vs Ultra trên từng nhóm dựa trên kinh nghiệm sử dụng thực tế và benchmark public. Mục tiêu giúp bạn ra quyết định nhanh: task này gõ /pro hay /ultra. Tiết kiệm quota Ultra cho khi thật sự cần, dùng Pro xuyên suốt phần còn lại.

Nguyên tắc chung trước: Ultra không phải "Pro nhanh hơn 2x". Cùng task, Ultra có thể chậm hơn Pro 30-50% (do reasoning chain dài hơn), nhưng đổi lại kết quả ít phải sửa lại. Cost-effectiveness phụ thuộc tỉ lệ "task ra đúng lần đầu". Nếu Pro fail rồi bạn phải retry 3 lần, tổng cost còn hơn Ultra 1 lần.

Sự khác biệt kiến trúc giữa Pro và Ultra

Gemini 3 Pro và Ultra cùng base architecture, khác nhau ở số parameter, training compute và chế độ reasoning. Pro được tối ưu cho tốc độ throughput, Ultra mở rộng reasoning chain và mixture-of-experts active. Trên benchmark coding như SWE-bench Verified, gap thường là 8-15 điểm phần trăm, đủ để tạo khác biệt thực tế trên task khó nhưng không phải lúc nào cũng cần.

Context window cả hai đều support 1M+ token, nhưng Ultra giữ độ chính xác attention tốt hơn ở vùng đầu/cuối context dài. Khi đẩy 800k token vào prompt (codebase lớn), Pro có thể quên detail ở giữa, Ultra ít quên hơn. Đây là một trong những trường hợp mà Ultra đáng quota.

Bảng so sánh nhanh theo loại task coding

Loại task	Pro	Ultra	Khuyến nghị
Generate boilerplate	Tốt	Tốt (chậm hơn)	Pro
Fix bug 1 file	Tốt	Tốt	Pro
Refactor 1 hàm	Tốt	Tốt	Pro
Refactor cross-file (3-5 file)	Trung bình	Tốt	Ultra
Refactor module lớn (10+ file)	Yếu	Tốt	Ultra
Design system architecture	Trung bình	Tốt	Ultra
Debug bug phức tạp (race, deadlock)	Trung bình	Tốt	Ultra
Viết test unit đơn giản	Tốt	Tốt	Pro
Viết integration test phức tạp	Trung bình	Tốt	Ultra
Code review PR nhỏ	Tốt	Tốt	Pro
Code review PR lớn (1000+ LOC)	Trung bình	Tốt	Ultra
Tạo CRUD endpoint	Tốt	Tốt	Pro

Nhóm 1: task lặp đi lặp lại - Pro luôn đủ

Generate component React từ mô tả, viết regex, sinh SQL CRUD, tạo Dockerfile mẫu, viết .gitignore... đây là task mà mọi model SOTA đều làm tốt. Khác biệt Pro vs Ultra là 0 hoặc không đáng kể. Default Pro, không có lý do gì dùng Ultra.

Ví dụ thực tế: yêu cầu "viết hàm validate email và phone Việt Nam, có regex và unit test". Pro ra kết quả trong 5-8 giây, Ultra trong 12-15 giây, cả hai code chạy đúng. Quota Ultra ~3-4x Pro, không công bằng cho task này.

Nhóm 2: refactor cross-file - Ultra ăn điểm

Refactor đổi tên class trong codebase 5-10 file, hoặc tách interface từ implementation, hoặc move logic từ controller sang service layer. Pro hay bị: bỏ sót 1-2 file, dependency import không update đầy đủ, conflict naming. Phải prompt thêm lần 2 để fix.

Ultra giữ map cross-file tốt hơn trong reasoning chain. Cùng task, Ultra thường hoàn thành 1 shot, dev chỉ review diff không phải retry. Tổng thời gian end-to-end Ultra nhanh hơn vì không có cost retry.

Nhóm 3: design architecture - Ultra cần thiết

Thiết kế microservice mới, chọn pattern (event sourcing vs CRUD, monolith vs split), database schema lớn 20+ bảng, API contract phức tạp. Đây là task đòi hỏi reasoning đa tầng: cân nhắc tradeoff, đề xuất phương án, vẽ sequence diagram.

Pro ra được output nhưng thường "lựa chọn an toàn" không phân tích sâu tradeoff. Ultra đào sâu hơn: nêu pro/con từng phương án, đề xuất câu hỏi clarify trước khi commit. Quality gap ở đây rõ rệt nhất, khuyến nghị mạnh Ultra.

Nhóm 4: debug bug phức tạp

Bug đơn giản (null pointer, off-by-one) Pro fix tốt. Bug phức tạp như race condition trong async code, deadlock trong transaction database, memory leak Node.js, websocket disconnect không rõ nguyên nhân... cần reasoning đọc nhiều log + nhiều file + tự build hypothesis.

Ultra ở đây thắng vì chain-of-thought sâu: nó tự đề xuất "có thể là X, để check thêm log Y", chạy tool call để verify, loop iterate. Pro hay đoán nhanh, sai, prompt thêm mới đào sâu. Workflow Ultra mất 3-5 phút end-to-end nhưng dev không phải interrupt.

Nhóm 5: đọc codebase lớn vào context

Khi onboard project lạ, bạn đẩy toàn bộ src/ (500k token) vào context và hỏi "giải thích kiến trúc, vẽ component graph". Pro retrieve attention không đều, dễ bỏ sót module quan trọng nằm giữa context. Ultra giữ attention tốt hơn ở context dài.

Tip: trước khi đẩy 500k token, dùng tool /search hoặc grep để filter trước, chỉ đưa file cần. Cách này Pro làm được, vì context giảm còn 50-80k, vùng "an toàn" của attention.

Nhóm 6: viết test

Test unit đơn lẻ (test 1 hàm pure): Pro thừa sức. Integration test (test flow CRUD qua API): Pro hay tốt. End-to-end test với browser automation, race condition, mock service phức tạp: Ultra cho coverage edge case tốt hơn.

Một use case Ultra rõ: yêu cầu "viết property-based test cho hàm parse này, sinh 100 input ngẫu nhiên kiểm tra invariant". Ultra hiểu khái niệm property-based, ra test có hypothesis library setup chỉn chu. Pro hay viết regular test với vài input hard-code.

Nhóm 7: code review

Review PR nhỏ (200-500 LOC, 3-5 file): Pro đủ, nhanh và chính xác cho lỗi syntax/style/logic đơn giản. PR lớn (1000+ LOC, 10+ file đụng nhiều module): Ultra phát hiện regression và side-effect tốt hơn.

Workflow tốt: dùng Pro cho review pass 1 (filter lỗi rõ ràng), Ultra cho review pass 2 trên các PR senior đánh dấu cần đào sâu. Tiết kiệm Ultra cho phần thực sự khó.

Cách switch model trong Antigravity

Trong Antigravity, model selector ở góc trên panel chat. Click vào dropdown, chọn Gemini 3 Pro hoặc Ultra. Lệnh slash /model pro hoặc /model ultra cũng switch nhanh. Khi đang trong reasoning chain, switch giữa chừng có thể làm reset context một phần, nên switch trước khi gõ prompt.

# Trong Antigravity chat
/model pro
viết hàm validate phone số Việt Nam, có test
# Pro xử lý task đơn giản này

/model ultra
refactor toàn bộ folder src/auth/ tách interface
ra interfaces/, implementation giữ ở concrete/.
Update mọi import. Giữ test pass.
# Ultra xử lý task cross-file phức tạp

Tối ưu chi phí quota: chiến lược hybrid

Cách dùng tiết kiệm nhất với tier Pro/Ultra hữu hạn quota:

Default mọi prompt mở phiên là Pro
Khi Pro ra kết quả sai 2 lần liên tiếp trên cùng task, switch Ultra
Khi prompt liên quan kiến trúc/design ngay từ đầu, dùng Ultra luôn
Task lặp lại trong day (CRUD, boilerplate): Pro toàn bộ, không nghĩ
Đặt ngân sách Ultra: ví dụ 30% quota Ultra dành cho review, 50% cho debug khó, 20% dự phòng
Cuối tuần review quota, điều chỉnh tỉ lệ Pro/Ultra theo loại task chính

Khi cần multi-agent: mix Pro và Ultra

Activity Feed Antigravity cho phép spawn nhiều subagent song song. Best practice là gán Ultra cho subagent leader (đọc requirement, ra plan), Pro cho subagent worker (execute task con). Ví dụ:

Agent A (Ultra): đọc spec, break thành 5 task con
Agent B (Pro): build component 1
Agent C (Pro): build component 2
Agent D (Pro): viết test cho 1+2
Agent E (Ultra): integrate và review tổng

Tỉ lệ 2 Ultra + 3 Pro tiết kiệm 40-50% quota so với 5 Ultra mà chất lượng end-to-end gần tương đương, vì task con đơn giản Pro làm thừa sức.

Edge case: khi Pro thực sự không đủ

Có 3 trường hợp gặp thực tế mà Pro fail liên tục, bắt buộc Ultra:

Migrate framework lớn (Express -> NestJS, React class -> hook): vì cần hiểu pattern cũ-mới và port toàn bộ codebase đúng
Debug performance issue (query Postgres chậm, React render lag): cần phân tích trace, profile, đề xuất index/memoization
Reverse engineer API không có docs: đọc network log, đoán schema, sinh client SDK

Trong 3 case này, đừng tiếc quota Ultra. Một lần Ultra ăn đứt 5 lần Pro retry.

Benchmark thực tế trên project nhỏ

Test cá nhân: 50 task coding ngẫu nhiên trong tuần (mix mọi nhóm trên), đo "task hoàn thành đúng lần đầu":

Nhóm task	Pro 1-shot OK	Ultra 1-shot OK
Boilerplate (15 task)	14/15 (93%)	15/15 (100%)
Fix bug đơn giản (10 task)	9/10 (90%)	10/10 (100%)
Refactor cross-file (8 task)	4/8 (50%)	7/8 (87%)
Design architecture (5 task)	2/5 (40%)	4/5 (80%)
Debug phức tạp (7 task)	3/7 (43%)	6/7 (86%)
Viết test (5 task)	4/5 (80%)	5/5 (100%)

Pattern rõ: trên task đơn giản gap chỉ 5-7%, trên task khó gap 30-40%. Lý do mạnh để dành Ultra cho task khó, không phí trên task đơn giản.

FAQ

Tier Free Antigravity có dùng được Ultra không?

Tier Free thường chỉ unlock Gemini 3 Pro. Ultra cần Pro hoặc Ultra plan trả phí. Pricing và quota chính xác xem trang Google Antigravity vì có thể đổi theo region.

Ultra có chậm hơn Pro nhiều không?

Tuỳ task. Task ngắn (sinh boilerplate) Ultra chậm hơn 1.5-2x. Task dài có reasoning chain Ultra có thể nhanh hơn Pro vì tránh retry. Trung bình end-to-end, Ultra chậm hơn 30-50%.

Có thể auto-switch model dựa trên độ khó prompt không?

Antigravity chưa có auto-switch built-in. Bạn phải chủ động chọn. Có thể viết script extension để parse prompt và switch, nhưng overhead thiết kế heuristic phức tạp.

Ultra có hiểu code Việt Nam (comment tiếng Việt, biến tiếng Việt) tốt hơn Pro không?

Cả hai hiểu tiếng Việt như nhau, vì cùng base training data. Tuy nhiên Ultra trả lời tiếng Việt formal, ngữ pháp chuẩn hơn. Pro đôi khi mix nửa Việt nửa Anh nếu prompt không rõ.

Multi-agent dùng cùng model có hơn dùng 1 model không?

Có. Multi-agent giúp parallelize, mỗi agent focus task hẹp, kết quả tổng hợp tốt hơn 1 agent đơn handle toàn bộ. Mix Pro/Ultra càng tối ưu chi phí.

Có ai khuyến nghị "luôn dùng Ultra" để khỏi nghĩ không?

Cách này phù hợp nếu bạn có gói Ultra unlimited (enterprise). Với dev cá nhân quota giới hạn, "luôn Ultra" sẽ hết quota nhanh trong vài tiếng. Strategy hybrid Pro+Ultra tối ưu hơn về cost-effectiveness dài hạn.

Cloud VPS cho Gemini Antigravity

Cloud VPS sẵn cho project sample test Gemini Pro/Ultra

Cloud VPS TND sẵn AlmaLinux 9, Ubuntu 22/24, Debian 12/13. SSD CEPH, snapshot 1-click, backup hằng ngày, network 200Mbps trong nước. Dev cài Antigravity remote SSH lên VPS để test workflow Pro/Ultra trên codebase thật, không phụ thuộc máy local.

Xem 8 cấu hình Cloud VPS →

Cloud VPS Việt Nam

VPS Fresh IP Việt Nam

Cloud VPS US

VPS Fresh IP US