Thứ Tư, 19 tháng 11, 2025

Bài giới thiệu Gemini 3 của Google

Giới thiệu Gemini 3: Mô hình thông minh nhất của chúng tôi giúp bạn hiện thực hóa bất kỳ ý tưởng nào

Demis Hassabis, CEO Google DeepMind và Koray Kavukcuoglu, CTO Google DeepMind kiêm Chief AI Architect, Google, thay mặt đội ngũ Gemini

Hôm nay, chúng tôi tiến thêm một bước lớn trên hành trình hướng đến Trí tuệ nhân tạo tổng quát (AGI) và chính thức ra mắt Gemini 3.

Đây là mô hình tốt nhất thế giới về khả năng hiểu đa phương thức, đồng thời là mô hình lập trình tác nhân (agentic) và “lập trình theo cảm tính” (vibe coding) mạnh mẽ nhất của chúng tôi cho đến nay. Nó mang đến khả năng trực quan hóa phong phú hơn và tương tác sâu hơn, tất cả đều được xây dựng trên nền tảng lập luận tối tân.

Chúng tôi mở đầu kỷ nguyên Gemini 3 bằng việc ra mắt bản trải nghiệm Gemini 3 Pro. Kể từ hôm nay, mô hình này sẽ được tích hợp vào nhiều sản phẩm của Google để bạn sử dụng trong mọi khía cạnh của cuộc sống, từ học tập, xây dựng cho đến lên kế hoạch mọi thứ. Chúng tôi cũng giới thiệu Gemini 3 Deep Think — chế độ lập luận nâng cao, đưa hiệu năng Gemini 3 lên một tầm cao mới. Chế độ này sẽ được gửi đến các đội ngũ đánh giá an toàn trước khi chính thức ra mắt rộng rãi cho người dùng đăng ký Google AI Ultra.


Khả năng lập luận ưu việt với chiều sâu và độ tinh tế chưa từng có

Gemini 3 Pro có thể hiện thực hóa bất kỳ ý tưởng nào nhờ sự vượt trội trong khả năng lập luận và năng lực đa phương thức. Nó cấp tiến hơn 2.5 Pro trên mọi thước đo đánh giá AI quan trọng.

Mô hình dẫn đầu bảng xếp hạng LMArena với điểm số đột phá, 1501. Nó thể hiện năng lực lập luận ở trình độ tiến sĩ (PhD-level) với các điểm số hàng đầu trên Humanity’s Last Exam (37.5% mà không sử dụng bất kỳ công cụ hỗ trợ nào) và GPQA Diamond (91.9%). Đồng thời, nó thiết lập tiêu chuẩn mới cho các mô hình tiên phong trong toán học, đạt 23.4% trên MathArena Apex, mức tốt nhất hiện nay.

Không chỉ giới hạn trong văn bản, Gemini 3 Pro còn tái định nghĩa khả năng lập luận đa phương thức với điểm số vượt bậc trên MMMU-Pro - 81% và 87.6% trên Video-MMMU. Mô hình cũng đạt 72.1% trên SimpleQA Verified, thiết lập chuẩn mới về độ chính xác được chứng thực. Điều này cho thấy Gemini 3 Pro có khả năng giải quyết các vấn đề phức tạp trong hàng loạt lĩnh vực từ khoa học đến toán học với độ tin cậy cao.


Gemini 3 Pro mang đến chiều sâu và độ tinh tế chưa từng có trong từng tương tác. Các phản hồi của mô hình thông minh, súc tích và trực diện, thay thế những câu nói tâng bốc sáo rỗng bằng những góc nhìn giá trị và chân thực. Nó không chỉ trả lời điều bạn muốn nghe, mà còn đưa ra những điều bạn thực sự cần nghe. Gemini 3 Pro hoạt động như một đối tác tư duy thực thụ, mở ra những cách thức mới để bạn hiểu thông tin và thể hiện bản thân — từ việc chuyển hóa các khái niệm khoa học phức tạp thành các hình ảnh trực quan với độ chân thực cao cho đến việc lên ý tưởng sáng tạo.

Gemini 3 Deep Think

Chế độ Gemini 3 Deep Think tiếp tục thách thức giới hạn của trí tuệ. Nó mang đến bước nhảy vọt về khả năng lập luận và hiểu đa phương thức của Gemini 3 để giúp bạn giải quyết những vấn đề phức tạp hơn.

Trong quá trình thử nghiệm, Gemini 3 Deep Think thậm chí còn vượt trội hơn so với hiệu năng vốn đã ấn tượng của Gemini 3 Pro trên Humanity’s Last Exam (đạt 41.0% mà không sử dụng bất kỳ công cụ hỗ trợ nào) và GPQA Diamond (93.8%). Mô hình cũng đạt mức điểm chưa từng có, 45.1% trên ARC-AGI (với khả năng triển khai mã), cho thấy năng lực giải quyết những đề bài hoàn toàn mới.

Gemini 3 giúp bạn học tập, xây dựng và lên kế hoạch cho mọi thứ

Học bất kỳ điều gì

Gemini được tạo nên từ ban đầu với mục đích tổng hợp thông tin một cách liền mạch về bất kỳ chủ đề nào, trên nhiều dạng dữ liệu khác nhau — bao gồm văn bản, hình ảnh, video, âm thanh và mã lập trình. Gemini 3 mở rộng ranh giới của khả năng lập luận đa phương thức, giúp bạn học theo cách phù hợp nhất với mình nhờ khả năng lập luận, năng lực đọc hiểu hình ảnh và không gian vượt trội cùng với hiệu năng đa ngôn ngữ hàng đầu và cửa sổ ngữ cảnh xử lý tối đa 1 triệu token đầu vào.

Ví dụ, nếu bạn muốn học cách nấu ăn theo công thức gia truyền, Gemini 3 có thể giải mã và dịch các công thức viết tay sang nhiều ngôn ngữ khác nhau và tạo nên một sổ tay nấu ăn để các thành viên chia sẻ với nhau. Hoặc nếu bạn muốn tìm hiểu một chủ đề mới, bạn có thể cung cấp cho Gemini các bài nghiên cứu học thuật, video bài giảng dài hoặc các khóa hướng dẫn để nó chuyển đổi thành flashcard tương tác, hình ảnh trực quan hoặc các định dạng khác giúp bạn nắm vững kiến thức. Gemini 3 thậm chí có thể phân tích video trận pickleball của bạn, xác định những điểm cần cải thiện và lên kế hoạch luyện tập để nâng cao kỹ thuật tổng thể của bạn.

Để giúp bạn hiểu thông tin trên web rõ ràng hơn, nay Chế độ AI trong Tìm kiếm sử dụng Gemini 3 để mang đến các trải nghiệm tạo sinh mới lạ trong giao diện người dùng (UI) như bố cục trực quan sống động, các công cụ và giả lập tương tác. Tất cả đều được tạo ra tức thì dựa trên truy vấn của bạn.

Xây dựng bất kỳ điều gì

Tiếp nối thành công của 2.5 Pro, Gemini 3 thực hiện cam kết giúp các nhà lập trình hiện thực hóa mọi ý tưởng. Mô hình vượt trội trong khả năng tạo sinh không cần ví dụ (zero-shot) và xử lý các câu lệnh phức tạp để dựng nên giao diện web tương tác đầy phong phú và sinh động.

Gemini 3 là mô hình lập trình tác nhân (agentic coding) và “lập trình theo cảm tính” (vibe coding) tốt nhất mà chúng tôi từng tạo nên. Nó giúp sản phẩm tự động hóa tốt hơn và tăng mạnh năng suất của các nhà lập trình. Mô hình dẫn đầu bảng xếp hạng WebDev Arena với điểm số ấn tượng, 1487 ELO. Nó cũng đạt 54.2% trên Terminal-Bench 2.0 về khả năng sử dụng công cụ để vận hành máy tính thông qua terminal. Nó xuất sắc vượt qua 2.5 Pro trên SWE-bench Verified (76.2%) — bộ đo lường hiệu quả của các tác nhân lập trình (coding agents).

Bạn có thể bắt đầu lập trình với Gemini 3 ngay trên Google AI Studio, Vertex AI và Gemini CLI cũng như nền tảng lập trình tác nhân mới của chúng tôi - Google Antigravity. Mô hình hiện đã có mặt trên các nền tảng bên thứ ba như GitHub, JetBrains, Manus, Replit và nhiều nền tảng khác.


Biến trí tưởng tượng của bạn thành hiện thực bằng cách xây dựng, tháo rời và “remix” các mô hình voxel 3D chi tiết bằng mã. Hãy thử ngay trong AI Studio.


Xây dựng một thế giới khoa học viễn tưởng tương tác với các shader sử dụng Gemini 3. Trải nghiệm ngay trong AI Studio.



Giới thiệu trải nghiệm lập trình ưu tiên tác nhân (agent-first) hoàn toàn mới

Khi mô hình trí tuệ tăng tốc với Gemini 3, chúng tôi có cơ hội tái định hình toàn bộ trải nghiệm dành cho nhà lập trình. Hôm nay, chúng tôi ra mắt Google Antigravity — nền tảng lập trình tác nhân (agentic) mới cho phép các nhà lập trình làm việc ở cấp độ cao hơn, xoay quanh nhiệm vụ thay vì từng thao tác nhỏ lẻ.

Khai thác các khả năng của Gemini 3 về lập luận nâng cao, sử dụng công cụ và lập trình tác nhân (agentic coding), Google Antigravity biến AI từ một công cụ trong bộ đồ nghề của nhà lập trình thành một đối tác chủ động. Dù bản chất của Google Antigravity vẫn là trải nghiệm Môi trường lập trình tích hợp AI (AI Integrated Development Environment - AI IDE) quen thuộc, các tác nhân hiện đã được đưa lên một không gian chuyên biệt và có quyền truy cập trực tiếp vào trình soạn thảo (editor), terminal và trình duyệt. Giờ đây, các tác nhân có thể thay bạn tự động lập kế hoạch và thực thi đồng thời những tác vụ phần mềm phức tạp từ đầu đến cuối cũng như tự kiểm chứng mã của chính mình.

Bên cạnh Gemini 3 Pro, Google Antigravity cũng được tích hợp chặt chẽ với mô hình Gemini 2.5 Computer Use mới nhất về khả năng điều khiển trình duyệt, và mô hình chỉnh sửa hình ảnh được xếp hạng cao nhất của chúng tôi - Nano Banana (Gemini 2.5 Image).


Google Antigravity sử dụng Gemini 3 để vận hành một quy trình tác nhân từ đầu đến cuối cho ứng dụng theo dõi chuyến bay. Tác nhân tự lập kế hoạch, viết mã ứng dụng và kiểm tra việc thực thi thông qua chức năng kiểm soát máy tính dựa trên trình duyệt.

Lập kế hoạch cho bất kỳ điều gì

Kể từ khi mở ra kỷ nguyên tác nhân với Gemini 2, chúng tôi đã đạt được những tiến bộ vượt bậc — không chỉ trong năng lực lập trình tác nhân (coding agent) của Gemini mà còn ở khả năng lập kế hoạch ổn định hơn cho các tác vụ dài hạn. Gemini 3 đã chứng minh điều này khi xuất sắc dẫn đầu bảng xếp hạng Vending-Bench 2 - bài kiểm tra khả năng lập kế hoạch dài hạn thông qua việc vận hành một mô hình kinh doanh máy bán hàng tự động giả lập. Gemini 3 Pro duy trì việc sử dụng công cụ và ra quyết định nhất quán trong suốt một năm vận hành mô phỏng, tạo ra lợi nhuận cao hơn mà không đi lệch khỏi nhiệm vụ ban đầu.


Gemini 3 Pro thể hiện khả năng lập kế hoạch dài hạn vượt trội, tạo ra mức lợi nhuận cao hơn đáng kể so với các mô hình tiên phong khác.

Điều này đồng nghĩa với việc Gemini 3 có thể hỗ trợ bạn thực hiện các công việc hàng ngày hiệu quả hơn. Bằng cách kết hợp khả năng suy luận sâu sắc với việc sử dụng công cụ ổn định hơn, Gemini 3 có thể thay bạn thực hiện các quy trình phức tạp, nhiều bước như sắp xếp hộp thư của bạn bằng việc phân loại email trong Gmail hoặc lập một lịch trình du lịch. Tất cả đều nằm trong tầm kiểm soát và chỉ dẫn của bạn.

Người dùng Google AI Ultra đã có thể trải nghiệm những tính năng tác nhân này từ hôm nay trong ứng dụng Gemini với Gemini Agent. Qua quá trình nâng cao năng lực tác nhân của Gemini, chúng tôi đã tích lũy được nhiều kinh nghiệm quý báu. Chúng tôi mong đợi phản hồi từ bạn khi triển khai tích hợp mô hình này vào các sản phẩm khác của Google trong thời gian tới.

Phát triển Gemini 3 một cách có trách nhiệm

Gemini 3 là mô hình an toàn nhất của chúng tôi từ trước đến nay và đã trải qua bộ đánh giá an toàn toàn diện nhất từng được áp dụng cho bất kỳ mô hình Google AI nào. Mô hình đã cho thấy sự giảm thiểu khuynh hướng xu nịnh theo ý người dùng (sycophancy), tăng cường khả năng chống chịu trước các cuộc tấn công chèn lệnh (prompt injection) và nâng cấp khả năng bảo vệ trước các hành vi lạm dụng thông qua tấn công mạng.

Bên cạnh các quy trình kiểm thử nội bộ cho những lĩnh vực trọng yếu trong Frontier Safety Framework, chúng tôi cũng hợp tác đánh giá cùng các chuyên gia hàng đầu thế giới. Chúng tôi đã cấp quyền truy cập sớm cho các tổ chức như UK AISI và nhận được các đánh giá độc lập từ những đơn vị uy tín trong ngành như Apollo, Vaultis, Dreadnode, cùng nhiều đối tác khác.

Kỷ nguyên mới của Gemini

Đây mới chỉ là khởi đầu của kỷ nguyên Gemini 3. Từ hôm nay, Gemini 3 đã chính thức được triển khai dần để bạn trải nghiệm:
  • Dành cho các nhà lập trình trong Gemini API trên AI Studio, nền tảng lập trình tác nhân mới - Google Antigravity, và Gemini CLI.
Với chế độ Gemini 3 Deep Think, chúng tôi đang dành thêm thời gian để hoàn thiện các đánh giá an toàn và thu thập phản hồi từ các nhóm thử nghiệm, trước khi chính thức cung cấp cho người dùng đăng ký Google AI Ultra trong vài tuần tới.

Chúng tôi dự kiến sẽ tiếp tục ra mắt thêm nhiều mô hình khác thuộc dòng Gemini 3 trong thời gian tới để giúp bạn làm được nhiều điều hơn nữa với AI. Chúng tôi rất mong chờ nhận được phản hồi từ bạn cũng như được chứng kiến những điều bạn sẽ học hỏi, phát triển và lập kế hoạch cùng Gemini.

Demis Hassabis - Koray Kavukcuoglu
Google

Không có nhận xét nào:

Đăng nhận xét