Google Gemini là mô hình AI mới nhất của Google, được giới thiệu ngày 6/12/2023. Gemini là mô hình AI tổng quát nhất của Google từ trước đến nay, được đào tạo trên tập dữ liệu khổng lồ bao gồm văn bản, code, âm thanh, hình ảnh và video.

Gemini có khả năng vượt trội so với các mô hình AI khác ở nhiều khía cạnh, bao gồm:

  • Khả năng hiểu ngôn ngữ đa nhiệm lớn (MMLU): Gemini đạt điểm 90% trong bài kiểm tra MMLU, vượt qua con người ở cấp độ chuyên gia.
  • Khả năng hiểu ngôn ngữ đa phương thức trên đa ngành (MMMU): Gemini đạt điểm 59,4% trong bài kiểm tra MMMU, vượt 30 trong số 32 tiêu chuẩn trong nghiên cứu và phát triển mô hình ngôn ngữ lớn.
  • Khả năng nhận diện văn bản, hình ảnh, âm thanh cùng một thời điểm.
  • Khả năng giải thích, và viết code bằng những ngôn ngữ lập trình phổ biến.

Gemini được cung cấp dưới ba kích cỡ khác nhau, gồm:

  • Gemini Ultra: Phiên bản mạnh nhất, dành cho các tác vụ phức tạp nhất.
  • Gemini Pro: Phiên bản dành cho các tác vụ chung.
  • Gemini Nano: Phiên bản dành cho các tác vụ trên thiết bị di động.

Hiện tại, Gemini Ultra đang trong quá trình hoàn tất thử nghiệm về độ an toàn trước khi tung ra chính thức. Gemini Nano sẽ được trang bị trên Pixel 8 Pro vào năm sau. Gemini Pro hiện đã được sử dụng trong chatbot Bard, và sẽ được nâng cấp lên phiên bản Gemini Ultra mạnh nhất vào năm sau.