Gemini是谷歌DeepMind團隊基于2012年啟動的人工智能研究計劃開發(fā)的多模態(tài)大模型,為應對ChatGPT挑戰(zhàn),谷歌于2023年1月促使聯(lián)合創(chuàng)始人回歸并加速AI開發(fā),歷經(jīng)PaLM、PaLM 2(2023年5月發(fā)布)等迭代階段,于2023年12月6日正式發(fā)布。
該模型基于Transformer架構,采用原生多模態(tài)設計,支持文本、圖像、音頻、視頻及代碼的聯(lián)合處理。初代Gemini 1.0包含Ultra(復雜任務)、Pro(通用場景)和Nano(移動端)三個版本,自2023年12月13日起通過Google AI Studio和Vertex AI平臺向開發(fā)者開放API。
2024年2月,谷歌將旗下聊天機器人Bard更名為Gemini,推出Advanced版本,并發(fā)布Gemini 1.5。2024年12月,谷歌發(fā)布Gemini 2.0。2025年3月新增Gemini Embedding模型及推理模型Gemini 2.5。2025年11月18日,谷歌正式發(fā)布Gemini 3。模型生態(tài)整合至谷歌搜索、廣告系統(tǒng)、Chrome瀏覽器、智能家居及Android Auto車載系統(tǒng),并在圖像生成、編程輔助、長文本分析等場景廣泛應用。