你瀏覽的是我們在Google的加速版網頁,你可以點選Logo回到主網站取得更多的資訊
加入LINE@好友 隨時掌握SEO最新趨勢

[持續更新中]Google I/O 2025:Gemini AI 全面升級,打造更智慧的通用人工智慧助手

2025 年 5 月 20 日至 21 日,Google 在加州山景城舉辦了年度開發者大會 Google I/O 2025,並在臺灣時間 2025 年 5 月 21 日凌晨 1 點開始。本次以 Gemini AI 為核心,展示了其人工智慧技術的最新進展,特別是 Gemini AI 平台的重大升級。Google 透過一系列更新,強化 Gemini 模型的多模態能力、代理功能(Agentic Capabilities)以及與 Google 生態系統的深度整合,打造一個更個人化、主動且高效的通用 AI 助手。讓我們來了解一下本次大會中 Gemini AI 的核心更新與亮點吧 !

 

Gemini 2.5 系列模型:性能突破與 Deep Think 模式

Google 在大會中宣布推出 Gemini 2.5 系列模型,包括 Gemini 2.5 Pro 與 Gemini 2.5 Flash,兩者在性能、速度與應用場景上均有顯著提升。Google DeepMind 首席執行官 Demis Hassabis 表示,Gemini 2.5 Pro 是目前 Google 最智能的模型,在 LMArena 和 WebDev Arena 當中更是取得排名第一的成績,在程式設計、數學推理及多模態任務上也有卓越表現。Gemini 2.5 Pro 能處理高達數百萬 token 的上下文,並能生成從簡單文本到完整應用程式的內容,足以證明出其強大的能力。

另外,Google 推出了一項名為「Deep Think」的增強推理模式,專為 Gemini 2.5 Pro 設計。Deep Think 模式讓模型在回答問題前能夠考慮多種可能答案,從而提升在複雜數學和程式設計任務上的表現。Deep Think 模式使 Gemini 2.5 Pro 在 LiveCodeBench 這項專門評測程式設計的指標當中,能與 OpenAI 的 o4-mini 等模型競爭。Deep Think 模式尚未正式推出,但預計將成為高階用戶的強大工具,讓我們期待一下它的表現吧!

Gemini 2.5 Flash 則針對開發者需求進行優化,強調速度與成本效益。該模型在程式設計、多模態推理和長上下文處理上均有提升,適合高頻任務場景。Google 同時宣布 Gemini Diffusion 模型,號稱速度比同類模型快 4 至 5 倍,現已開放給測試者測試當中。

 

Project Astra:多模態 AI 的未來藍圖

Google DeepMind 展示了 Project Astra,這是一款低延遲、多模態的 AI 體驗,目標為 Google Search、Gemini 應用程式及第三方開發者產品提供動力。Project Astra 最初於 2024 年 Google I/O 透過智慧眼鏡亮相,近乎即時的視覺與語音處理能力在當時引起軒然大波。2025 年,Google 進一步將 Project Astra 的功能融入 Gemini Live,使其能在 Android 和 iOS 平台上透過相機和螢幕分享提供即時協助。例如,使用者可將手機相機對準物品(如一副 Sony 耳機),並詢問其型號或細節,Gemini Live 能即時分析並回應。

Project Astra 還為開發者提供了升級版的 Live API,支援低延遲語音互動、情感檢測以及來自 Gemini 推理模型的思考能力。這些功能讓開發者能打造更自然的 AI 應用,應用範圍涵蓋從即時客服到教育工具等多種場景。Google 也宣布與三星和 Warby Parker 合作,開發基於 Project Astra 的智慧眼鏡,雖然尚未公布具體上市日期,但已引起市場高度關注。

 

代理功能(Agentic Capabilities)與 Project Mariner

Google I/O 2025 的另一大焦點是 Gemini 的代理功能升級,特別是 Project Mariner 的推出。Project Mariner 是一款實驗性 AI 代理,能代表使用者瀏覽網頁並執行任務,例如自動購買演唱會門票或預訂餐廳。Google 表示,Project Mariner 能同時處理多達 10 項任務,並具備「教導與重複」(teach and repeat)功能,讓使用者能自訂 AI 的行為模式。該技術目前向美國的 AI Ultra 訂閱者開放,未來將擴展至更多國家,並透過 Gemini API 和 Vertex AI 提供給開發者。

此外,Google 推出「Agent Mode」,讓 Gemini 能更智能地執行複雜任務,例如自動化網頁研究或與 Google 應用程式(如 Gmail 和 Google Docs)整合以完成特定任務。例如,使用者可要求 Gemini 在購物網站上監控商品價格,並在價格降低時自動完成購買,極大提升了使用者的便利性。

 

Gemini Live 免費開放與多模態升級

Google 宣布,Gemini Live 的相機和螢幕分享功能現已對所有 Android 和 iOS 使用者免費開放。此功能允許使用者透過手機相機或螢幕內容與 Gemini 互動,例如詢問圖片中的細節或要求 AI 分析螢幕上的購物頁面。Google 舉例,使用者可拍攝朋友發來的吉他照片,詢問其品牌、顏色或背景細節,甚至要求 Gemini 分析購物應用中的商品材質或折扣資訊。

Gemini Live 還新增了個人化智能回覆功能,預計於今年夏天在 Gmail 中推出。該功能會根據使用者的歷史郵件和 Google Drive 內容生成更符合上下文的回覆建議,提升工作效率。此外,Google 計畫在未來幾週內讓 Gemini Live 與更多 Google 應用程式深度整合,進一步提升其跨平台能力。

Deep Research 與個人化研究體驗

Gemini 的 Deep Research 功能也迎來更新,允許使用者上傳個人 PDF 文件或圖片,結合公開數據生成更個人化的研究報告。這項功能特別適合需要深入分析的專業人士,例如研究人員或學生。Deep Research 能自動從多個來源彙總資訊,減少使用者逐一瀏覽網頁的時間,實現更高效的資訊整合。

 

Google Chrome 與 Gemini 整合

Google 宣布將 Gemini 深度整合至 Chrome 瀏覽器,推出全新的 AI 瀏覽助手功能。使用者只需點擊 Chrome 右上角的 Gemini 圖標,即可開啟浮動式聊天視窗,快速執行網頁相關任務。這項功能特別針對線上任務的繁瑣性進行優化,例如在瀏覽購物網站時,使用者可要求 Gemini 總結商品的關鍵特點(如價格、評價、材質),或將食譜網站上的內容改編為無麩質或低熱量版本。

此外,Gemini 還能分析網頁中的複雜資訊,例如將一篇長篇新聞文章濃縮為幾句摘要,或將技術白皮書轉化為易懂的圖表。

Chrome 的 Gemini 整合還支持多語言環境,初期以英語為主,未來將擴展至更多語言。Google 表示,這項功能旨在將瀏覽器從單純的網頁顯示工具轉變為智能化的工作平台。例如,開發者可直接在 Chrome 中要求 Gemini 生成程式碼片段並嵌入網頁,或要求 AI 分析競爭對手的網站結構,快速提取關鍵資訊。此功能目前僅對 Google AI Pro 和 AI Ultra 訂閱者開放,但 Google 計畫在未來幾個月內向更多免費用戶推出部分功能。
 

AI Ultra 訂閱計劃:高階 AI 體驗

為滿足進階用戶的需求,Google 推出了每月 249.99 美元的「AI Ultra」訂閱計劃,提供對 Gemini 2.5 Pro Deep Think 模式、Veo 3 視頻生成工具、Flow 影片編輯應用以及 Project Mariner 的最高使用額度。AI Ultra 計劃還包括 YouTube Premium 訂閱,以及高達 30TB 的 Google Drive、Google Photos 和 Gmail 儲存空間,適合需要大規模數據存儲和 AI 功能的專業人士。此外,Google 升級了每月 19.99 美元的 AI Pro 計劃,新增對 Flow 影片編輯工具和 Chrome 中 Gemini 功能的訪問權限。

AI Ultra 計劃的亮點之一是對 Project Mariner 的支持,這是一款實驗性 AI 代理,能代表使用者執行網頁任務,例如自動購買演唱會門票或預訂餐廳。Google 表示,Project Mariner 能同時處理多達 10 項任務,並具備「教導與重複」功能,讓使用者可自訂 AI 的行為模式。這項功能目前僅在美國對 AI Ultra 訂閱者開放,未來將透過 Gemini API 和 Vertex AI 向開發者推廣。

 

其他亮點:Imagen 4 與 Android XR

Google 在 I/O 2025 中推出了新款圖像生成模型 Imagen 4,號稱能生成更細緻的圖像細節,例如布料的紋理、水滴的折射效果以及動物毛髮的逼真質感。Imagen 4 已在 Gemini 應用程式、Google Workspace 和 Vertex AI 平台上線,支援從簡單插圖到高解析度設計的生成需求。例如,設計師可要求 Imagen 4 生成一張逼真的產品渲染圖,用於廣告或電子商務平台。Google 表示,Imagen 4 的生成速度比前代提升了 30%,並在生成質量上超越了競爭對手的類似模型。

在硬體方面,Google 展示了基於 Android XR 平台的智慧眼鏡原型,與三星和 Warby Parker 合作,結合 Project Astra 的多模態能力。這款智慧眼鏡支援即時語音互動、視覺識別和擴增實境功能,使用者可透過眼鏡發送訊息、錄製影片或關閉通知。例如,使用者可對著眼鏡說「記錄這場會議」,Gemini 會自動啟動錄影並將內容儲存至 Google Drive。Android XR 眼鏡還能與 Google Maps 整合,提供即時導航提示,預示了 AI 在可穿戴設備上的廣闊應用前景。雖然尚未公布具體上市日期,但 Google 表示將與更多硬體合作夥伴探索商業化可能性。

 

未來展望

Google I/O 2025 的焦點無疑是 Gemini AI 的全面升級,顯示 Google 在 AI 領域與 OpenAI、Microsoft、Meta 等競爭對手的激烈角逐中全力以赴。Gemini 應用程式目前已擁有超過 4 億月活躍用戶,AI 總覽功能每月觸及 15 億用戶,顯示其市場影響力正迅速擴大。Google 執行長 Sundar Pichai 強調,Gemini 2.5 Pro 的目標是成為能夠規劃、創造新體驗並模擬世界的「世界模型」。


Google I/O 2025 展示了 Google 在人工智慧領域的雄心,Gemini AI 透過多模態能力、代理功能及與 Google 生態系統的深度整合,正朝著通用 AI 助手的目標邁進。從 Deep Think 模式的推理突破到 Project Astra 的即時互動,再到 Chrome 和 Gmail 的 AI 整合,Google 正在重塑使用者與技術的互動方式。隨著 AI Ultra 計劃的推出,Google 也為高階用戶提供了前所未有的 AI 體驗。未來,Google 的 AI 策略將如何影響搜尋、生產力工具及可穿戴設備市場,值得持續關注。