Google於美國時間5月20日舉行年度 I/O 開發者大會。大會中介紹以Gemini為中心的各項計畫,包括發表Gemini的最新模型、影片和圖像的應用,以及Gemini Live等客製AI代理、Android XR平台的應用和AI搜尋等。
Google和Alphabet執行長皮查伊(Sundar Pichai)20日以AI的發展為主軸進行說明。他提到Gemini 2.5 Pro在主要的基準測試中名列前茅,以及支持模型演進的Google基礎設施的優勢。第七代TPU「Ironwood」與前一代相比性能提高10倍,正是憑藉這些基礎設施的優勢,Google才能在降低模型價格的同時,提供高速的模型。
Gemini 2.5和Gemini應用程式最新功能
Google在開發者大會上,公布「Gemini 2.5 Pro」最新功能。除了2.5 Flash在更新後進化之外,Gemini 2.5 Pro將新增增強推理模式「Deep Think」。此外,還將提供原生語音輸出、MCP支援等功能。
在Gemini應用程式中,將在Android和iOS平台免費提供Gemini Live的相機和螢幕共享功能,並新增新的圖像生成技術「Imagen 4」和影片生成技術「Veo 3」。作為AI訂閱計畫的一部分,還將推出價格為19.99美元(約600元新台幣)的「Google AI Pro」和249.99美元(約7500元新台幣,僅限美國用戶)的「Google AI Ultra」。
除了「Veo 3」和「Imagen 4」外,Google還發表影像製作工具「Flow」。只要提供簡單的故事就能生成出影片。此外,還能使用AI進行高級影像製作。
 「Google Beam」登場 Meet將提供翻譯功能。
Google進行的AI研究已進入實際產品實施階段,其中一個例子是「Google Beam」。這項技術將把多年前在Google I/O發表的突破性3D影片技術「Project Starline」產品化。
Project Starline的目標是實現「即使身處不同地方,也能宛如待在同一房間中的體驗」。而這次則推出視訊平台「Google Beam」將以AI為核心,把2D影像串流轉換為充滿臨場感的3D體驗。
這項技術利用6台攝影機和AI結合影片,並透過3D光場顯示器呈現。透過每秒60幀的頭部追蹤,實現自然且具沉浸感的對話體驗。Google與HP合作,計畫於今年下半年向部分客戶提供首款Google Beam設備。
另一方面,Google Meet 將在近期導入語音翻譯功能。此功能可幾乎實時地匹配說話者的聲音、語調和表情,實現超越語言限制的自然流暢對話。英語和西班牙語的翻譯功能將以測試版形式提供給Google AI Pro和Ultra用戶,並預計在未來幾週內添加更多語言。Workspace 的商業用戶預計將於今年內開始早期測試。
Google live融入Project Astra技術 AI代理功能將上線
2024年發表的AI助理研究計畫「Project Astra」,也透過「Gemini Live」實現產品化。Google將相機和螢幕共享功能整合到Gemini Live中,並應用於面試準備和馬拉松訓練等場景。該功能已經提供給Android用戶,並於20日起向iOS用戶開放。
在2024年12月發表的「Project Mariner」,是將網頁瀏覽器轉變為AI代理(AI Agent)的計畫,也在逐步強化並應用於各種服務。此研究探索以瀏覽器為起點的人類與代理的互動未來,搭載可以同時處理不同任務的代理系統,這項技術目前能同時處理多達10種任務,包括預訂機票、調查研究、線上購物等。
Project Mariner正在推進將代理功能引入至Chrome、Google搜索和Gemini應用中。在Gemini應用的全新代理模式中,若用戶正在尋找租賃物件,代理可以幫助在不動產網站上找到符合條件的物件、調整篩選條件,並使用MCP存取物件資訊,協助預約看房。部分Google AI Ultra用戶很快就能使用此功能。
AI 將加強個人化功能 Google搜尋也將導入AI
Google服務將強化個人化功能。Gemini在用戶管理下,能在整個Google應用程式中利用相關的個人背景資訊。其中一個例子是 Gmail 的全新個人化「Smart Replies」。舉例來說,當友人發信詢問旅行地點的建議時,Gemini會搜索用戶過去的郵件或Google雲端硬碟上由Google文件製作的行程,來建議合適的回覆。
這些建議會考慮到用戶平常的問候語、語氣、風格和常用詞彙,生成出合適且屬於用戶個人風格的回覆。個人化的Smart Replies預計將於2025年下半年向部分用戶開放。
Google搜尋也在美國全面推出「AI 模式」。在AI模式中,問題會被拆解成子主題,並同時執行多個查詢。這將比傳統的Google搜尋更深入地探索網絡,發現與問題高度相關的內容。此外,還將推出「Deep Search」,能夠執行數百次搜尋,跨多樣化資訊進行分析,並在數分鐘內生成附有專家級引用的報告。
推出新平台「Android XR」 打造全新智慧眼鏡
XR 是包含 AR(擴增實境)、VR(虛擬實境)、MR(混合實境)的綜合用語,指的是透過頭戴式裝置或智慧眼鏡,將數位內容疊加到現實世界中的技術。
Google技術平台「Android XR」(延展實境)計畫於今年內推出,展現出Google將強化智慧眼鏡的決心。據了解,Google將與三星、時尚眼鏡品牌Gentle Monster 和Warby Parker合作,推出具有設計感的智慧眼鏡。
具體應用包括透過即時翻譯功能,將聽到的外語翻譯顯示在眼鏡上、在移動過程中發送訊息、或在眼鏡的地圖上導航到目的地等。
◤美國大都會名作登場◢
◤啟動夏日換季保養◢