又到谷歌 I/O 的“大秀”時間。毫無疑問,AI是備受矚目的焦點。
美東時間週二,谷歌年度 I/O 開發者大會拉開帷幕。
繼OpenAI搶先一步“上新”後,谷歌開啟正面回擊。從新的搜索和聊天功能到面向雲客户的AI硬件,谷歌一口氣推出了多款AI新品。
對此,谷歌CEO皮查伊表示,谷歌所有的工作都圍繞生成式AI模型Gemini來做。
去年,谷歌的I/O大會帶來了Gemini;今年的I/O大會幾乎每一分鐘都在講 AI。
這是Gemini 統計出來的數字——在長達 110 分鐘的主題演講中,總共提了121 次 AI 。
會上,谷歌Gemini 家族大上新。
其中,包括了AI搜索引擎、Gemini 1.5 Pro 更新版、Gemini 1.5 Flash、Gemma 2以及全新的Project Astra、Google Veo、magen 3等模型。
AI搜索引擎“AI Overviews”
谷歌正式推出“AI Overviews”搜索體驗。
據介紹,AI Overviews搜素引擎具備多步驟推理能力以及計劃能力。此外,靠Gemini的多模態功能,谷歌可以做到利用聲音搜歌曲,利用圖片搜產品。
Gemini 1.5 Pro 更新
Gemini 1.5 Pro上下文窗口擴展支持200萬token,號稱“迄今為止所有基礎模型中最長的上下文窗口”。
谷歌還通過數據和算法的改進增強了其代碼生成、邏輯推理和規劃、多輪對話以及音頻和圖像理解能力。
對於複雜指令,可遵循更復雜的指令,控制回覆風格,設置系統指令。
谷歌稱,今年夏季將擴展 Gemini 的多模態功能,包括增加用語音進行深入雙向對話的能力,這一功能被稱之為 Gemini Live。
目前,有超過 150 萬的開發人員在使用 Gemini 模型,超過 20 億的產品用户都用到了 Gemini。
新成員:Gemini 1.5 Flash 模型
Gemini 1.5 Flash,是谷歌追求速度和效率的輕量級模型,也是 Gemini 模型系列的最新成員。
它針對大規模、大批量、高頻任務進行了優化,服務更具成本效益,並具有突破性的長上下文窗口(100 萬 token )。
在應用場景上,它擅長總結、聊天、圖像視頻字幕、長文檔數據提取等任務。Gemini 1.5 Flash通過從1.5 Pro模型中學習,繼承了其核心能力。
AI助手:Project Astra
新的多模態AI項目Project Astra, 是谷歌人工智能助手的最新進展。
在演示中,AI助手可以通過視頻和音頻識別。例如,幫助用户記住他們把眼鏡放在哪裏、檢查代碼並回答有關某個部分的問題。
谷歌表示,一個真正有用的聊天機器人需要讓用户“自然地與它交談,沒有滯後或延遲”。
皮查伊預計 Project Astra 將於今年晚些時候在 Gemini 啟動。
新一代開源大模型 Gemma 2
谷歌開源大模型——Gemma 2 也來了。
據介紹,Gemma 2 採用全新架構,旨在實現突破性的性能和效率,新開源的模型參數為 27B。
視頻大模型Google Veo、文生圖像模型 Imagen 3
谷歌還發布了用於生成高清視頻的最新模型“Veo”,以及最高質量的文本到圖像模型 Imagen 3。
據悉,Veo 能夠生成各種風格的高質量 1080p 分辨率視頻,時長可以超過一分鐘。它可以憑藉對自然語言和視覺語義的深入理解,並在理解視頻內容、渲染高清圖像、模擬物理原理等方面都有所突破。
Imagen 3則在生成細節、光照、干擾等方面進行了優化升級,並且理解 prompt 的能力顯著增強。
AI手機系統:Android 15操作系統
在 I/O 大會上,谷歌提到了即將推出的安卓新版本,即以 AI 為核心的 Android 15。
谷歌還宣佈對其適用於 Android 設備的 Gemini AI 聊天機器人進行一些改進:Gemini 正在“成為 Android 上新的人工智能助手”。
這也意味着大模型現已成為 Android 操作系統的一部分,使其能夠以更全面的方式集成。
AI芯片:第六代TPU芯片Trillium
谷歌第六代TPU芯片Trillium,是迄今為止性能最強大、能效最高的 TPU,將於 2024 年底正式上線。
與 TPU v5e 相比,Trillium TPU 的每芯片峯值計算性能提高了 4.7 倍,同時它還把高帶寬內存(HBM)以及芯片間互連(ICI)帶寬加倍。
皮查伊表示,將於 2024 年底正式上線。
“25 年來,我們投資建設了世界一流的技術基礎設施。從支持搜索的尖端硬件,到支持人工智能進步的定製張量處理單元。我們將於 2024 年末向我們的雲客户提供 Trillium。”
從模型到應用,再到芯片……此次谷歌年度 I/O 開發者大會讓人應接不暇。
頂着Open AI壓力的谷歌,這一次正面硬剛的表現還是非常出色的。
此前一天,OpenAI搶先一步發佈了GPT-4 型號的最新版本——GPT-4o,似乎是有意狙擊谷歌一般。
GPT-4o不僅在聽、説、看 方面更“絲滑”,並且將向所有用户免費開放。
這也讓市場為谷歌的“大上新”捏了一把汗。
但從現在來看,隨着全家桶AI能力升級,谷歌靠着多維度反擊,這一戰雙方勢均力敵。
因為從創新方向來看,OpenAI注重AI技術的突破和飛躍,谷歌則注重生態系統的深化與整合,二者均各有所長。
當下,人工智能戰場上的“廝殺”激烈。
在這場科技巨頭的較量中,谷歌與OpenAI的再次交鋒,也勢必將人工智能的創新推向高潮。
各方科技巨頭不停革新着自家的“大殺器”,也預示着AI的新一輪變革。而谷歌和Open AI的對決,遠未止步於此。