句句不離 AI ，谷歌自我革命！Gemini 家族大上新，AI 超級全家桶“殺瘋了”

格隆匯 05-15 11:16

谷歌(GOOG.US)

又到谷歌 I/O 的“大秀”時間。毫無疑問，AI是備受矚目的焦點。

美東時間週二，谷歌年度 I/O 開發者大會拉開帷幕。

繼OpenAI搶先一步“上新”後，谷歌開啟正面回擊。從新的搜索和聊天功能到面向雲客户的AI硬件，谷歌一口氣推出了多款AI新品。

對此，谷歌CEO皮查伊表示，谷歌所有的工作都圍繞生成式AI模型Gemini來做。

每分鐘都在講 AI

去年，谷歌的I/O大會帶來了Gemini；今年的I/O大會幾乎每一分鐘都在講 AI。

這是Gemini 統計出來的數字——在長達 110 分鐘的主題演講中，總共提了121 次 AI 。

會上，谷歌Gemini 家族大上新。

其中，包括了AI搜索引擎、Gemini 1.5 Pro 更新版、Gemini 1.5 Flash、Gemma 2以及全新的Project Astra、Google Veo、magen 3等模型。

AI搜索引擎“AI Overviews”

谷歌正式推出“AI Overviews”搜索體驗。

據介紹，AI Overviews搜素引擎具備多步驟推理能力以及計劃能力。此外，靠Gemini的多模態功能，谷歌可以做到利用聲音搜歌曲，利用圖片搜產品。

Gemini 1.5 Pro 更新

Gemini 1.5 Pro上下文窗口擴展支持200萬token，號稱“迄今為止所有基礎模型中最長的上下文窗口”。

谷歌還通過數據和算法的改進增強了其代碼生成、邏輯推理和規劃、多輪對話以及音頻和圖像理解能力。

對於複雜指令，可遵循更復雜的指令，控制回覆風格，設置系統指令。

谷歌稱，今年夏季將擴展 Gemini 的多模態功能，包括增加用語音進行深入雙向對話的能力，這一功能被稱之為 Gemini Live。

目前，有超過 150 萬的開發人員在使用 Gemini 模型，超過 20 億的產品用户都用到了 Gemini。

新成員：Gemini 1.5 Flash 模型

Gemini 1.5 Flash，是谷歌追求速度和效率的輕量級模型，也是 Gemini 模型系列的最新成員。

它針對大規模、大批量、高頻任務進行了優化，服務更具成本效益，並具有突破性的長上下文窗口（100 萬 token ）。

在應用場景上，它擅長總結、聊天、圖像視頻字幕、長文檔數據提取等任務。Gemini 1.5 Flash通過從1.5 Pro模型中學習，繼承了其核心能力。

AI助手：Project Astra

新的多模態AI項目Project Astra，是谷歌人工智能助手的最新進展。

在演示中，AI助手可以通過視頻和音頻識別。例如，幫助用户記住他們把眼鏡放在哪裏、檢查代碼並回答有關某個部分的問題。

谷歌表示，一個真正有用的聊天機器人需要讓用户“自然地與它交談，沒有滯後或延遲”。

皮查伊預計 Project Astra 將於今年晚些時候在 Gemini 啟動。

新一代開源大模型 Gemma 2

谷歌開源大模型——Gemma 2 也來了。

據介紹，Gemma 2 採用全新架構，旨在實現突破性的性能和效率，新開源的模型參數為 27B。

視頻大模型Google Veo、文生圖像模型 Imagen 3

谷歌還發布了用於生成高清視頻的最新模型“Veo”，以及最高質量的文本到圖像模型 Imagen 3。

據悉，Veo 能夠生成各種風格的高質量 1080p 分辨率視頻，時長可以超過一分鐘。它可以憑藉對自然語言和視覺語義的深入理解，並在理解視頻內容、渲染高清圖像、模擬物理原理等方面都有所突破。

Imagen 3則在生成細節、光照、干擾等方面進行了優化升級，並且理解 prompt 的能力顯著增強。

AI手機系統：Android 15操作系統

在 I/O 大會上，谷歌提到了即將推出的安卓新版本，即以 AI 為核心的 Android 15。

谷歌還宣佈對其適用於 Android 設備的 Gemini AI 聊天機器人進行一些改進：Gemini 正在“成為 Android 上新的人工智能助手”。

這也意味着大模型現已成為 Android 操作系統的一部分，使其能夠以更全面的方式集成。

AI芯片：第六代TPU芯片Trillium

谷歌第六代TPU芯片Trillium，是迄今為止性能最強大、能效最高的 TPU，將於 2024 年底正式上線。

與 TPU v5e 相比，Trillium TPU 的每芯片峯值計算性能提高了 4.7 倍，同時它還把高帶寬內存（HBM）以及芯片間互連（ICI）帶寬加倍。

皮查伊表示，將於 2024 年底正式上線。

“25 年來，我們投資建設了世界一流的技術基礎設施。從支持搜索的尖端硬件，到支持人工智能進步的定製張量處理單元。我們將於 2024 年末向我們的雲客户提供 Trillium。”

最後

從模型到應用，再到芯片……此次谷歌年度 I/O 開發者大會讓人應接不暇。

頂着Open AI壓力的谷歌，這一次正面硬剛的表現還是非常出色的。

此前一天，OpenAI搶先一步發佈了GPT-4 型號的最新版本——GPT-4o，似乎是有意狙擊谷歌一般。

GPT-4o不僅在聽、説、看方面更“絲滑”，並且將向所有用户免費開放。

這也讓市場為谷歌的“大上新”捏了一把汗。

但從現在來看，隨着全家桶AI能力升級，谷歌靠着多維度反擊，這一戰雙方勢均力敵。

因為從創新方向來看，OpenAI注重AI技術的突破和飛躍，谷歌則注重生態系統的深化與整合，二者均各有所長。

當下，人工智能戰場上的“廝殺”激烈。

在這場科技巨頭的較量中，谷歌與OpenAI的再次交鋒，也勢必將人工智能的創新推向高潮。

各方科技巨頭不停革新着自家的“大殺器”，也預示着AI的新一輪變革。而谷歌和Open AI的對決，遠未止步於此。

每分鐘都在講 AI

最後

更多內容

站點服務

關於

協議聲明