硅谷大廠們,在這輪AI浪潮上已經卷出新高度。
當地時間2月21日,科技巨頭谷歌發佈號稱“全球性能最強大、輕量級”的新一代開源系列模型Gemma,全面狙擊Meta的開源模型Llama 2。
週三美股收盤,谷歌升1.15%報143.84美元,總市值達到1.79萬億美元。
Gemma 是谷歌基於 Gemini 推出的4個新 LLM 模型系列。
它分為20億、70億兩種參數規模,每個規模又分預訓練和指令微調兩個版本。每個參數都有基本和指令調整的變體。
其中,7B參數用於在消費級GPU和TPU上高效部署和開發;2B版本則可直接在筆記本電腦上運行。
據谷歌介紹,Gemma是一個輕量級、最先進的開放式模型,採用與Gemini模型相同的研究和技術,由Google DeepMind和谷歌其他團隊開發,專為負責任的AI開發而打造。
性能方面,谷歌稱Gemma 模型與Gemini共享技術和基礎設施組件。與其他開放式型號相比,這使得 Gemma 2B 和 7B 能夠在其尺寸範圍內實現同類最佳的性能。
谷歌表示,Gemma 在關鍵基準上超越了更大的模型。
在18個語言理解、推理、數學等關鍵基準測試中,Gemma有11個測試分數超越了Meta Llama-2等更大參數的開源模型。
開發人員和研究人員可以免費訪問 Gemma,以便在 Kaggle 中進行研究和開發,也可以通過 Colab 筆記本的免費套餐進行訪問。
對於開發人員,谷歌還提供了各種用於 Gemma 部署的工具,包括用於 JAX、PyTorch 和 TensorFlow 中的推理和監督微調的工具鏈。
首次使用 Google Cloud 的用户可以獲得 300 美元的 Gemma 積分;申請的研究人員可以獲得高達 50萬美元的 Google Cloud 積分。
開源的Gemma,無疑將會吸引軟件工程師在谷歌技術的基礎上進行開發,並鼓勵使用其新盈利的雲部門。
目前,可以通過 Colab、Hugging Face、Kaggle、Google 的 Kubernetes Engine 和 Vertex AI 以及 NVIDIA 的 NeMo訪問谷歌 Gemma。
當下,AI大模型的開源之戰已經打響。
近兩年,OpenAI掀起了全球科技競賽,頭部科技大廠們你追我趕、廝殺甚是激烈。
前有閉源代表OpenAI 的GPT-4 Turbo大模型,但其只能通過 ChatGPT 應用程序和雲 API 獲得,不能在本地運行。
另一科技巨頭Meta自去年 2 月以來也一直在大力進攻開放權重模型,例如LLaMA和Llama 2 。
但不管是在開源還是閉源上,谷歌是既要也要。
近一個月來,谷歌先後發佈了大模型Gemini Ultra、Gemini 1.5、Gemma,大有要“拳打OpenAI,腳踢Meta”的樣子。
作為曾經AI領域扛把子的谷歌,這一年多來,風頭幾度被搶,一直處於被壓着打的境地。
在AI競逐中,雖然OpenAI、Meta、微軟等巨頭一直都是很強的對手;但在AI開源上,谷歌似乎已經登上了開源大模型的鐵王座。
目前,Gemma的主要競爭對手主要包括:Meta 的開源大型語言模型 Llama 2、Mistral AI 的 7B 模型、Deci 的 DecilLM 和Microsoft 的 Phi-2,以及旨在在組織自己的硬件上運行的類似小型生成式 AI 模型。
但放眼看,Gemma一馬當先。
值得關注的是,Gemma還有芯片巨頭英偉達的加持。
英偉達最新表示,已經和谷歌展開合作,確保 Gemma 模型在其芯片上順利運行。
公司稱,很快將開發與 Gemma 配合使用的聊天機器人軟件,該軟件正在開發用於在 Windows PC 上運行人工智能模型。