繼微軟和谷歌之後,又一巨頭宣佈加入這場激烈的人工智能競賽。
當地時間週四(4月13日),亞馬遜雲服務部門(AWS)宣佈,推出Bedrock生成式人工智能服務,以及自有的大型語言模型泰坦(Titan)。
據亞馬遜介紹,推出 的Amazon Bedrock 和 Amazon Titan 模型,是使用 FM 構建和擴展生成式 AI 應用程序的最簡單方法。
對於推出的Amazon Bedrock,亞馬遜表示這是一項新服務,可以通過 API 訪問來自 AI21 Labs、Anthropic、Stability AI 和 Amazon 的 FM 。
Bedrock 將提供訪問一系列強大的文本和圖像 FM 的能力——包括亞馬遜的 Titan FM,它由兩個新的 LLM 組成— 通過可擴展、可靠且安全的 AWS 託管服務。
藉助 Bedrock 的無服務器體驗,客户可以輕鬆地找到適合他們要完成的工作的正確模型、快速入門、使用他們自己的數據私下定製 FM,並使用他們使用的 AWS 工具和功能輕鬆地將它們集成並部署到他們的應用程序中熟悉(包括與 Amazon SageMaker ML 功能集成,例如用於測試不同模型的實驗和用於大規模管理其 FM 的管道),而無需管理任何基礎設施。
亞馬遜表示,Bedrock 客户可以從當今可用的一些最前沿的 FM 中進行選擇。這包括來自 AI21 Labs 的 Jurassic-2 系列多語言 LLM,它們遵循自然語言指令生成西班牙語、法語、德語、葡萄牙語、意大利語和荷蘭語的文本。克勞德是 Anthropic 的法學碩士,可以執行各種對話和文本處理任務,並且基於 Anthropic 對培訓誠實和負責任的人工智能系統的廣泛研究。Bedrock 還可以輕鬆訪問 Stability AI 的文本到圖像基礎模型套件,包括 Stable Diffusion(同類產品中最受歡迎的),它能夠生成獨特、逼真、高質量的圖像、藝術、徽標和設計。
Bedrock 最重要的功能之一是定製模型非常容易。客户只需將 Bedrock 指向 Amazon S3 中的幾個標記示例,該服務就可以針對特定任務微調模型,而無需註釋大量數據(少至 20 個示例就足夠了)。
另外,據亞馬遜介紹,公司一直在與一些客户一起預覽亞馬遜的新 Titan FM,然後在未來幾個月內更廣泛地提供它們。最初會有兩個 Titan 模型。第一個是生成式 LLM,用於諸如摘要、文本生成(例如,創建博客文章)、分類、開放式問答和信息提取等任務。第二種是嵌入 LLM,它將文本輸入(單詞、短語或可能的大文本單元)翻譯成包含文本語義的數字表示(稱為嵌入)。
雖然此 LLM 不會生成文本,但它對於個性化和搜索等應用程序很有用,因為通過比較嵌入,模型將產生比單詞匹配更相關和上下文相關的響應。事實上,亞馬遜。com 的產品搜索功能使用類似的嵌入模型來幫助客户找到他們正在尋找的產品。為了繼續支持負責任地使用 AI 的最佳實踐,Titan FM 旨在檢測和刪除數據中的有害內容,拒絕用户輸入中的不當內容,並過濾包含不當內容(例如仇恨言論、褻瀆和暴力)。
在 AWS 上使用生成式 AI 進行構建
此外,亞馬遜還宣佈全面推出由 AWS Trainium 提供支持的 Amazon EC2 Trn1n 實例和由 AWS Inferentia2 提供支持的 Amazon EC2 Inf2 實例,這是用於生成 AI 的最具成本效益的雲基礎設施。
在過去的五年中,AWS 一直在投資自己的芯片,以推動 ML 訓練和推理等要求苛刻的工作負載的性能和性價比,而AWS Trainium 和 AWS Inferentia 芯片為訓練模型和運行推理提供了最低的成本在雲端。
由 Trainium 提供支持的 Trn1 實例可以比任何其他 EC2 實例節省高達 50% 的培訓成本,並且經過優化以在與 800 Gbps 第二代 Elastic Fabric Adapter (EFA) 網絡連接的多台服務器之間分發培訓。
AWS Inferentia2 提供支持的Inf2則是專門針對模型包含數千億個參數的大規模生成 AI 應用程序進行了優化。與上一代基於 Inferentia 的實例相比,Inf2 實例的吞吐量提高了 4 倍,延遲降低了 10 倍。它們還具有加速器之間的超高速連接,以支持大規模分佈式推理。
最後,亞馬遜還宣佈 Amazon CodeWhisperer 全面上市,對個人開發者免費。
值得關注的是,稍早前,亞馬遜官首席執行官安迪·賈西(Andy Jassy)發佈了2022年致股東公開信。
信中他表示,亞馬遜將大力投資當下十分火爆的大型語言模型(LLM)和生成式人工智能(AI),且他對亞馬遜能夠控制成本並繼續投資於新的增長領域充滿信心。
賈西表示,亞馬遜已經廣泛使用機器學習25年了,從個性化電子商務推薦,到營運中心(負責廠商收貨、倉儲、庫存管理、訂單發貨、調撥發貨、客户退貨、返廠、商品質量安全等),到Prime Air送貨無人機,到智能音箱Alexa,再到AWS提供的許多機器學習服務。直到最近,一種更加新穎的機器學習研究方向——生成式人工智能出現了,並有望顯著加速機器學習的發展。
生成式人工智能基於非常大的語言模型(擁有高達數千億個參數,並且還在不斷增長),橫跨廣泛的數據集,並具有非常普遍和廣泛的記憶和學習能力。
賈西提到,大型語言模型和生成式人工智能對客户、股東和亞馬遜來説都將是一件大事。
另外,賈西也在股東信中坦言,2022年是近期宏觀經濟形勢最艱難的年份之一,他在信中回顧了亞馬遜近期面臨的挑戰,並表示他仍然相信近期的成本削減計劃將會取得成效。
過去幾個月,賈西一直在深入研究整個公司的具體業務,作為成本削減計劃的一部分,亞馬遜最近關閉了一些實驗性項目,如遠程醫療服務和人行道送貨機器人。它還暫停了生鮮超市和倉庫的擴張。
亞馬遜還進行了公司有史以來最大規模的裁員,它還凍結了公司員工的招聘。不過,即使在裁員期間,亞馬遜仍專注於發展一些前沿業務。
賈西表示,AWS的年度營收將達到850億美元,且仍處於早期採用階段,但在關鍵時刻仍專注於長期對客户最重要的事情。2022年AWS的收入在620億美元的基礎上同比增長29%,當前宏觀經濟挑戰令該業務面臨短期阻力,因為企業客户在雲計算的支出方面變得更加謹慎。
“AWS仍處於發展的早期階段,在未來十年內有機會實現非同尋常的增長。”
賈西在信中最後表示,他樂觀地認為,亞馬遜將從這個充滿挑戰的宏觀經濟時期走出來,走向一個更加美好的未來,因為未來擁有着巨大的機會。
附:亞馬遜致股東信原文件,點擊查看