新的Granite 3.0 8B與2B 語言模型 具備高性能、透明度與安全性
搭配企業數據 在特定任務場景 展現優異性價比
台北2024年10月22日 /美通社/ -- IBM 在美國時間10月21日舉行的TechXchange 年度技術大會上,發表了自家旗艦級模型系列第三代 Granite 3.0;它經由寬鬆的Apache 2.0許可發布,在眾多學術與行業評比測試中,均超越或與類似規模的競者模型並駕齊驅,展現了優異的性能、建模彈性、透明度與安全性。
IBM 發表新一代企業級AI模型 Granite 3.0開啟「小模型 ‧ 高效能」時代
IBM Granite 3.0系列模型包括:
IBM Granite 3.0系列模型的主要特點:
在這次發布裡,還有專家混合架構(Mixture of Experts, MOE)Granite 3.0 1B-A400M與Granite 3.0 3B-A800M,這些較小型、輕量級的模型可建置在傳統CPU伺服器,用於低延遲應用程式,兼顧性能與推理成本的完美平衡。
IBM還發布了預訓練 Granite 時間序列模型的更新版本。這些新模型基於多三倍的數據量訓練,具備更高的建模彈性、支持外部變量與滾動預測。在三個主要時間序列模型評比中,Granite 的性能超越了Google、阿里等規模大十倍的模型。
為了向開發人員提供多種選擇和易用性,並支持本地和邊緣應用,精選的 Granite 3.0 模型也可在 Ollama 和 Replicate 上取得。新一代 Granite 模型擴充了 IBM 強大的開源 LLM 目錄:IBM 與 AWS、Docker、Domo、Qualcomm Technologies Inc.(通過其 Qualcomm® AI Hub)、Salesforce、SAP 等合作夥伴合作,將多種 Granite 模型整合在它們的產品中或平台上。