IBM最近发布了Granite 3.0,其中包括80亿和20亿参数的小型语言模型(SML)。IBM香港首席科技总监李永辉表示,小型、高效能的模型更贴近企业的需求,通过配合企业数据进行训练,能够在检索增强生成(RAG)、分类、摘要等任务中提供恰到好处的性能。这些模型的使用成本比大型模型低3倍至23倍,更具成本效益。Granite 3.0的模型还强调安全和开源,根据IBM AttaQ安全基准测试,Granite 3.0 8B Instruct模型的安全性在多个方面均领先于Meta和Mistral的模型。该模型采用开源授权,开发人员可以通过watsonx进行自行修改,并且IBM公开了用于训练Granite模型的数据集,生成的内容有源可寻。
IBM最近发布了Granite 3.0,其中包括80亿和20亿参数的小型语言模型(SML)。IBM香港首席科技总监李永辉表示,小型、高效能的模型更贴近企业的需求,通过配合企业数据进行训练,能够在检索增强生成(RAG)、分类、摘要等任务中提供恰到好处的性能。这些模型的使用成本比大型模型低3倍至23倍,更具成本效益。Granite 3.0的模型还强调安全和开源,根据IBM AttaQ安全基准测试,Granite 3.0 8B Instruct模型的安全性在多个方面均领先于Meta和Mistral的模型。该模型采用开源授权,开发人员可以通过watsonx进行自行修改,并且IBM公开了用于训练Granite模型的数据集,生成的内容有源可寻。
李永辉指出,小型语言模型更适合企业推动AI应用,具有快速和成本效益的优势。IBM以Granite 3.0为基础开发了多个工具,如编程AI助理(Assistants)和结合RAG回应更复杂问题的智能代理(Agents)。IBM旗下的交付平台Consulting Advantage将利用Granite 3.0扩展功能,协助顾问服务企业客户。新增的Consulting Advantage for Cloud Transformation and Management和Consulting Advantage for Business Operations包括特定领域的AI智能代理、应用程序,以及最佳实践方法,推动客户加速云端和AI转型任务。