IBM 推出Granite 3.2:全新企業(yè)級(jí)多模態(tài)及推理的AI模型
![]() |
- Granite 3.2是小型的 AI 模型,通過對(duì)開發(fā)人員友好的授權(quán)條款,提供推理、視覺和護(hù)欄功能
- 更新后的 Granite 時(shí)間序列模型可提供長期預(yù)測,參數(shù)少于10M;適用于金融與經(jīng)濟(jì)趨勢分析、供應(yīng)鏈需求預(yù)測,以及零售業(yè)的季節(jié)性庫存規(guī)劃等用例
北京, 2025年3月4日 /美通社/ -- IBM于2月底推出其 Granite 大型語言模型家族的最新一代產(chǎn)品 Granite 3.2,持續(xù)推動(dòng)小型、高效、企業(yè)專用的 AI,為實(shí)際應(yīng)用創(chuàng)造效益。
所有 Granite 3.2 模型均采用寬松的 Apache 2.0 開源授權(quán)條款,可在 Hugging Face 下載。部分模型現(xiàn)已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供,預(yù)計(jì)不久將支援 RHEL AI 1.5,為企業(yè)與開源社區(qū)注入更強(qiáng)大的 AI 能力。
主要亮點(diǎn)
- 全新視覺語言模型:專為理解文件任務(wù)而設(shè)計(jì),在關(guān)鍵企業(yè)基準(zhǔn)測試 DocVQA、ChartQA、AI2D 和 OCRBench[1] 中,表現(xiàn)可媲美甚至超越更大規(guī)模的模型(如 Llama 3.2 11B 和 Pixtral 12B)。除了強(qiáng)大的訓(xùn)練數(shù)據(jù)外,IBM 也利用其開源 Docling 工具包處理8千5百萬份 PDF 文件,并生成2千6百萬個(gè)合成問答配對(duì),提升視覺語言模型在處理大量文件工作流時(shí)的能力。
- 增強(qiáng)推理功能:Granite 3.2的2B與8B模型加入了「思維鏈」(Chain of Thought,CoT)推理機(jī)制,且使用者可以開啟或關(guān)閉推理功能以優(yōu)化效率。通過這項(xiàng)能力,8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基準(zhǔn)測試中的表現(xiàn)[2],比前一代優(yōu)異比例達(dá)到兩位數(shù),且不影響其他領(lǐng)域的安全性或性能。此外,通過創(chuàng)新的推理擴(kuò)展方法,Granite 3.2 8B 模型可以調(diào)整至接近 Claude 3.5 Sonnet 或 GPT-4o 在數(shù)學(xué)推理基準(zhǔn)(如 AIME2024 和 MATH500[3])上的表現(xiàn)。
- Granite Guardian 安全模型更輕巧:在保持 Granite 3.1 Guardian 模型性能的同時(shí),模型尺寸減少三成。此外,Granite 3.2 系列還引入了語言化信心評(píng)估(Verbalized Confidence)新功能,可提供更精細(xì)的風(fēng)險(xiǎn)評(píng)估,幫助安全監(jiān)測系統(tǒng)識(shí)別不確定性。
IBM 持續(xù)推動(dòng)企業(yè)專用的小型 AI 模型策略,并已在測試中展現(xiàn)高效能。例如,Granite 3.1 8B 模型在 Salesforce 大型語言模型CRM基準(zhǔn)測試中獲得高分,顯示其在實(shí)際應(yīng)用中的準(zhǔn)確度和可靠性。
IBM Granite 模型家族擁有廣大的合作伙伴生態(tài)體系,許多領(lǐng)先的軟件公司已將Granite模型嵌入其技術(shù)。Granite 3.2 是 IBM 在推動(dòng)企業(yè)專用小型 AI 方面的重要進(jìn)展,體現(xiàn)了 IBM 致力于提供小型、高效、實(shí)用 AI 的產(chǎn)品策略。
CrushBank 首席技術(shù)官 David Tan 表示:"在 CrushBank,我們親眼目睹了 IBM 開放、高效的人工智能模型如何為企業(yè)人工智能帶來真正的價(jià)值--在性能、成本效益和可擴(kuò)展性之間實(shí)現(xiàn)適當(dāng)?shù)钠胶?。Granite 3.2 通過新的推理功能更進(jìn)一步,我們很高興能在構(gòu)建新的代理(智能體)解決方案時(shí)探索這些功能。"
Granite 3.2 是 IBM 產(chǎn)品組合和戰(zhàn)略發(fā)展的重要一步,旨在為企業(yè)提供小型實(shí)用的 AI。雖然思維鏈在推理任務(wù)中表現(xiàn)強(qiáng)大,但它需要大量計(jì)算資源,并非所有任務(wù)都必須啟用。因此,IBM 在 Granite 3.2 模型中加入了程式化開關(guān)功能,使用者可以根據(jù)需求開啟或關(guān)閉推理模式;模型可在不啟用推理的情況下運(yùn)行較簡單的任務(wù),以降低不必要的計(jì)算成本。
此外,其他推理技術(shù)(例如推理擴(kuò)展 Inference Scaling) 已顯示 Granite 3.2 8B 模型能夠在標(biāo)準(zhǔn)數(shù)學(xué)推理基準(zhǔn)測試中,媲美甚至超越更大模型的性能。持續(xù)發(fā)展這項(xiàng)推理技術(shù)也是 IBM 研究團(tuán)隊(duì)的重點(diǎn)方向[4],以進(jìn)一步提升 AI 的效能與應(yīng)用范圍。
除了 Granite 3.2 的指令、視覺和防護(hù)模型之外,IBM 也推出了新一代 TinyTimeMixers(TTM)時(shí)間序列模型,這些模型的參數(shù)少于1千萬,具備長期預(yù)測能力,可進(jìn)行長達(dá)兩年的長期預(yù)測。這些模型為長期趨勢分析提供強(qiáng)大工具,適用于金融與經(jīng)濟(jì)趨勢分析、供應(yīng)鏈需求預(yù)測,以及零售業(yè)的季節(jié)性庫存規(guī)劃。
IBM AI 研究副總裁 Sriram Raghavan 表示:"AI 的下一個(gè)時(shí)代將聚焦效率、整合與實(shí)際應(yīng)用的影響力 — 企業(yè)應(yīng)該能夠在不過度消耗計(jì)算資源的情境下,取得強(qiáng)大的 AI 效益。IBM 最新的 Granite 模型發(fā)展專注于開放式解決方案,逐步推動(dòng) AI 的普及,使其更具成本效益,為現(xiàn)代企業(yè)創(chuàng)造更大價(jià)值。"
欲了解Granite 3.2 的技術(shù)細(xì)節(jié),請參閱相關(guān)技術(shù)文章。
關(guān)于IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個(gè)國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和 Red Hat OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對(duì)企業(yè)誠信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請?jiān)L問:https://www.ibm.com/cn-zh
媒體聯(lián)絡(luò)人:
[1] 視覺模型(Vision Model) 的基準(zhǔn)測試結(jié)果可在 IBM技術(shù)文章 《IBM Granite 3.2:推理、視覺、預(yù)測與更多應(yīng)用》(2025 年 2 月 26 日發(fā)布)中查閱。 [2] 指令模型(Instruct Model) 的基準(zhǔn)測試結(jié)果可在 IBM 技術(shù)文章 《IBM Granite 3.2:推理、視覺、預(yù)測與更多應(yīng)用》(2025 年 2 月 26 日發(fā)布)中查閱。 [3] 推理擴(kuò)展(Inference Scaling) 的基準(zhǔn)測試結(jié)果可在 IBM技術(shù)研究部落格 《Granite 3.2 中的推理:利用推理擴(kuò)展技術(shù)》(2025 年 2 月 26 日發(fā)布)中查閱。 [4] 推理擴(kuò)展技術(shù)在 Granite 3.2 中的應(yīng)用,IBM 技術(shù)研究部落格,2025 年 2 月 26 日發(fā)布 |
[美通社]
【免責(zé)聲明】本文僅代表作者個(gè)人觀點(diǎn),與云財(cái)經(jīng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),云財(cái)經(jīng)對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
新聞標(biāo)題 | 時(shí)間 | 消息來源 | 新聞熱度 |
---|---|---|---|
最高檢:持續(xù)保持依法嚴(yán)懲制售偽劣商品犯罪高壓態(tài)勢 | 03-14 14:18 | 云財(cái)經(jīng) |
|
小鵬汽車何小鵬:今年公司算力投入數(shù)十億元 | 03-13 21:41 | 云財(cái)經(jīng) |
|
俄聯(lián)邦安全局稱挫敗系列恐怖和破壞行動(dòng) | 03-13 19:13 | 云財(cái)經(jīng) |
|
杭州:自動(dòng)駕駛測試應(yīng)用區(qū)域面積達(dá)6910平方公里 | 03-13 10:11 | 云財(cái)經(jīng) |
|
揚(yáng)杰科技擬披露重大事項(xiàng) 3月13日開市起停牌 | 03-13 08:58 | 云財(cái)經(jīng) |
|
國內(nèi)商品期貨收盤 苯乙烯跌超2% | 03-12 15:01 | 云財(cái)經(jīng) |
|