中國信通院啟動“可信AI”AI Safety Benchmark大模型幻覺評測
2025-03-19 16:12   
來源: 云財經(jīng)   
影響力評估指數(shù):21.22  
相關股票:
云財經(jīng)訊,《科創(chuàng)板日報》19日訊,據(jù)中國信通院消息,為摸清大模型的幻覺現(xiàn)狀,推動大模型應用走深走實,中國信息通信研究院人工智能(161631)所基于前期的AI Safety Benchmark測評工作,發(fā)起大模型幻覺測試。本輪幻覺測試工作將以大語言模型為測試對象,涵蓋了事實性幻覺和忠實性幻覺兩種幻覺類型。測試數(shù)據(jù)包含7000余條中文測試樣本,測試形式包括對應于忠實性幻覺檢測的信息抽取與知識推理兩類題型,以及對應事實性幻覺檢測的事實判別題型??傮w涉及人文科學、社會科學、自然科學、應用科學和形式科學五種測試維度。
云財經(jīng)智能匹配相關概念
新聞標題 | 時間 | 消息來源 | 新聞熱度 |
---|---|---|---|
講真學堂《高效記憶訓練營》:科學提升記憶力,助力個人成長 | 今天 17:41 | 商業(yè)新聞 |
|
AI技術突破創(chuàng)新加速,相關上市公司迎來發(fā)展新機遇 | 今天 15:21 | 云財經(jīng) |
|
摩根大通美國國債客戶調查:凈多頭降至一個月來最低 | 03-18 19:46 | 云財經(jīng) |
|
普京允許一些西方基金公司出售俄羅斯證券 | 03-17 20:13 | 云財經(jīng) |
|
外匯局:國內經(jīng)濟回升向好和科技發(fā)展提振市場信心 2月外資凈增持境內債券和股票合計達127億美元 | 03-17 17:07 | 云財經(jīng) |
|
東方通智能體平臺與多大模型對接,AI應用加速落地 | 03-17 12:55 | 云財經(jīng) |
|