智快網 - 新科技與新能源行業網絡媒體

          中國信通院開啟大模型幻覺測試,涵蓋人文社科等五大維度

             發布時間:2025-03-19 16:50 作者:馮璃月

          近日,中國信息通信研究院(中國信通院)通過其官方微信公眾號發布了一項重要舉措,旨在深入探索大型人工智能模型(大模型)的“幻覺”現象,并推動其在實際應用中的安全與可靠性。該舉措基于前期AI Safety Benchmark的測評經驗,正式啟動了針對大模型的幻覺測試項目。

          所謂大模型幻覺(AI Hallucination),是指當這些模型在生成文本或回答問題時,可能會創造出看似合理但實際上與用戶輸入不符(即忠實性幻覺)或違背事實(即事實性幻覺)的內容。隨著大模型在醫療、金融等關鍵行業的廣泛應用,這種幻覺現象所帶來的潛在風險日益凸顯,引起了業界的廣泛關注。

          本次幻覺測試主要針對的是大語言模型,測試內容涵蓋了忠實性幻覺和事實性幻覺兩大類型。為了全面評估這些模型,測試數據包含了超過7000條中文測試樣本,測試形式則分為信息抽取、知識推理(針對忠實性幻覺)以及事實判別(針對事實性幻覺)等題型。測試維度廣泛,涵蓋了人文科學、社會科學、自然科學、應用科學和形式科學等多個領域。

          具體來看,測試體系的設計旨在通過多樣化的題型和豐富的測試樣本,準確捕捉大模型在不同情境下的幻覺表現。這不僅有助于揭示模型潛在的缺陷,也為后續的優化和改進提供了重要依據。

          為了推動大模型的安全應用,中國信通院誠摯邀請相關企業積極參與此次模型測評。通過共同的努力,旨在提升大模型的準確性和可靠性,降低幻覺現象帶來的應用風險。

          中國信通院還強調了測試工作的重要性,指出這不僅是對大模型性能的一次全面檢驗,更是推動人工智能領域健康發展的重要一環。通過持續的測試和評估,將有助于提高整個行業對大模型幻覺現象的認識和應對能力。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久久精品2019中文字幕之3 | 色综合91久久精品中文字幕| 久久精品国产清高在天天线| 国产精品白丝AV网站| 久久夜色精品国产| 国产精品99精品视频网站| 日韩爆乳一区二区无码| 国产成人不卡亚洲精品91| 国产精品99久久99久久久动漫| 99热在线精品免费全部my| 久久精品国产亚洲AV蜜臀色欲| 99精品视频在线观看免费专区| 久久老子午夜精品无码| 久久99精品国产麻豆宅宅| 曰韩精品无码一区二区三区| 韩国三级中文字幕hd久久精品| 国产三级精品久久| 国产精品va久久久久久久| 国产高清在线精品一区二区| 九九视频精品在线| 精品视频在线观看一区二区三区| 日韩亚洲国产高清免费视频| 精品日韩亚洲AV无码| 亚洲日韩国产精品乱-久| 日韩欧国产精品一区综合无码| 日韩精品在线播放| 视频一区视频二区日韩专区| 四虎国产精品永久在线网址| 久久精品无码一区二区日韩AV | 国产日韩一区二区三区| 免费精品国产自产拍观看| 国产精品久久久久网站| 国产精品天干天干| 国产精品久久久久久网站| 国产在线精品无码二区二区| 一本大道无码日韩精品影视| 日韩三级草久国产| 亚洲日韩精品无码专区加勒比| 日韩精品中文字幕在线观看| 日韩福利视频一区| 欲帝精品福利视频导航|