小米公司近期揭曉了其創新的知識庫問答框架——Mi-BRAG,這一框架通過四大核心技術的集成,實現了知識處理范式的革新。Mi-BRAG已經在小愛同學的個人信息問答、汽車問答助手及商品問答等多個小米內部場景中得到了廣泛應用。
Mi-BRAG框架的一大亮點是全格式兼容能力,內置的智能解析引擎能夠無損處理包括PDF、Word、Excel在內的十多種文檔格式,為構建統一的企業知識庫奠定了堅實基礎。該框架還突破了傳統文本的局限,能夠精準解析復雜的圖片、表格以及圖文混排信息,實現了全模態解析。
在國際化方面,Mi-BRAG支持主流語言的文檔解析與交互問答,消除了知識流通中的語言障礙。同時,其細粒度溯源功能采用動態溯源定位技術,對每個生成結果都標注了原始文檔及引用位置,用戶只需一鍵即可追溯信息源頭,構建出一個可信的知識生態。
面對大模型(LLM)在知識更新成本高、企業私有知識理解不足以及數據安全隱患等方面的挑戰,小米引入了RAG(檢索增強生成)技術,為這些問題提供了有效的解決方案。RAG技術通過檢索最新的文檔或數據庫,為大模型注入實時信息,確保其輸出內容的準確性與時效性。同時,通過構建外部知識庫,RAG技術能夠增強大模型在特定領域的表現。
在數據隱私與安全性方面,RAG技術通過調用私有數據庫,在生成答案時僅基于檢索到的相關片段進行加工,避免了原始數據被模型存儲或泄露的風險。這一特性使得Mi-BRAG在處理企業敏感數據時更加安全可靠。
小米在多個應用場景中亟須自研的RAG框架提供領域安全可靠的智能知識中樞,以提升產品的智能化水平和用戶體驗。無論是面向消費者的個人信息問答、智能文檔問答,還是面向企業的新產品研發、員工助手、智能客服等場景,Mi-BRAG都展現出了強大的應用潛力。
小米大模型團隊認為,一個完整的知識問答框架應包括知識庫創建、知識檢索、知識增強和回復生成四個部分。其中,知識庫創建模塊對問答效果至關重要,因此小米將框架命名為Mi-BRAG。Mi-BRAG支持多種格式文檔解析和圖文混合的多模態問答,為用戶提供了豐富的應用選項。
在RAG的基礎框架下,Mi-BRAG的技術創新主要集中在知識庫創建、知識檢索以及回復生成等方面。知識庫創建方面,Mi-BRAG實現了跨模態的知識融合及“金字塔型”動態知識體系的構建;知識檢索方面,增強了用戶Query的理解能力和多維語義增強;回復生成方面,為知識注入了場景定制模型,并強化了無關信息的拒答和精細化的溯源能力。
在第三方評測機構SuperCLUE的綜合評估中,小米Mi-BRAG在單文檔問答、多文檔問答及搜索問答三大典型場景中表現出色,榮登榜首。這主要得益于Mi-BRAG在抗噪聲數據處理與信息整合方面的創新數據構建方法,以及其突破性的模型訓練范式。
在ASQA測試集上,小米團隊對Mi-BRAG和業界大模型進行了對比測試。結果顯示,Mi-BRAG在多文檔生成溯源準召率方面表現優異,進一步驗證了其強大的知識問答能力。