一、大模型在企業(yè)落地的現(xiàn)狀和問題
近年來,伴隨著人工智能技術的飛速發(fā)展,大模型(Large Model)也開始在企業(yè)管理和運營等領域得到廣泛應用。無數(shù)實例表明,大模型對于提升企業(yè)知識應用能力具有巨大價值。但是我們也必須清醒地看到,大模型自身仍存在一些問題亟待解決。
目前大模型的訓練主要基于公開互聯(lián)網知識,對企業(yè)內部信息一無所知。而企業(yè)核心知識又無法公開,這使得企業(yè)無法直接應用互聯(lián)網開放的、公共的大模型。為實現(xiàn)落地,大模型需要先接入企業(yè)內部知識庫,通過學習適配業(yè)務場景。當前,很多接觸大模型的企業(yè)處于觀望試用階段,正在尋找大模型的最佳落地方案。
由于缺乏對真實世界知識的約束監(jiān)督,大模型很容易在推理時產生“自信的編造”,給出不準確的回答,因此,大模型在單獨應用時的準確率仍有待提高。此外,大模型理解問句并生成回答的速度較為緩慢,無法滿足企業(yè)對知識應用的實時性要求。更重要的是,利用大模型進行開放域問題回答時,企業(yè)的核心知識和商業(yè)機密很容易被泄露。
綜上所述,接入企業(yè)內部知識庫,提升大模型的回答質量和應用效率,實現(xiàn)內部知識的安全管控,都是大模型成功落地企業(yè)應用的重要保障。針對這一挑戰(zhàn),有一個行之有效的解決方案,那就是將大模型與企業(yè)內部知識庫進行深度融合。
二、大模型與企業(yè)知識庫融合的必要性與可行性
從各種角度觀察和已經落地的實踐證明,企業(yè)知識庫是接入大模型的首選。第一企業(yè)知識庫擁有大量業(yè)務數(shù)據,天然成為大模型進入企業(yè)最好的學習路徑;第二,企業(yè)本身就需要對知識庫進行搜索使用和日常維護,大模型的加入是在原有能力的基礎上錦上添花,為虎添翼;第三,知識庫的用戶具有一定專業(yè)知識能力,會對問答結果進行專業(yè)性檢驗,避免錯誤回答的誤導;最后,企業(yè)知識系統(tǒng)具有現(xiàn)成的技術和內容基礎,與大模型結合,可以形成1+1>2的效果。
進一步來看,企業(yè)知識庫存儲了大量專業(yè)知識和業(yè)務數(shù)據,涵蓋了企業(yè)內部的各種規(guī)則、流程、案例、產品、經驗等。企業(yè)知識庫中的顯性知識和隱性知識,都可以通過企業(yè)知識庫的結構化、非結構化知識等方式有效呈現(xiàn),為大模型提供了規(guī)范化的學習素材。這無疑可以提供海量的優(yōu)質問答數(shù)據,提升大模型對企業(yè)業(yè)務場景的理解能力。大模型通過不斷學習企業(yè)知識體系,可以快速掌握企業(yè)知識體系,減少“自信編造”的錯誤回答。
與此同時,企業(yè)知識庫中的顯性知識和隱性知識,都可以通過企業(yè)知識庫的結構化、非結構化知識等方式有效呈現(xiàn),為大模型提供了規(guī)范化的學習素材。大模型通過不斷學習企業(yè)知識體系,可以快速掌握企業(yè)知識體系,減少“自信編造”的錯誤回答。
相比開放域的互聯(lián)網信息,企業(yè)知識庫提供的結構化知識更為明確和準確,大模型充分學習這些知識后,其回答質量和準確性都將得到顯著提升。這也使得大模型生成的內容更加符合企業(yè)業(yè)務需求。
另一方面,企業(yè)知識庫基于內部網絡運行,可以確保知識內容的安全性。大模型只需要在企業(yè)內部閉環(huán)中進行訓練和使用,無需接觸外部信息,因此有效減少知識泄密風險。
最后,企業(yè)知識庫支持快速檢索關鍵知識點的功能,可以大幅提升大模型的響應速度。通過與向量檢索等技術手段的配合,知識定位僅需秒級時間,因此大模型生成回答的總時長可以大大縮短。
三、深藍海域“大模型+知識管理”解決方案的成功實踐
面對大模型與企業(yè)知識管理融合的迫切需求,深藍海域通過自主研發(fā),推出了企業(yè)級知識管理系統(tǒng)與大模型深度融合的解決方案。得益于多年在知識管理領域的深耕細作,深藍知識庫系統(tǒng)的以下突出特征,讓大模型與之結合相得益彰。
1、智能平臺基礎
深藍海域知識庫系統(tǒng)原生具備智能平臺模塊,支持深度學習、自然語言、智能問答、原子化搜索,以及知識圖譜,智能知識加工等智能能力,這些智能能力在產品和項目層面都與知識庫的內容進行良好的適配整合,在此基礎上疊加大模型能力是具備良好技術基礎和實施經驗。
2、知識體系完備、豐富多態(tài)
深藍海域構建的企業(yè)知識體系,實現(xiàn)了企業(yè)分散數(shù)據、信息與業(yè)務知識的有效融合。知識體系通過知識抽取和知識表示技術,自動化完成了企業(yè)內部專業(yè)知識和經驗的集成表達?;谥R體系,企業(yè)原有的數(shù)據資產得到重新組織和關聯(lián),知識價值得以充分釋放。
同時,知識體系還為大模型的訓練和優(yōu)化提供了豐富的學習源。大模型在此基礎上得到持續(xù)預訓練,不斷深化對企業(yè)業(yè)務場景和知識體系的理解,顯著提升了其回答質量和準確性。
3、全文搜索和向量檢索技術基礎
深藍海域通過向量檢索等技術手段,實現(xiàn)了企業(yè)問題檢索的精準化。向量檢索可以準確定位信息中的語義單元,在海量非結構化文本中快速鎖定關鍵知識點。
在深藍海域解決方案應用的多個項目中,99.95%的問題能在2秒內得到解答,大大優(yōu)化了知識獲取的時效性。這為客戶服務和業(yè)務決策提供了及時支持。
4、安全可控的知識應用環(huán)境
深藍海域構建的知識應用環(huán)境全部運行于企業(yè)內部網絡之中,對業(yè)務數(shù)據和知識內容實現(xiàn)了嚴密的訪問控制和權限管理。
大模型的訓練和應用全鏈路安全可控,有效降低了企業(yè)核心知識泄密的風險,保證了知識管理的安全合規(guī)。這使企業(yè)可以放心應用包含大模型的解決方案。
通過與大模型的整合實踐與技術落地,深藍海域實現(xiàn)了大模型到企業(yè)落地的首站——知識庫系統(tǒng)的整合。在多家客戶的實際使用中,基于深藍海域解決方案構建的知識管理系統(tǒng)取得了顯著成效:某大型進出口貿易企業(yè)使用該方案后,客戶自助解決重復問題的能力得到大幅提升,問題自助解決率由21%上升到63%,減輕了客戶服務代表重復勞動。在某制造企業(yè)員工智能問答平臺,為員工提供各類企業(yè)管理制度、制造規(guī)范解答,日均問答請求達到數(shù)千個,為客戶節(jié)約了大量人力和時間成本,提升了企業(yè)運轉效率。
可見,深藍海域在技術和實踐上都已證明,大模型與企業(yè)知識庫的深度融合,是推動企業(yè)知識管理實現(xiàn)新的突破的關鍵所在。相信在不遠的未來,這種以知識為核心的人工智能賦能方案,必將在更多領域產生革命性影響。