12月20日,在華爾街見聞和中歐國際工商學院聯合主辦的「Alpha峰會」上,金山辦公助理總裁、資深技術專家朱熠鍔發表題為《WPS AI:邁向更高質量的知識增強生成》的演講。
![]()
他表示,當前AI應用的核心挑戰已經從模型能力的競爭,轉向如何高效利用企業私域數據。模型能力的趨同,意味著其本身難以形成壟斷優勢。
他強調,真正決定AI應用價值的關鍵,在于將企業內大量復雜、非結構化的文檔數據,轉化為高質量、可被模型理解的知識資產。傳統RAG面臨“文檔不等于知識”以及“語義相似不等于邏輯相關”的根本局限,因此必須推動技術范式從“以模型為中心”升級為“以數據/知識為中心”。
他強調,未來的路徑是發展“KAG(Knowledge Augmented Generation,知識增強生成)”。這要求企業像管理數據一樣,系統性地對知識進行治理、建模與應用。具體而言,需要通過VLM、知識圖譜等技術,融合多模態、多結構化的知識,并構建“數據湖”與“知識湖”雙湖并重的架構。最終目標是讓AI真正“掌握”而非僅僅“看到”企業知識,從而在專業領域問答、智能寫作與合規創作等場景中發揮可靠價值,完成從數字化到智能化的關鍵跨越。
以下為演講精彩觀點:
企業AI應用正從“以模型為中心”轉向“以數據為中心”。數據質量成為決定AI應用效果的關鍵。WPS AI以知識增強生成(Knowledge-Augmented Generation)為目標,幫助大模型真正“掌握”企業的知識資產。
要像管理數據一樣管理知識。將數據與知識轉化為AI可用的資產,是企業從數字化邁向智能化的基石。DATA 2.0時代,企業要像管理數據一樣管理知識,WPS 365通過知識建模、知識治理與多模態融合,為企業構建專屬的“企業大腦”。
高質量的輸出,必須始于高質量的輸入。如果輸入的是混亂、沖突的原始數據,無論模型多強大,產出的結果都不可靠。因此,知識治理是AI在專業領域落地的基石,其重要性將超越算法優化本身。
AI的專業化應用是一場“知識工程”,而非簡單的技術集成。從合規報告撰寫到精準信息抽取,其本質都是將專業領域知識系統化、結構化的過程。誰能率先完成自身知識資產的升級,誰就能在AI時代建立真正的競爭優勢。
真正的智能不是“看到”文檔,而是“理解”邏輯。當前主流的AI應用(如RAG)因“語義相似不等于邏輯相關”而遭遇瓶頸。真正的突破在于融合知識圖譜、業務規則等多源知識,讓AI能進行邏輯推理與精準回答,從而解鎖專業場景的價值。
以下是華爾街見聞整理的精華內容:
大模型之后,真正的瓶頸是什么?
當前一個關鍵的共識是,前沿大模型的綜合智能在知識儲備與邏輯理解上已超越普通員工,且模型能力趨同,難以壟斷。那么,核心問題便轉向了:大模型如何在實際應用中發揮真正的價值?
我們的答案是:必須與外部數據,尤其是企業私域數據深度結合。但以“文檔”形式存在的數據本身不等于“知識”,是由于企業海量的文檔(文字、表格、PDF等)存在格式復雜、組織混亂、內容矛盾等“先天不足”。一份文檔中,未休年假折算比例可能是200%,另一份卻是300%;一份法規要求存儲六個月數據,另一份則說只保留必要數據。這些沖突不解決,AI的輸出就不可靠。
更深刻的挑戰在于主流技術范式。當前廣泛應用的RAG(檢索增強生成)技術,其核心是“向量相似度檢索”。這帶來了一個根本性局限:語義相似,不等于邏輯相關。例如,問“筆記本電腦開不了機怎么辦”,系統可能召回一篇詳細介紹“MacBook Pro 14寸”規格的文檔(語義相似),卻錯過了真正解決問題但未提及“筆記本”三個字的故障排查指南(邏輯相關)。這導致許多AI應用“出Demo驚艷,上生產困難”。
從RAG到KAG,構建“知識增強生成”新范式
為了突破這些瓶頸,我們提出必須從RAG演進到KAG(Knowledge Augmented Generation,知識增強生成)。這不是簡單的優化,而是一次范式轉移。其核心觀點有兩個:
一是高質量輸入才有高質量輸出。知識必須先經過治理,解決沖突、補齊缺失、建立結構。
二是必須系統性融合多模態、多結構的知識資產。不能只檢索文檔,還要融合企業已有的知識圖譜、結構化標簽、流程SOP等,為AI生成提供高質量輸入。
基于此,我們設計了一個雙層架構。底層是“知識治理層”,負責文檔解析、知識抽取、圖譜構建與質量監控;上層是“知識應用層”,它多源融合檢索引擎、動態排序模塊、上下文工程體系為核心組件,構建能夠賦能各類專業場景的知識基座。
在四個關鍵場景中落地KAG
基于KAG架構,我們研發了智能文檔庫產品,并聚焦于四個核心場景:
第一,知識治理。 我們通過自動化的知識抽取與圖譜構建,幫助客戶發現文檔庫中的重復內容、邏輯沖突和知識缺失。例如,系統可以自動標出關于年假折算比例的兩個沖突版本,或指出一個“IT支持”知識庫還缺少“打印機驅動安裝”的關鍵章節,輔助管理員進行決策和優化。
第二,專業智能問答。在融合了私域文檔圖譜與行業法規、SOP等結構化知識后,我們的問答系統能處理復雜的專業查詢。例如,用戶可以問:“在浙江省,生產某種特定粒徑的原料藥,是否可以使用X成分?請僅依據2025年的規定。”系統能精準解析地點、成分、年份等多個約束條件,并給出精確答案。
第三,復雜文檔的智能抽取。我們針對醫療報告、合同、發票中常見的復雜表格、復選框、手寫體等進行了專項優化。一家醫藥客戶利用此功能,將藥物不良反應報告的郵件附件自動解析、抽取關鍵字段,并回填至客戶的藥物管理系統,將原本人工處理需數小時的工作縮短到幾分鐘。
第四,專業領域的智能寫作。這不同于寫請假條,而是撰寫有嚴格格式與數據引用精準要求的行業報告(如臨床研究報告CSR)。我們通過兩個智能體(Agent)協同工作:一個負責根據范例和法規生成包含大綱、數據需求的“智能模板”;另一個則依據模板,從海量實驗數據中精準定位、無損引用所需的數據和表格,最終生成格式合規、數據準確的專業報告,將撰寫周期從數周大幅縮短。
像管理數據一樣管理知識
最后,我想做一個總結。從RAG到Graph RAG再到KAG,是一個從“讓大模型看到文檔”,到“理解文檔間邏輯”,再到“真正掌握企業知識資產”的升級。
我們認為,在智能化時代,企業需要構建 “數據湖”與“知識湖”雙湖并重 的新架構。未來,企業不僅要積累原始數據,更要像過去管理數據一樣,系統地進行知識運營、知識建模和知識治理。這,將是企業從數字化邁向智能化的關鍵基石,也是AI在專業領域發揮真正提效作用的必經之路。





京公網安備 11011402013531號