智通財(cái)經(jīng)APP獲悉,近日,由釘釘團(tuán)隊(duì)研發(fā)的深度研究系統(tǒng)“Dingtalk-DeepResearch”在國(guó)際權(quán)威評(píng)測(cè)中取得突破性成績(jī),在DeepResearch Bench測(cè)試中以48.49分位列全球第二、國(guó)內(nèi)第一,超越OpenAI、Claude等主流系統(tǒng)。
![]()
據(jù)悉,該系統(tǒng)已成功應(yīng)用于制造業(yè)、供應(yīng)鏈等復(fù)雜場(chǎng)景,能夠在復(fù)雜異構(gòu)表格、多階段推理與多模態(tài)生成任務(wù)中保持行業(yè)領(lǐng)先的準(zhǔn)確性和穩(wěn)健性,幫助企業(yè)高效處理多模態(tài)數(shù)據(jù),實(shí)現(xiàn)智能升級(jí)。
釘釘深度研究系統(tǒng)的這項(xiàng)進(jìn)展,首次實(shí)現(xiàn)了國(guó)際頂級(jí)基準(zhǔn)與實(shí)際生產(chǎn)落地的雙重突破,標(biāo)志著中國(guó)企業(yè)級(jí)AI技術(shù)邁入國(guó)際第一梯隊(duì)。
讓多個(gè)AI系統(tǒng)像團(tuán)隊(duì)協(xié)作般解決復(fù)雜問(wèn)題
Dingtalk-DeepResearch 的核心是設(shè)計(jì)了一種面向真實(shí)企業(yè)場(chǎng)景的多智能體深度研究框架,將深度研究生成、異構(gòu)表格解析與推理、多模態(tài)報(bào)告生成有效整合在同一系統(tǒng)中。
這一設(shè)計(jì)就像是將不同專業(yè)能力的團(tuán)隊(duì)成員整合到一個(gè)系統(tǒng)中:有的擅長(zhǎng)分析表格數(shù)據(jù),有的負(fù)責(zé)生成報(bào)告,有的協(xié)調(diào)工具調(diào)用。通過(guò)三層架構(gòu)設(shè)計(jì)(任務(wù)導(dǎo)向的智能體層、核心引擎層、數(shù)據(jù)層),能夠支撐對(duì)復(fù)雜任務(wù)的并行處理與多階段推理,例如將包含多重嵌套與合并單元格的工廠生產(chǎn)表格,自動(dòng)解析并轉(zhuǎn)化為結(jié)構(gòu)清晰、洞察深刻的分析報(bào)告。
在線學(xué)習(xí)與演進(jìn)機(jī)制,讓 AI 持續(xù)進(jìn)化、越用越聰明
為應(yīng)對(duì)企業(yè)場(chǎng)景的動(dòng)態(tài)變化,該框架區(qū)別于傳統(tǒng)靜態(tài)架構(gòu),通過(guò)熵引導(dǎo)、記憶感知的在線學(xué)習(xí)機(jī)制使智能體能夠持續(xù)演進(jìn),就像員工可通過(guò)反復(fù)實(shí)踐提升技能,而無(wú)需人工干預(yù)。該機(jī)制保障系統(tǒng)能自動(dòng)從歷史交互中歸納經(jīng)驗(yàn),逐步適應(yīng)不同企業(yè)的業(yè)務(wù)流程與用戶操作風(fēng)格。
例如,當(dāng)用戶多次修改AI輸出的報(bào)告格式后,系統(tǒng)會(huì)自主學(xué)習(xí)并記憶用戶對(duì)格式、風(fēng)格及關(guān)鍵點(diǎn)的偏好,在后續(xù)生成中主動(dòng)對(duì)齊用戶需求。在釘釘企業(yè)級(jí)AI平臺(tái)中,這種經(jīng)個(gè)性化調(diào)優(yōu)的偏好可以作為一種能力沉淀并共享給團(tuán)隊(duì)乃至整個(gè)公司,實(shí)現(xiàn)組織知識(shí)的復(fù)用與增效。
閉環(huán)評(píng)估與優(yōu)化系統(tǒng),保障企業(yè)級(jí) AI 輸出質(zhì)量
為確保生成內(nèi)容的準(zhǔn)確性與可靠性,Dingtalk-DeepResearch內(nèi)置了DingAutoevaluator評(píng)估系統(tǒng)。該系統(tǒng)會(huì)對(duì)生成的每一份報(bào)告進(jìn)行多維度“質(zhì)量檢驗(yàn)”,涵蓋數(shù)據(jù)準(zhǔn)確性、邏輯連貫性、工具使用規(guī)范等。一旦發(fā)現(xiàn)問(wèn)題,系統(tǒng)會(huì)自動(dòng)將相關(guān)案例反饋至訓(xùn)練流程以優(yōu)化模型,形成一套從生成、評(píng)估到優(yōu)化的持續(xù)改進(jìn)閉環(huán)。
供應(yīng)鏈、制造業(yè)超復(fù)雜表格處理,復(fù)雜數(shù)據(jù)"秒懂"
目前,Dingtalk-DeepResearch已在多個(gè)真實(shí)業(yè)務(wù)場(chǎng)景中穩(wěn)定應(yīng)用并創(chuàng)造價(jià)值。在供應(yīng)鏈領(lǐng)域,系統(tǒng)能快速分析跨部門的復(fù)雜表格數(shù)據(jù),為采購(gòu)策略提供智能化建議;在制造業(yè),它能將設(shè)備運(yùn)行的原始數(shù)據(jù)自動(dòng)轉(zhuǎn)化為可視化分析報(bào)告,為故障預(yù)測(cè)與維護(hù)提供決策支持。所有核心功能均通過(guò)國(guó)際基準(zhǔn)測(cè)試驗(yàn)證,確保了技術(shù)的可靠性與領(lǐng)先性。
釘釘CTO朱鴻表示,“Dingtalk-DeepResearch通過(guò)結(jié)合自適應(yīng)優(yōu)化和多模態(tài)推理,形成一個(gè)可靈活部署的企業(yè)級(jí)AI框架,旨在處理復(fù)雜且不斷演進(jìn)的真實(shí)業(yè)務(wù)任務(wù)。該技術(shù)正加速在AI搜索、AI表格、自動(dòng)化工作流、Agent平臺(tái)等產(chǎn)品中落地,讓前沿AI技術(shù)更貼近實(shí)際生產(chǎn)需求,為企業(yè)提供真正創(chuàng)造價(jià)值的AI。”





京公網(wǎng)安備 11011402013531號(hào)