最近,阿里云飛天實(shí)驗(yàn)室自主研發(fā)的數(shù)據(jù)分析智能體 “析言 XiYan-SQL” 在全球權(quán)威的 SQL 診斷評測基準(zhǔn) BIRD-CRITIC(也稱 SWE-SQL)中表現(xiàn)優(yōu)異,成功登頂所有開放榜單,超越了多家國內(nèi)外頂尖團(tuán)隊(duì),刷新了 SQL 診斷與修復(fù)的行業(yè)紀(jì)錄。
BIRD-CRITIC 基準(zhǔn)是由學(xué)術(shù)界與 Google Cloud 合作推出,旨在探討 “大語言模型能否解決真實(shí)數(shù)據(jù)庫應(yīng)用中的用戶問題”。該評測將企業(yè)中常見的數(shù)據(jù)庫報(bào)錯(cuò)、性能問題和查詢需求整理成題目,涵蓋了 MySQL、PostgreSQL、SQL Server、Oracle 等主流數(shù)據(jù)庫系統(tǒng)。評測題目既包括簡單查詢,也包含復(fù)雜的插入、更新、刪除操作,還涉及許多模型之前未見過的新場景,整體難度遠(yuǎn)高于傳統(tǒng)的 “自然語言生成 SQL” 測試。
在這項(xiàng)評測中,析言 XiYan-SQL 在 BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG 和 BIRD-CRITIC-Flash 三個(gè)重要榜單上均取得第一名的好成績,并在跨方言魯棒性、復(fù)雜 SQL 處理能力、真實(shí)問題修復(fù)率和分布外泛化等多個(gè)維度得到了權(quán)威驗(yàn)證。
技術(shù)方面,析言 XiYan-SQL 通過相關(guān)模式篩選(Schema Filter)、多生成器集成(Multi-Generator Ensemble)、候選重組與最優(yōu)選擇(Selection with Candidate Reorganization)等創(chuàng)新手段,使得模型既能夠生成高質(zhì)量的 SQL,同時(shí)也兼顧了可執(zhí)行性和可維護(hù)性。這一模型可以在存在臟數(shù)據(jù)、異構(gòu)模式以及跨方言差異的真實(shí)系統(tǒng)中,提供高可用的診斷與修復(fù)方案。
目前,基于 XiYan-SQL 技術(shù)打造的生成式商業(yè)智能(GBI)產(chǎn)品 “析言” 已在阿里云百煉平臺上線,提供 SQL 生成與診斷服務(wù)。
劃重點(diǎn):





京公網(wǎng)安備 11011402013531號