快科技7月4日消息,根據自然語言轉SQL(NL2SQL)國際評測平台BIRD-Bench公布的最新結果:騰訊雲自研數據分析智能體TCDataAgent獲得全球第三、國內第一,刷新了國內在該領域的最佳成績,超越眾多國際科技巨頭。
BIRD-Bench被譽為NL2SQL全球最難榜單,它不僅要求系統將自然語言問題準確翻譯成SQL語句,還要確保生成的SQL在超大、超真實、藏著各種的企業級資料庫里,又快又准地跑出來。
測評用的樣本,涵蓋了金融、醫療、體育等37個真實行業場景,總數據量達到33GB,考題多達1萬+條。
但就是在這樣嚴苛的條件下,騰訊雲TCDataAgent依然取得了75.74分的高分。
據介紹,傳統方法容易在複雜結構或語義模糊時猜錯用戶意圖,TCDataAgent則在三大方向取得突破:
錯誤自動識別與修正:引入資料庫約束驗證機制,能夠像質檢員一樣自動發現並修復SQL語句中的結構性或語義性錯誤;
理解資料庫內容:讓模型緊密結合資料庫的真實內容來生成和優化SQL,極大提升了意圖理解和結果的可信度;
高質量訓練篩選:通過後訓練(post-training)技術,優先篩選並復用效果最優的SQL樣本進行訓練疊代。
這項技術的創新成果,也被資料庫領域頂尖國際會議VLDB接收發表,論文中的實驗顯示,TCDataAgent的核心模塊可以集成到其他同類系統中,能將查詢執行準確率最高提升18.3%。