下一代數(shù)據(jù)庫(kù)技術(shù)展現(xiàn)大幅減少AI“幻覺(jué)”潛力
222
訂閱已訂閱已收藏
收藏點(diǎn)擊播報(bào)本文,約
科技日?qǐng)?bào)訊 (記者劉霞)為破解人工智能(AI)智能體常見(jiàn)的“幻覺(jué)”,韓國(guó)科學(xué)技術(shù)院與初創(chuàng)公司GraphAI的科學(xué)家開(kāi)發(fā)出下一代數(shù)據(jù)庫(kù)技術(shù)“AkasicDB”。它創(chuàng)造性地將向量數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)的功能融于一體,能同時(shí)理解文檔、數(shù)據(jù)及實(shí)體之間的深層關(guān)聯(lián)。該成果或有望加快企業(yè)級(jí)AI商業(yè)化的步伐。相關(guān)論文發(fā)表于《國(guó)際數(shù)據(jù)管理會(huì)議論文集》。
現(xiàn)實(shí)中,企業(yè)數(shù)據(jù)往往分布于文檔、表格和復(fù)雜的實(shí)體關(guān)系之間,令A(yù)I難以全面消化和善用。于是,AI常在依據(jù)不足時(shí)生成事實(shí)錯(cuò)誤的回應(yīng),這就是“幻覺(jué)”,被視作企業(yè)級(jí)AI大規(guī)模落地的主要障礙。
傳統(tǒng)的檢索增強(qiáng)生成(RAG)方法在面對(duì)復(fù)雜查詢時(shí)便力不從心,因?yàn)檫@類(lèi)查詢還必須兼顧文檔中實(shí)體間的關(guān)系,或特定的時(shí)間、類(lèi)型、范圍等結(jié)構(gòu)化條件。為破解這一難題,團(tuán)隊(duì)提出了Omni RAG方案,將向量相似性搜索、圖的遍歷和關(guān)系過(guò)濾統(tǒng)一納入單一的查詢與執(zhí)行計(jì)劃。Omni RAG能同時(shí)挖掘文檔的語(yǔ)義信息、知識(shí)圖譜的關(guān)系信息以及表格的結(jié)構(gòu)化條件,從而鎖定更精確的證據(jù),顯著削弱AI的“幻覺(jué)”。
在此基礎(chǔ)上,團(tuán)隊(duì)推出了AkasicDB,將向量數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)集成到同一個(gè)數(shù)據(jù)庫(kù)管理系統(tǒng)內(nèi),最大限度地消除了不必要的中間結(jié)果和數(shù)據(jù)搬移,大幅削減了大型語(yǔ)言模型需要處理的詞元數(shù)量,并顯著縮短了響應(yīng)時(shí)間。
實(shí)驗(yàn)中,復(fù)雜搜索查詢?cè)诂F(xiàn)有系統(tǒng)里最長(zhǎng)耗時(shí)21.3秒,而在AkasicDB上不到1秒,性能躍升超過(guò)20倍。同時(shí),與傳統(tǒng)RAG相比,Omni RAG還將回應(yīng)準(zhǔn)確率最高提升了78%。這些結(jié)果展現(xiàn)出其大幅減少“幻覺(jué)”的潛力。
團(tuán)隊(duì)表示,AkasicDB是面向AI智能體時(shí)代的下一代數(shù)據(jù)庫(kù)技術(shù),有望在國(guó)防、制造、金融、法律、科技等對(duì)可靠性要求極高的領(lǐng)域,作為核心數(shù)據(jù)基礎(chǔ)設(shè)施廣泛應(yīng)用。
關(guān)注公眾號(hào):人民網(wǎng)財(cái)經(jīng)
分享讓更多人看到
熱門(mén)排行
微信掃一掃提供新聞線索


































第一時(shí)間為您推送權(quán)威資訊
報(bào)道全球 傳播中國(guó)
關(guān)注人民網(wǎng),傳播正能量