近日,在人工智能領(lǐng)域的權(quán)威學(xué)術(shù)評測——第八屆國際對話系統(tǒng)技術(shù)挑戰(zhàn)賽(DSTC-8)上,騰訊云小微技術(shù)團(tuán)隊(duì)在參與的三個(gè)賽道七項(xiàng)任務(wù)中,共獲得四項(xiàng)指標(biāo)世界第一、兩項(xiàng)指標(biāo)第二的優(yōu)秀成績。這個(gè)成績是騰訊云小微團(tuán)隊(duì)和騰訊智能平臺(tái)產(chǎn)品部多年來在自然語言對話領(lǐng)域的積極探索和深度積累的一個(gè)具體體現(xiàn)和印證。
應(yīng)對多個(gè)賽道挑戰(zhàn) 騰訊云小微展示NLP技術(shù)實(shí)力
DSTC對話系統(tǒng)技術(shù)挑戰(zhàn)賽被公認(rèn)為國際頂尖人工智能競賽之一,創(chuàng)立至今已經(jīng)舉辦八屆。歷屆大賽中都有國際領(lǐng)先的大學(xué)和高科技公司的支持和參與。本屆大賽吸引了來自中科大、華為、滴滴、IBM等全球頂尖的大學(xué)、科技企業(yè)和人工智能研究機(jī)構(gòu)等多支隊(duì)伍參與競賽,帶來了當(dāng)今人工智能領(lǐng)域的頂尖技術(shù)水平的展示和交流。
在本次比賽的四大賽道中,騰訊云小微參與了其中三組評測。首先是面向多領(lǐng)域端到端對話系統(tǒng)( Multidomain Task),該任務(wù)探索如何將已有的對話生成模型迅速遷移到一個(gè)數(shù)據(jù)量非常有限的新領(lǐng)域?qū)υ拡鼍埃⑦_(dá)到期望的性能。本賽道中,騰訊云小微提出混合微調(diào)訓(xùn)練技術(shù),取得了自動(dòng)評測的第一名。
在賽道二端到端的問答預(yù)測( NOESIS II: Predicting Responses Track) 上,本屆NOESIS競賽與以往不同,除了傳統(tǒng)的“多輪對話回復(fù)選擇問題”(Subtask1-包含兩個(gè)子任務(wù))之外,還增加了“基于聊天室(IRC)的回復(fù)選擇問題”(Subtask2),以及“定位多輪對話中的問題是否得到解決”的新任務(wù)(Subtask3), 難度較以往有所增加。
本賽道中騰訊云小微參加了四項(xiàng)子任務(wù)。上圖為騰訊云小微提出的對話回復(fù)選擇模型。在BERT模型基礎(chǔ)上分別增加了數(shù)據(jù)增強(qiáng)技術(shù),用來彌補(bǔ)特定領(lǐng)域的數(shù)據(jù)稀疏問題;同時(shí)利用遷移學(xué)習(xí)技術(shù),將BERT模型從通用領(lǐng)域準(zhǔn)確的適配到指定的任務(wù)領(lǐng)域中;應(yīng)對句子級上下文建模方法,捕捉整體對話中各個(gè)部分之間的細(xì)微聯(lián)系,從而生成更準(zhǔn)確的回復(fù)。通過綜合以上多種NLP模型,騰訊云小微團(tuán)隊(duì)最終以較大領(lǐng)先優(yōu)勢獲得三項(xiàng)第一和一項(xiàng)第二的成績。在多輪人機(jī)對話任務(wù)中,騰訊云小微準(zhǔn)確率達(dá)到97.9%,代表了AI機(jī)器人回復(fù)能力的新突破。在本屆DSTC新增的IRC聊天室對話的任務(wù)中,騰訊云小微的準(zhǔn)確率達(dá)到95.7%,凸顯了在行業(yè)中的領(lǐng)先技術(shù)水平。
在對話狀態(tài)追蹤任務(wù) (Schema-Guided Dialogue State Tracking Track)方面,與以往的狀態(tài)追蹤任務(wù)不同,該任務(wù)是Google提出的一個(gè)全新的任務(wù),旨在推進(jìn)零樣本(Zero-Shot)對話狀態(tài)追蹤技術(shù)的研究,難度較大。本賽道中,騰訊團(tuán)隊(duì)提出了一個(gè)基于預(yù)訓(xùn)練BERT模型的領(lǐng)域無關(guān)的零樣本學(xué)習(xí)系統(tǒng),可以有效捕捉意圖槽位的自然語言描述和對話上下文的語義聯(lián)系,取得了總成績第二名。
結(jié)合豐富應(yīng)用場景 AI語音技術(shù)不斷進(jìn)步
對話系統(tǒng)技術(shù)可以理解為AI模擬人的對話技術(shù),很多復(fù)雜的交流場景中,AI仍在不斷進(jìn)化,以模擬出更貼近人與人之間的對話模式。隨著AI技術(shù)從研究逐步走向應(yīng)用,人們對于AI助手提出了更高的要求。作為代表了全球高水平技術(shù)的DSTC競賽,也根據(jù)實(shí)際應(yīng)用場景設(shè)置比賽項(xiàng)目,并不斷提升比賽的挑戰(zhàn)性。
對話機(jī)器人已經(jīng)在智能硬件、智能客服、智能外呼等領(lǐng)域有了一定普及度的應(yīng)用,但是在人機(jī)對話的效率、準(zhǔn)確性和人性化等方面,科學(xué)家們?nèi)栽诔掷m(xù)的探索和提高。從不斷提高的挑戰(zhàn)成績也能看出,新技術(shù)正在努力讓AI助手更好的理解人類、服務(wù)人類。
例如在客服機(jī)器人的場景中,如何通過連續(xù)性對話獲取用戶信息輸入,給出更快速準(zhǔn)確的響應(yīng);如何在任務(wù)型對話場景中支持反問和打斷,實(shí)現(xiàn)自動(dòng)語義理解和糾錯(cuò);如何在跨領(lǐng)域知識場景下快速遷移機(jī)器人的能力,能幫助不同行業(yè)的合作伙伴快速搭建AI助手的服務(wù)能力;如何快速學(xué)習(xí)和抽取各領(lǐng)域的知識以高效率低成本的建設(shè)行業(yè)知識庫等。
騰訊云小微AI助手 助力各行業(yè)智慧化升級
騰訊智能平臺(tái)產(chǎn)品部NLP技術(shù)團(tuán)隊(duì)專注于AI對話領(lǐng)域的前沿探索及應(yīng)用研究,并發(fā)揮自身的技術(shù)積累和生態(tài)連接能力,與各行各業(yè)的業(yè)務(wù)場景相結(jié)合,提供騰訊云小微AI應(yīng)用解決方案。結(jié)合騰訊云平臺(tái)豐富的內(nèi)容和服務(wù)資源,騰訊云小微已經(jīng)在車載語音助手、智能機(jī)器人、智能家居產(chǎn)品、景區(qū)智能導(dǎo)覽、政務(wù)在線服務(wù)機(jī)器人、AI助教等領(lǐng)域落地,截止目前激活數(shù)已經(jīng)過億。
騰訊云小微攜手騰訊云和生態(tài)合作伙伴廣泛落地
在教育、公共服務(wù)、泛互聯(lián)網(wǎng)服務(wù)、文旅等重點(diǎn)領(lǐng)域, 騰訊云小微AI語音助手仍在不斷的提升技術(shù)能力,積累行業(yè)知識理解能力,幫助行業(yè)客戶快速打造逼真的對話體驗(yàn)。騰訊云小微期待為教育的公平化、信息化升級提供技術(shù)助力,助力企業(yè)和政府提升生產(chǎn)力和服務(wù)效率,成為各行業(yè)智能化升級的數(shù)字化助手。(中經(jīng))