人工智能NLP 引擎
主要研究自然語(yǔ)言處理研究領(lǐng)域的算法和應(yīng)用實(shí)踐。涉及語(yǔ)義解析、意圖識(shí)別、FAQ 問(wèn)答、多輪對(duì)話、知識(shí)圖譜等關(guān)鍵技術(shù),研究?jī)?nèi)容包括分詞、向量表示、分類(lèi)等文本預(yù)處理技術(shù),以及將自然語(yǔ)言處理核心算法應(yīng)用落實(shí)到智能客服、NLP 引擎、航天空管交互等實(shí)際場(chǎng)景中,團(tuán)隊(duì)研發(fā)的 AI 產(chǎn)品已經(jīng)跟國(guó)內(nèi)企業(yè)、研究所開(kāi)展了長(zhǎng)期合作并動(dòng)態(tài)跟蹤,獲得了廣泛的一致好評(píng)。
人工智能 NLP 引擎項(xiàng)目是基于多語(yǔ)種分詞、多語(yǔ)種情緒識(shí)別、詞句關(guān)系分析、意圖識(shí)別、文本聚類(lèi)等自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)對(duì)海量錄音文本的知識(shí)挖掘,識(shí)別重要信息。為錄音服務(wù)行業(yè)下游業(yè)務(wù)的分析人員提供分析思路,以便得到多維度、多形式分析結(jié)果,將發(fā)現(xiàn)轉(zhuǎn)換為可落地的業(yè)務(wù)決策,這些數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)決策,包括客戶體驗(yàn)、座席行為、產(chǎn)品改進(jìn)、風(fēng)險(xiǎn)監(jiān)測(cè)等多個(gè)方面,幫助企業(yè)改善用戶體驗(yàn)、降低成本、提升效率、提升業(yè)績(jī)、降低風(fēng)險(xiǎn)等。
1.多語(yǔ)種分詞。分詞指的是將一個(gè)字序列切分成一個(gè)一個(gè)單獨(dú)的詞,是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過(guò)程。文本在入庫(kù)時(shí)調(diào)用接口進(jìn)行了分詞,分詞可用于模型的匹配和熱詞的統(tǒng)計(jì)。
2.詞句關(guān)系分析。根據(jù)詞句關(guān)系接口識(shí)別的中心詞,然后用中心詞進(jìn)行詞頻的統(tǒng)計(jì),對(duì)于目標(biāo)樣本,統(tǒng)計(jì)出高頻中心詞用來(lái)概括目標(biāo)樣本中主要描述的對(duì)話內(nèi)容。
3.意圖識(shí)別。識(shí)別出客戶語(yǔ)句的意圖,以便進(jìn)行相應(yīng)的功能操作、信息推薦等。
4.多語(yǔ)種情緒識(shí)別。情緒識(shí)別是對(duì)包含主觀信息的文本進(jìn)行情感傾向性判斷,正向或者負(fù)向(如果能提供訓(xùn)練數(shù)據(jù)集,可以識(shí)別更多種類(lèi)的情緒)。為客戶之聲下游任務(wù)的口碑分析、話題監(jiān)控、輿情分析等應(yīng)用提供幫助。目前支持中文、粵語(yǔ)的情緒識(shí)別。根據(jù)情緒標(biāo)識(shí),用情緒進(jìn)行搜索和統(tǒng)計(jì)分析。
5.文本聚類(lèi)。文本聚類(lèi)將一大段文本中心詞和中心詞的關(guān)聯(lián)詞、近義詞生成一個(gè)圖,用于可視化文本的內(nèi)容。
6.自定義分詞、意圖。對(duì)分詞分詞、意圖種類(lèi)進(jìn)行增刪、擴(kuò)展、微調(diào)等。
西安電子科技大學(xué)
2022-10-20