由中國(guó)傳媒大學(xué)理工學(xué)部計(jì)算機(jī)學(xué)院媒體信息技術(shù)研究所承擔(dān)的北京市科委項(xiàng)目《基于類(lèi)腦知識(shí)圖譜的中文新聞自動(dòng)寫(xiě)作系統(tǒng)的研發(fā)》經(jīng)過(guò)現(xiàn)階段的研究,已初見(jiàn)成效。
本課題旨在中文新聞?lì)I(lǐng)域,依據(jù)大腦對(duì)新聞?wù)Z言(尤其是中文)的認(rèn)知及表達(dá)功能的理論模型,研究類(lèi)腦的中文知識(shí)圖譜技術(shù)和語(yǔ)言表達(dá)過(guò)程,結(jié)合類(lèi)腦計(jì)算與深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)中文知識(shí)圖譜的建立和中文新聞的報(bào)道自動(dòng)生成。
本課題目前已經(jīng)建立農(nóng)業(yè)和體育等相關(guān)領(lǐng)域的知識(shí)圖譜,改進(jìn)并提高了內(nèi)容選擇方法的算法效率,結(jié)合自然語(yǔ)言生成技術(shù),初步實(shí)現(xiàn)了面向農(nóng)業(yè)領(lǐng)域的天氣預(yù)報(bào)文本和面向體育領(lǐng)域的賽事報(bào)道的自動(dòng)生成。
在新聞?lì)I(lǐng)域,國(guó)外自動(dòng)寫(xiě)作的優(yōu)秀代表是Automated Insights和Narrative Science兩家公司,他們已將技術(shù)成功應(yīng)用于財(cái)經(jīng)、氣象/地質(zhì)、體育、健康等領(lǐng)域的常規(guī)稿件的生產(chǎn)中。國(guó)內(nèi)目前已開(kāi)發(fā)的新聞寫(xiě)作機(jī)器人包括騰訊公司的Dreamwriter、新華社的“快筆小新”、第一財(cái)經(jīng)的DT稿王以及今日頭條的xiaomingbot等。本課題從更深層次上模仿大腦對(duì)自然語(yǔ)言的處理,研究并形成針對(duì)中文的類(lèi)腦知識(shí)圖譜,從而達(dá)到更好支持中文文本自動(dòng)生成的目的。
本課題的研究成果將有助于提升中文自動(dòng)生成技術(shù),提高我國(guó)媒體研發(fā)和掌握內(nèi)容自動(dòng)生產(chǎn)方面的核心技術(shù)能力,同時(shí)可提高記者工作效率,增加媒體的內(nèi)容覆蓋范圍,加強(qiáng)和改進(jìn)新聞?shì)浾摴ぷ鳎瑸榇蟊娞峁└鼮閺V泛和快捷的新聞資訊服務(wù)。非全日制研究生