中文名 | 面向科技文獻(xiàn)的引用摘要生成關(guān)鍵技術(shù)研究 | 項(xiàng)目負(fù)責(zé)人 | 李素建 |
---|---|---|---|
項(xiàng)目類(lèi)別 | 面上項(xiàng)目 | 依托單位 | 北京大學(xué) |
本課題圍繞科技文獻(xiàn)展開(kāi)對(duì)科技論文的分析和自動(dòng)摘要研究,四年來(lái)的主要研究?jī)?nèi)容歸納為如下三方面:(1)提出一套科技文獻(xiàn)的篇章標(biāo)注規(guī)范,引入依存結(jié)構(gòu)對(duì)論文段落進(jìn)行篇章表示,并結(jié)合深度學(xué)習(xí)方法探索有效的篇章分析方法;(2)研究科技論文的自動(dòng)分析,從內(nèi)容、引用內(nèi)容、引用重要性等各個(gè)方面進(jìn)行分析;(3)研究自動(dòng)摘要和文本生成方法,提出引用摘要生成方法,并改進(jìn)生成方法的錯(cuò)誤事實(shí)問(wèn)題。課題基本按項(xiàng)目預(yù)定的計(jì)劃進(jìn)行,達(dá)到了項(xiàng)目預(yù)期的目標(biāo),并完成了項(xiàng)目預(yù)期的研究成果?;谝陨涎芯?jī)?nèi)容,形成了理論結(jié)合實(shí)踐、規(guī)范和資源共建、技術(shù)實(shí)用化的一整套比較系統(tǒng)的研究成果。(1)理論成果:圍繞社會(huì)媒體數(shù)據(jù)進(jìn)行熱點(diǎn)話題發(fā)現(xiàn)和摘要的相關(guān)研究成果整理論文31篇發(fā)表在國(guó)內(nèi)外會(huì)議和期刊上。其中,期刊論文6篇,會(huì)議論文25篇,在國(guó)際高水平會(huì)議ACL,AAAI,EMNLP, COLING上共發(fā)表論文13篇。(2)規(guī)范和資源建設(shè):構(gòu)建和完善了一套篇章依存關(guān)系標(biāo)注規(guī)范,并在此規(guī)范下完成798篇科技論文摘要的篇章依存標(biāo)注,506篇摘要被標(biāo)注了兩遍。EDU標(biāo)注采用兩遍標(biāo)注原則,保持兩個(gè)標(biāo)注員的一致性。(3)系統(tǒng)實(shí)踐:基于深度學(xué)習(xí)算法,開(kāi)發(fā)了自動(dòng)引用摘要、自動(dòng)篇章分析、自動(dòng)關(guān)鍵詞分析的demo,并和百度公司合作進(jìn)行研究自動(dòng)閱讀理解技術(shù),相關(guān)技術(shù)已產(chǎn)品化。(4)學(xué)術(shù)交流:與倫斯勒理工大學(xué)、香港理工大學(xué)、中央民族大學(xué)、北京理工大學(xué)、微軟研究院、浪潮公司、Baidu公司等進(jìn)行學(xué)術(shù)交流、資源轉(zhuǎn)讓與技術(shù)合作等。(5)人才培養(yǎng):指導(dǎo)了2名博士生、4名碩士生、6名本科生順利畢業(yè)。所指導(dǎo)的碩士生中1名獲得國(guó)家獎(jiǎng)學(xué)金,1名研究生獲得ACL會(huì)議的杰出論文獎(jiǎng)。多名本科生獲北京大學(xué)信息學(xué)院優(yōu)秀本科畢業(yè)論文。 2100433B
科技文獻(xiàn)的爆炸式增長(zhǎng)使得自動(dòng)摘要成為減輕科研人員負(fù)擔(dān)的一項(xiàng)關(guān)鍵技術(shù),而論文引用能從多個(gè)角度去幫助理解論文的方法、應(yīng)用、貢獻(xiàn)和局限性。因此,本申請(qǐng)的目標(biāo)是探究引用的真正動(dòng)機(jī)和生成式摘要技術(shù)。在此基礎(chǔ)上定義了不同于過(guò)去的引用摘要任務(wù),不限于論文本身內(nèi)容,而進(jìn)一步依據(jù)引用的各個(gè)維度對(duì)論文的影響進(jìn)行總結(jié)。研究?jī)?nèi)容主要包括:(1)研究面向科技文獻(xiàn)的信息抽取技術(shù),克服了傳統(tǒng)信息抽取技術(shù)高度依賴人工的局限性,對(duì)特定領(lǐng)域的實(shí)體、事件、關(guān)系等進(jìn)行自動(dòng)提?。唬?)提出一套科技文獻(xiàn)的篇章標(biāo)注規(guī)范,引入依存結(jié)構(gòu)對(duì)論文段落進(jìn)行篇章表示,并結(jié)合深度學(xué)習(xí)方法探索有效的篇章分析算法;(3)圍繞引用摘要任務(wù)進(jìn)行引用的多維度分析,其中包括引用重要性、引用內(nèi)容、引用傾向性等方面;(4)研究基于模板的引用摘要生成框架,研究以概念為骨架的模板生成技術(shù)、基于篇章分析的文本連貫性計(jì)算模型、基于模板和引用維度分析的引用摘要生成技術(shù)。
提高彩葉樹(shù)年生長(zhǎng)量的關(guān)鍵技術(shù)研究
彩葉樹(shù)種近年來(lái)在各地的需求一直處于上升趨勢(shì),北京、上海、大連等大中城市還特別提出了在城區(qū)主干道兩側(cè)以及重點(diǎn)景區(qū)種植紅色、金色等系列彩葉樹(shù)種,以解決城市綠化色彩單調(diào)的問(wèn)題。但是,設(shè)計(jì)師在做園林設(shè)計(jì)時(shí)依然...
放坡的坡度,邊坡穩(wěn)定驗(yàn)算,支護(hù)方案(如果有的話),分層厚度。 《深基坑工程施工技術(shù)》是虹橋綜合交通樞紐深基坑工程技術(shù)策劃和施工管理過(guò)程的總結(jié)。以基坑工程為主題,以基坑辦案的確定、實(shí)施過(guò)程的控制...
隧道施工需要注意哪些關(guān)鍵技術(shù)問(wèn)題?
開(kāi)挖時(shí)要注意開(kāi)挖進(jìn)尺、控制超欠挖、支護(hù)時(shí)注意鋼架(如果有)連接、防排水同樣是非常重要的,不可忽視、二襯施工時(shí)要注意不能侵線。
格式:pdf
大?。?span id="2wogrbx" class="single-tag-height">85KB
頁(yè)數(shù): 3頁(yè)
評(píng)分: 4.5
介紹了面向機(jī)械設(shè)計(jì)的知識(shí)管理系統(tǒng)的體系結(jié)構(gòu),闡述了知 識(shí)表達(dá)、知識(shí)獲取、知識(shí)利用、知識(shí)管理等關(guān)鍵技術(shù)。知識(shí)工程 為制造業(yè)機(jī)械設(shè)計(jì)中的創(chuàng)新設(shè)計(jì)和敏捷設(shè)計(jì)提供了有力的工具。
格式:pdf
大小:85KB
頁(yè)數(shù): 2頁(yè)
評(píng)分: 4.5
本文以面向機(jī)械產(chǎn)品設(shè)計(jì)的知識(shí)服務(wù)關(guān)鍵技術(shù)作為研究對(duì)象,簡(jiǎn)單對(duì)知識(shí)服務(wù)進(jìn)行了闡述,并結(jié)合我國(guó)知識(shí)服務(wù)相關(guān)技術(shù)研究的現(xiàn)狀,提出了基于PLM的知識(shí)服務(wù)系統(tǒng)架構(gòu)。
提示:
從論文評(píng)價(jià)的形式標(biāo)準(zhǔn)上來(lái)講,參考文獻(xiàn)在體現(xiàn)研究成果層次上具有明顯的評(píng)價(jià)意義。在參考文獻(xiàn)的引用上有幾個(gè)原則需要注意:
1. 該引而不引,學(xué)風(fēng)有問(wèn)題
如果論文中引用了他人的學(xué)術(shù)觀點(diǎn)、數(shù)據(jù)、材料、結(jié)構(gòu)等而不如實(shí)、規(guī)范地標(biāo)注處處,則有缺乏嚴(yán)肅認(rèn)真的科學(xué)態(tài)度或?qū)W術(shù)修養(yǎng)的嫌疑。文獻(xiàn)的引用不僅是對(duì)他人勞動(dòng)成果和著作權(quán)的尊重,也是對(duì)個(gè)人誠(chéng)信的拷問(wèn)。如果漏引的正好是審稿人的文獻(xiàn),則會(huì)造成極壞的影響。
2. 引用不規(guī)范,水平則有限
如果一篇論文的參考文獻(xiàn)在文中文后標(biāo)注的不規(guī)范,或者有錯(cuò)漏,或者格式不一,也從一個(gè)側(cè)面反映出作者寫(xiě)作水平和態(tài)度,缺乏嚴(yán)禁的科學(xué)態(tài)度。這就如同論文寫(xiě)作主體部分表達(dá)不一致、錯(cuò)字別字等會(huì)使人懷疑在研究中是否也是如此粗心大意,那么論證過(guò)程、結(jié)果和結(jié)論都會(huì)讓人生疑。
3. 文獻(xiàn)多與少,充分為最好
文獻(xiàn)量的多少體現(xiàn)出作者占有資料的程度,特別是對(duì)相關(guān)方面的代表性文獻(xiàn)的遺漏會(huì)直接影響著立論的充分性和必要性。文獻(xiàn)引用量的多少,一定程度上代表資料的占有程度、選題的前沿?zé)狳c(diǎn)和選題的重要程度,一般來(lái)講中文論文的文后參考文獻(xiàn)都偏少,這也是事實(shí)。但是,也不能簡(jiǎn)單以文獻(xiàn)引用量達(dá)到多少簡(jiǎn)單劃分,不同學(xué)科、不同性質(zhì)的論文之間的文獻(xiàn)引用量也相差很大。
4. 文獻(xiàn)失效短,表明是熱點(diǎn)
參考文獻(xiàn)過(guò)于陳舊雖然不能說(shuō)研究沒(méi)有創(chuàng)新,但說(shuō)明并非當(dāng)前研究的熱點(diǎn),沒(méi)有人研究和解決可以認(rèn)為是前沿但選題的重要性也就值得懷疑。一些經(jīng)典性文獻(xiàn)長(zhǎng)期以來(lái)被人引用,文獻(xiàn)被引用的半衰期長(zhǎng)短也是評(píng)價(jià)期刊和論文的理論性強(qiáng)弱的指標(biāo),但是從現(xiàn)有研究的文獻(xiàn)引用情況來(lái)看,近五年的研究成果應(yīng)該占有較大的比例。如果近五年里有很少相關(guān)的文獻(xiàn)發(fā)表,那只能講論文的選題并不被人們廣泛關(guān)注。
5. 文獻(xiàn)有層次,增強(qiáng)說(shuō)服力
文獻(xiàn)的作者團(tuán)隊(duì)和發(fā)表的期刊,一定程度上體現(xiàn)出研究選題的高度和層次,特別是行業(yè)內(nèi)的權(quán)威文獻(xiàn)往往具有一定的說(shuō)服力。無(wú)論是期刊還是作者的權(quán)威性并不是自封的,而是其長(zhǎng)期以來(lái)嚴(yán)謹(jǐn)科學(xué)作風(fēng)的積累和體現(xiàn),能夠引用權(quán)威期刊或者權(quán)威作者的文獻(xiàn)自然會(huì)得到同行的認(rèn)可,這是建立在人們對(duì)權(quán)威的信賴基礎(chǔ)上的。
6. 文獻(xiàn)范圍廣,自信能力強(qiáng)
文獻(xiàn)引用貴在科學(xué)合理,如果局限在很窄的一個(gè)范圍也容易造成“攀龍附鳳”“狐假虎威”的嫌疑,實(shí)事求是地引用不同層次期刊和作者、不同語(yǔ)種的相關(guān)文獻(xiàn),更能體現(xiàn)作者對(duì)自己研究成果的自信和對(duì)研究背景的掌握的全面性。與前一條相呼應(yīng),正好是一個(gè)問(wèn)題的兩個(gè)方面。
版權(quán)聲明:
來(lái)源:網(wǎng)絡(luò)。
特別聲明:本微信轉(zhuǎn)載文章出于非商業(yè)性的教育和科研目的,如轉(zhuǎn)載稿涉及版權(quán)等問(wèn)題,請(qǐng)立即聯(lián)系我們,我們會(huì)予以更改或刪除相關(guān)文章,保證您的權(quán)益。
項(xiàng)目針對(duì)SAR影像用于礦區(qū)沉陷監(jiān)測(cè)信息提取中的若干關(guān)鍵問(wèn)題展開(kāi)了研究。主要研究成果如下: (1)對(duì)比分析了ERS、ALOS和TerraSAR-X等數(shù)據(jù)提取開(kāi)采沉陷的能力,實(shí)驗(yàn)發(fā)現(xiàn),ALOS和TerraSAR-X數(shù)據(jù)是相對(duì)比較理想的,但兩者仍有缺點(diǎn),前者時(shí)間間隔太長(zhǎng),而后者波長(zhǎng)過(guò)短,綜合分析而言,ALOS對(duì)提取開(kāi)采沉陷更有幫助,且成本較低。 (2)將Contourlet變換引入到干涉圖濾波方法中,使得在能達(dá)到干涉圖去噪的同時(shí),較好的保留了紋理細(xì)節(jié)信息。 (3)研究了GPS與 MODIS聯(lián)合實(shí)現(xiàn)大氣延遲改正量提取方法,利用兩期GPS觀測(cè)數(shù)據(jù)及相應(yīng)時(shí)間的MODIS數(shù)據(jù),分析GPS-PWV與MODIS-PWV的關(guān)系,進(jìn)一步優(yōu)化了MODIS水汽的校正模型。 (4)研究了一種基于多級(jí)匹配策略的干涉SAR影像自動(dòng)配準(zhǔn)新方法,該方法首先利用SIFT算法提取SAR影像上的特征點(diǎn)并完成特征點(diǎn)初始匹配,之后基于RCM算法剔除相關(guān)性較低的匹配點(diǎn),為減少影像整體匹配誤差,采用PRM算法進(jìn)行匹配點(diǎn)對(duì)的二次篩選,最終完成SAR影像的精確匹配。 (5)探索了大變形條件下兩種干涉SAR技術(shù)解算方法:一種是相干性不好的情況下,采用下沉盆地邊緣點(diǎn)的D-InSAR結(jié)果同少量實(shí)測(cè)點(diǎn)結(jié)合,聯(lián)合解算概率積分法參數(shù);另一種是在相干性較好的情況下,直接采用D-InSAR的結(jié)果反算概率積分法參數(shù)。最后再由概率積分法模型解算地表的總體沉降情況。 (6)對(duì)多基線時(shí)序SAR中的短基線技術(shù)進(jìn)行了分析,并利用該技術(shù)提取了礦區(qū)地表沉降,試驗(yàn)證明:SBAS方法對(duì)干涉圖中相干點(diǎn)的識(shí)別是有利的,但對(duì)礦區(qū)開(kāi)采沉陷的監(jiān)測(cè)效果并不好。 (7)研究了基于支持向量機(jī)的概率積分法參數(shù)及地表下沉預(yù)報(bào)方法;構(gòu)建了概率積分法修正模型的老采空區(qū)殘余移動(dòng)變形預(yù)測(cè)模型及方法; 建立了老采空區(qū)殘余沉降計(jì)算模型,分析了殘余下沉系數(shù)與覆巖巖性、開(kāi)采厚度、開(kāi)采深度及建筑物載荷的關(guān)系。 本項(xiàng)目發(fā)表相關(guān)科研論文36篇,其中SCI檢索1篇,EI檢索8篇,完成了既定的研究目標(biāo)和任務(wù)。 2100433B
大型專(zhuān)用設(shè)備、艦艇、航天器等項(xiàng)目制造產(chǎn)品是為滿足客戶個(gè)性化要求開(kāi)發(fā)的,往往關(guān)系到國(guó)計(jì)民生和軍事國(guó)防。本項(xiàng)目從設(shè)計(jì)方法學(xué)入手,研究面向項(xiàng)目制造產(chǎn)品的協(xié)同設(shè)計(jì)方法,將研究對(duì)象從產(chǎn)品、設(shè)計(jì)過(guò)程擴(kuò)展到設(shè)計(jì)團(tuán)隊(duì)以及他們之間的協(xié)同關(guān)系,并將協(xié)同設(shè)計(jì)的技術(shù)和環(huán)境要求也視為協(xié)同設(shè)計(jì)方法的組成部分;將協(xié)同設(shè)計(jì)從單一的詳細(xì)設(shè)計(jì)階段或單一的學(xué)科系統(tǒng)擴(kuò)展到設(shè)計(jì)階段- - 多學(xué)科領(lǐng)域二維空間,建立項(xiàng)目制造產(chǎn)品多視圖信息模型;基于設(shè)計(jì)結(jié)構(gòu)矩陣技術(shù),建立集成設(shè)計(jì)團(tuán)隊(duì)、任務(wù)管理和產(chǎn)品結(jié)構(gòu)的動(dòng)態(tài)工作流程管理模型;在網(wǎng)格技術(shù)支持下,構(gòu)建基于知識(shí)網(wǎng)格服務(wù)、集成網(wǎng)格工作流和產(chǎn)品多視圖信息模型的項(xiàng)目制造產(chǎn)品協(xié)同設(shè)計(jì)體系結(jié)構(gòu)。以專(zhuān)用船舶為目標(biāo)對(duì)象,開(kāi)發(fā)協(xié)同設(shè)計(jì)原型系統(tǒng),驗(yàn)證本項(xiàng)目研究的方法先進(jìn)性和技術(shù)可行性。本項(xiàng)目的研究對(duì)協(xié)同設(shè)計(jì)理論進(jìn)行拓展,對(duì)協(xié)同設(shè)計(jì)技術(shù)進(jìn)行深化,對(duì)促進(jìn)項(xiàng)目制造產(chǎn)品開(kāi)發(fā)水平和提高產(chǎn)品質(zhì)量具有重要的理論研究?jī)r(jià)值。