格式:pdf
大?。?span class="single-tag-height">268KB
頁數(shù):
提出Dirichlet混合多項(xiàng)式(DCM)流形,并利用DCM流形可與正半球流形建立同胚和等距關(guān)系的性質(zhì),通過拉回映射將正半球流形的測地距離映射為DCM流形的測地距離,從而在DCM流形上建立距離度量,構(gòu)建統(tǒng)計(jì)流形上的Dirichlet混合多項(xiàng)式擴(kuò)散核和Dirichlet混合多項(xiàng)式倒排文檔頻率(DCMIDF)擴(kuò)散核.利用WebKB Top4和20 Newsgroups語料庫上進(jìn)行實(shí)驗(yàn),DCM流形能比歐氏空間更能準(zhǔn)確地描述文本.與多項(xiàng)式核支持向量機(jī)算法、,負(fù)測地距離核支持向量機(jī)算法相比,實(shí)驗(yàn)結(jié)果顯示文中基于DCM擴(kuò)散核和DCMIDF擴(kuò)散核的支持向量機(jī)算法可取得良好的文本分類效果.