一種改進(jìn)的余弦向量度量法文本檢索模型 向量夾角余弦公式
發(fā)布時(shí)間:2020-03-10 來源: 感悟愛情 點(diǎn)擊:
1 引 言 在針對(duì)余弦向量度量法文本檢索模型進(jìn)行研究的過程中,發(fā)現(xiàn)目前經(jīng)典的余弦向量度量法文本檢索模型是以索引項(xiàng)之間相互獨(dú)立為前提的,在現(xiàn)實(shí)應(yīng)用中沒有考慮用戶對(duì)索引項(xiàng)要求不同和索引項(xiàng)相關(guān)性的情況。針對(duì)這一問題有些學(xué)者提出使用索引項(xiàng)相關(guān)性反饋技術(shù)進(jìn)一步改進(jìn)查詢和文本的向量表達(dá)式以提高搜索的效率,但這些學(xué)者的研究在實(shí)際應(yīng)用中也存在一定的局限性。比如提出將文本表示成圖,使用隨機(jī)游走的方式迭代得到索引項(xiàng)權(quán)值,一定程度克服了經(jīng)典向量空間模型各索引項(xiàng)獨(dú)立性假設(shè)的不足,提高了查詢的效率,但該文獻(xiàn)并沒有很好地研究用戶對(duì)索引項(xiàng)要求不同而對(duì)各索引項(xiàng)權(quán)值設(shè)置的情況。提出使用文本與查詢的相關(guān)性反饋技術(shù)來調(diào)整索引項(xiàng)權(quán)值,但該文獻(xiàn)并沒有進(jìn)一步研究索引項(xiàng)之間的相關(guān)性問題。而且查詢表達(dá)式中索引項(xiàng)權(quán)值調(diào)整是依靠人工主觀設(shè)定來進(jìn)行的,權(quán)值的調(diào)整缺乏客觀性依據(jù)?傮w來看,目前余弦向量度量法文本檢索模型中索引項(xiàng)權(quán)值設(shè)置的研究主要來源于經(jīng)典算法且以各個(gè)索引項(xiàng)之間相互獨(dú)立為假設(shè)前提,少數(shù)的研究對(duì)索引項(xiàng)相關(guān)性問題進(jìn)行了探討,但針對(duì)索引項(xiàng)相關(guān)性情況下權(quán)值的調(diào)整以人工主觀給定為主,不能很好地從文本結(jié)構(gòu)中提取索引項(xiàng)之間的相關(guān)性參數(shù);另外,所進(jìn)行的研究多數(shù)是假設(shè)用戶對(duì)各索引項(xiàng)要求是沒區(qū)別的,各索引項(xiàng)之間的關(guān)系不能得到很好體現(xiàn),在用戶對(duì)索引項(xiàng)有偏好的情況下檢索結(jié)果不能很好地滿足用戶的需求。
相關(guān)熱詞搜索:法文 余弦 向量 一種改進(jìn)的余弦向量度量法文本檢索模型 一種改進(jìn)的余弦距離測(cè)度 向量余弦距離
熱點(diǎn)文章閱讀