近日,重慶研究院大數(shù)據(jù)挖掘及應用中心團隊在建立長期有效的推薦系統(tǒng)研究方面取得進展,研究人員率先提出了推薦系統(tǒng)個性化的概念,并對推薦系統(tǒng)的個性化和建立長期有效的推薦系統(tǒng)進行了系統(tǒng)地研究。
由于信息技術(shù)的不斷發(fā)展和互聯(lián)網(wǎng)經(jīng)濟的日益繁榮,使得人們被迫生活在一個信息爆炸的大數(shù)據(jù)時代,人們每天都要被迫面對大量各種各樣的信息,從而造成了嚴重的信息過載問題。如何從海量看似無關的數(shù)據(jù)中快速有效地篩選和找到用戶感興趣的信息,是迫切需要解決的問題。目前解決信息過載問題主要有兩個技術(shù):搜索引擎和推薦系統(tǒng)。搜索引擎往往被動地返回與用戶給定查詢關鍵字相匹配的內(nèi)容,而推薦系統(tǒng)可以主動預測用戶可能感興趣的信息。事實上,目前搜索引擎也在不斷植入推薦技術(shù),因此從長遠角度來看,推薦系統(tǒng)將是解決信息過載問題的最有效手段。然而,現(xiàn)有的推薦系統(tǒng)往往使用單一的推薦算法,即使采用多種算法進行混合,因為各個參數(shù)在使用時對所有用戶也是固定不變的,因此仍然可以視為一個單一的推薦算法。雖然單一的推薦算法可以在一定程度上提升推薦系統(tǒng)的性能,但是這些方法往往忽略了用戶興趣愛好隨時間變化、選擇行為的差異性以及使用推薦系統(tǒng)的長期效應(如對系統(tǒng)健康性的影響)等這些因素。
針對這些新的問題,該研究團隊首先提出了一種算法參數(shù)個性化的推薦算法,通過為不同的用戶設置不同的參數(shù)來混合兩個不同的推薦算法。相比固定參數(shù)和單一推薦算法,該方法可以獲得更好的推薦效果。其次,該研究團隊認為理想的推薦系統(tǒng),應該是每個用戶都采用最適合他們自己的推薦算法,即推薦算法的個性化,在該方面的研究中,研究團隊提出了實現(xiàn)推薦算法個性化的兩類方法:其一是把選擇權(quán)交給用戶,系統(tǒng)提供某種機制讓用戶實現(xiàn)算法的自主選擇,其二是系統(tǒng)通過深入挖掘每個人的行為模式,自動發(fā)現(xiàn)用戶最佳的推薦算法,并提供一種機制讓用戶確認。最后,為了評測使用推薦系統(tǒng)的長期效應,該研究團隊提出了一種推薦網(wǎng)絡演化模型,并在演化網(wǎng)絡上,對推薦算法個性化的推薦系統(tǒng)的長期效應進行了分析。實驗結(jié)果表明,對于采用單一推薦算法的推薦系統(tǒng),采用推薦算法個性化的推薦系統(tǒng)在顯著提高推薦精度的同時,可以在推薦精度和系統(tǒng)的健康性方面起到很好的均衡作用。
由于推薦系統(tǒng)被認為是在大數(shù)據(jù)時代解決信息過載問題最有希望的技術(shù),該研究在解決推薦系統(tǒng)的長期有效性問題方面取得了一定的突破,在推薦系統(tǒng)個性化發(fā)展方面提供了一定的理論基礎和技術(shù)保障,對設計下一代高效率的推薦系統(tǒng)具有很好的指導作用。
上述研究內(nèi)容獲得國家自然科學基金項目和重慶市基礎科學與前沿研究技術(shù)重點專項支持。