近日,中國(guó)科學(xué)院重慶綠色智能技術(shù)研究院大數(shù)據(jù)挖掘及應(yīng)用中心研究團(tuán)隊(duì)在時(shí)間序列的多粒度預(yù)測(cè)模型的研究方面取得進(jìn)展,相關(guān)研究成果發(fā)表在《Chemometrics and Intelligent Laboratory Systems》和《Neurocomputing》國(guó)際期刊上發(fā)表。
具有不確定性特征的數(shù)據(jù)集一直以來(lái)都是數(shù)據(jù)挖掘領(lǐng)域的難點(diǎn)和熱點(diǎn)問(wèn)題,傳統(tǒng)的時(shí)間序列預(yù)測(cè)模型幾乎都是采用數(shù)據(jù)填充等不確定性的方法處理不確定性數(shù)據(jù)集,這使得這些模型在許多領(lǐng)域得不到預(yù)期的預(yù)測(cè)精度。大數(shù)據(jù)挖掘研究團(tuán)隊(duì)通過(guò)分析不同領(lǐng)域的時(shí)間序列數(shù)據(jù)的共同基本特征,以粒計(jì)算理論為基礎(chǔ),分別建立了基于水平粒化(屬性粒化)和垂直粒化(樣本值粒化)的多粒度知識(shí)空間,然后結(jié)合模糊時(shí)間序列預(yù)測(cè)、時(shí)間序列近似周期和粒子群優(yōu)化算法等,提出了兩種時(shí)間序列的多粒度預(yù)測(cè)模型。該模型通過(guò)在不同粒度層次上的切換,實(shí)現(xiàn)了以確定性方法處理不確定性數(shù)據(jù)集的構(gòu)想,并且在“臺(tái)灣加權(quán)股票指數(shù)(TAIEX)”、“城市失業(yè)率”等經(jīng)典的時(shí)間序列預(yù)測(cè)數(shù)據(jù)集上的模擬實(shí)驗(yàn)中獲得了高精度的預(yù)測(cè)結(jié)果。另外,在三峽庫(kù)區(qū)長(zhǎng)江干流的水質(zhì)預(yù)測(cè)模擬試驗(yàn)中表明,該模型完全可以適應(yīng)三峽庫(kù)區(qū)復(fù)雜的時(shí)間序列水質(zhì)預(yù)測(cè),為庫(kù)區(qū)的水質(zhì)預(yù)測(cè)預(yù)警提供依據(jù)。
該研究得到國(guó)家科技重大專(zhuān)項(xiàng)“水體污染控制與治理”的資助。
文章鏈接http://www.sciencedirect.com/science/article/pii/S0169743915002427
ttp://www.sciencedirect.com/science/article/pii/S092523121501348X