大數(shù)據(jù)集下休息日效應(yīng)的客流量預(yù)測模型
摘要:在傳統(tǒng)統(tǒng)計分析工具無法直接對原始數(shù)據(jù)進行建模分析的前提下,利用大數(shù)據(jù)工具對原始數(shù)據(jù)進行提取、轉(zhuǎn)換和加載(ETL),再通過統(tǒng)計分析工具對樣本數(shù)據(jù)進行可視化預(yù)測分析。本文通過Hadoop分布式集群對廣東省部分公交線路嶺南通用戶2014年5個月的800多萬條刷卡數(shù)據(jù)進行數(shù)據(jù)清洗,通過樣本數(shù)據(jù)分析了公交客流量以周為周期的波動規(guī)律,并結(jié)合休息日(節(jié)假日、周末)效應(yīng),選用多元季節(jié)性時間序列模型對日時段客流量進行時間序列建模,最后通過外推預(yù)測評估模型,平均誤差不超過5%,結(jié)論表明該模型適用于公交時段客流量的短時預(yù)測。
注: 保護知識產(chǎn)權(quán),如需閱讀全文請聯(lián)系長江工程職業(yè)技術(shù)學(xué)院學(xué)報雜志社