基于SVM和多特征融合的滬銅期貨價格預(yù)測分析論文
基于SVM和多特征融合的滬銅期貨價格預(yù)測分析論文
期貨(Futures)與現(xiàn)貨完全不同,現(xiàn)貨是實實在在可以交易的貨(商品),期貨主要不是貨,而是以某種大眾產(chǎn)品如棉花、大豆、石油等及金融資產(chǎn)如股票、債券等為標(biāo)的標(biāo)準(zhǔn)化可交易合約。因此,這個標(biāo)的物可以是某種商品(例如黃金、原油、農(nóng)產(chǎn)品),也可以是金融工具。以下是學(xué)習(xí)啦小編今天為大家精心準(zhǔn)備的:基于SVM和多特征融合的滬銅期貨價格預(yù)測分析相關(guān)論文。內(nèi)容僅供參考閱讀,希望大家能夠喜歡。
基于SVM和多特征融合的滬銅期貨價格預(yù)測分析全文如下:
一、研究背景和目的
銅是人類最早發(fā)現(xiàn)的金屬之一,被廣泛應(yīng)用到電氣電子工業(yè)、機(jī)械制造、化學(xué)工業(yè)、建筑工業(yè)、醫(yī)學(xué)和國防工業(yè)等。在中國,銅在有色金屬材料的消費量近次于鋁。隨著我國經(jīng)濟(jì)快速穩(wěn)步發(fā)展,已成為全球銅消費最大的國家。我國作為銅資源相對短缺國家,每年需進(jìn)口大量銅礦。但由于銅市的價格波動,對消費者、生產(chǎn)與經(jīng)營者的利益造成了重大影響。因此,通過研究銅期貨價格規(guī)律,可以一定程度上規(guī)避價格風(fēng)險,穩(wěn)定經(jīng)濟(jì)健康發(fā)展。
本文研究的內(nèi)容是基于SVM統(tǒng)計機(jī)器學(xué)習(xí)方法,融合宏觀經(jīng)濟(jì)因素、銅現(xiàn)貨、LME銅期貨價格和美元匯率來研究上海銅期貨價格預(yù)測。
二、相關(guān)工作介紹
目前國內(nèi)學(xué)者對于滬銅期貨價格研究關(guān)注于兩個方面:一是研究國外期銅和上海期銅價格的相關(guān)關(guān)系;二是研究上海銅現(xiàn)貨價格與上海期銅價格的相關(guān)關(guān)系。
蔣序標(biāo)[1]研究倫敦金屬交易所(LME)和上海期貨交易所(SHFE)期貨銅的價格引導(dǎo)關(guān)系。其結(jié)論為倫敦銅期貨價格只單向滯后引導(dǎo)滬銅期貨價格, 滬銅期貨對于倫敦銅期貨價格無滯后價格引導(dǎo)關(guān)系。芮執(zhí)多[2]將SHFE、LME和紐約商業(yè)交易所(COMEX)中銅期貨價格聯(lián)動關(guān)系做了動態(tài)分析。其結(jié)論為LME的銅期貨定價能力最強(qiáng),而SHFE也具有了一定的國際影響力。
田新民[3]通過協(xié)整方法及因果關(guān)系分析研究滬銅與倫銅的價格引導(dǎo)關(guān)系,得出倫敦金融交易所銅期貨價格對于上海期貨交易所的銅期貨價格具有主導(dǎo)作用的結(jié)論。同時,SHFE的銅期貨價格的影響力也在增強(qiáng)。劉勃[4]通過協(xié)整與向量自回歸方法,研究倫敦金屬交易所期銅、上海期貨交易所期銅和上海銅現(xiàn)貨價格之間的關(guān)系。
實證顯示,上述三者因素具有長期均衡關(guān)系,并且倫敦期銅價格具有主導(dǎo)價格發(fā)現(xiàn)作用。趙亮[5]通過Granger協(xié)整分析,得出滬銅期貨與倫敦銅期貨價格具有協(xié)整關(guān)系,并且滬銅期貨價格對于倫敦銅期貨價格具有一定的影響作用。王淑嫻[6]通過分析倫敦銅期貨價格、上海鋁期貨價格、燃油期貨價格和江西銅業(yè)股票價格,得出滬銅價格的主要影響因素是倫敦銅期貨價格的結(jié)論。方燕[7]通過對滬銅期貨價格與現(xiàn)貨價格的實證分析,得出滬銅期貨價格與現(xiàn)貨價格在長期與短期具有不同的影響系數(shù)。顧浩[8]通過實證方法,分析得出滬銅期貨與現(xiàn)貨價格存在協(xié)整關(guān)系,并研究了存在協(xié)整關(guān)系的原因。
三、本文工作介紹
本文通過SVM統(tǒng)計機(jī)器學(xué)習(xí)方法,融合宏觀經(jīng)濟(jì)因素(包括居民消費者價格指數(shù)(CPI)、工業(yè)品出產(chǎn)價格指數(shù)(PPI)、采購經(jīng)理人指數(shù)(PMI)、城鎮(zhèn)固定資產(chǎn)投資、工業(yè)增加值增長、貨幣供應(yīng)量、海關(guān)進(jìn)出口增減情況、全國股票交易統(tǒng)計和新增信貸數(shù)據(jù))、銅現(xiàn)貨價格、LME銅期貨價格和美元匯率多特征因素,分析預(yù)測上海銅期貨價格變動。
數(shù)據(jù)采用上海期貨交易所銅期貨合約cu1402在2013年2月19日至2013年12月30日的交易數(shù)據(jù),其包括每日的開盤價、最高價、最低價、收盤價、結(jié)算價、成交量、成交金額等。銅現(xiàn)貨價格采用同期上海期貨交易所滬銅連續(xù)交易數(shù)據(jù),其包括每日開盤價、最高價、最低價、收盤價和成交量。
宏觀經(jīng)濟(jì)因素采用同期數(shù)據(jù)包括居民消費者價格指數(shù)(全國、城鎮(zhèn)、農(nóng)村的當(dāng)月、同比增長、環(huán)比增長和累計增長)、工業(yè)品出產(chǎn)價格指數(shù)(當(dāng)月、當(dāng)月同比增長和累計)、采購經(jīng)理人指數(shù)(制造業(yè)、非制造業(yè)的指數(shù)、同比增長)、城鎮(zhèn)固定資產(chǎn)投資(當(dāng)月、同比增長、環(huán)比增長、自年初累計)、工業(yè)增加值增長(同比增長和累計增長)、貨幣供應(yīng)量(流通中的現(xiàn)金M0、貨幣M1、貨幣和準(zhǔn)貨幣M2的數(shù)量、同比增長和環(huán)比增長)、海關(guān)進(jìn)出口增減情況一覽表(當(dāng)月出口、當(dāng)月進(jìn)口、累計出口和累計進(jìn)口的金額、同比增長和環(huán)比增長)、全國股票交易(上海、深圳的發(fā)行總股本、市價總值、成交金額、成交量、A股最高綜合股指指數(shù)和A股最低綜合股價指數(shù))和新增信貸數(shù)據(jù)(當(dāng)月、同比增長、環(huán)比增長和累計)。
LME銅期貨數(shù)據(jù)采用同期數(shù)據(jù)包括當(dāng)日的開盤價、收盤價、最高價、最低價和成交量。美元匯率采用同期數(shù)據(jù)包括當(dāng)日的收盤價、開盤價、最高價、最低價和百分比變化。模型輸入數(shù)據(jù)包括以上特征,輸出數(shù)據(jù)為預(yù)測下一日的開盤價、最高價、最低價和收盤價。
支持向量機(jī)(support vector machines,SVM)是一種二類分類模型。其基本模型是定義在特征空間上的間隔最大的線性分類器。因此,支持向量機(jī)的學(xué)習(xí)策略就是間隔最大化,可看作是一個求解凸二次規(guī)劃的問題。支持向量機(jī)包括線性可分支持向量機(jī)、線性支持向量機(jī)和非線性支持向量機(jī)。
本文采用非線性支持向量機(jī),使用核技巧和軟間隔最大化來學(xué)習(xí)模型。其中,核函數(shù)在當(dāng)輸入空間為歐式空間、特征空間為希爾伯特空間時,表示從輸入空間映射到特征空間得到的特征向量間的內(nèi)積。因此,通過使用核函數(shù)將輸入空間中的非線性分類問題轉(zhuǎn)換為在高維特征空間學(xué)習(xí)線性分類問題。
四、模型結(jié)果
采用SVM方法訓(xùn)練測試模型,其中輸入的多特征包括當(dāng)日滬期銅合約cu1402數(shù)據(jù)、宏觀經(jīng)濟(jì)數(shù)據(jù)、銅現(xiàn)貨價格、LME銅期貨價格和美元匯率,預(yù)測下一天滬期銅合約cu1402的開盤價、最高價、最低價和收盤價。
從預(yù)測結(jié)果可以看出,在向前預(yù)測25天之內(nèi)的滬銅價格時,累計平均誤差最小,在500元~600元之間。以25天為分界線,預(yù)測超過25天滬銅價格時,隨著時間推移累計平均誤差不斷變大。其原因有兩點:一是時間推移,各種條件已發(fā)生變化,因此訓(xùn)練的模型的預(yù)測有效降低;二是銅期貨合約后期成交量變化和成交金額會變化較大,由于滬期銅在后期之后交易波動變大,訓(xùn)練模型的有效性較低。
也得知預(yù)測25天內(nèi),價格累計平均誤差隨著時間推移,不斷減小。其原因是在較小一段時間內(nèi),隨著時間推移,輸入的特征因素對于未來期銅的價格的累計誤差減小。從開盤價、收盤價、最高價和最低價預(yù)測上看,都存在一個大約向前25天左右的累計平均誤差最小。因此,此模型在使用時,可基于未來25天預(yù)測情況進(jìn)行投資,實現(xiàn)累計平均誤差最小,也即風(fēng)險最小。
五、輸入特征重要性分析
利用logistic回歸方法,分析影響開盤價、最高價、最低價和收盤價預(yù)測準(zhǔn)確度的輸入特征。
重要的輸入特征為滬銅期貨歷史每日開盤價、最高價、最低價、收盤價、結(jié)算價、漲跌1(收盤價-前一日結(jié)算價)、漲跌2(結(jié)算價-前一日結(jié)算價)、成交量、成交金額和持倉量,居民消費者價格指數(shù),工業(yè)品出廠價格指數(shù)的當(dāng)月和當(dāng)月同比增長,采購經(jīng)理人指數(shù),城鎮(zhèn)固定資產(chǎn)投資同比增長,貨幣供應(yīng)量M2的同比增長,深圳股票交易所發(fā)行總股本和成交量,上海交易所最高和最低的綜合股價指數(shù),當(dāng)月新增信貸數(shù)據(jù),滬銅現(xiàn)貨歷史每日收盤價、開盤價、最高價和最低價,LME銅期貨歷史每日收盤價、開盤價、最高價、最低價和成交量,美元匯率的歷史每日收盤價、開盤價、最高價和百分比變化。
六、下一步工作
需要進(jìn)一步降低價格預(yù)測的誤差,一方面可以選擇更多輸入特征,另一方面使用更有效的算法。另外,可以考慮如何將此模型融入到實際交易策略中,來輔助交易判斷。(作者單位:對外經(jīng)濟(jì)貿(mào)易大學(xué)金融學(xué)院)