本發(fā)明揭示了一種基于DDPG深度強化學習算法的投資組合管理方法,利用兩個全連接神經(jīng)網(wǎng)絡和兩個長短期記憶神經(jīng)網(wǎng)絡(LSTM)構(gòu)建深度確定性策略梯度(DDPG)強化學習算法,以實現(xiàn)下一個交易周期的收益率最高,用訓練完的策略函數(shù)獲取下一個交易周期資產(chǎn)分配權(quán)重,并通過買入與賣出來調(diào)整不同資產(chǎn)所占總資產(chǎn)的比例,以實現(xiàn)最優(yōu)的策略。本發(fā)明通過構(gòu)建新型連續(xù)狀態(tài)空間,使神經(jīng)網(wǎng)絡能夠接收更多的有效信息,并運用DDPG強化學習算法框架,有效地解決了大規(guī)模狀態(tài)空間所導致的參數(shù)過多等問題,同時利用全連接神經(jīng)網(wǎng)絡和長短期記憶神經(jīng)網(wǎng)絡的交互提高了預測精度,盡可能地找出每一次調(diào)倉周期的最優(yōu)資產(chǎn)分配權(quán)重。
聲明:
“基于DDPG深度強化學習算法的投資組合管理方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)