本發(fā)明公開了一種用于相干合成的強(qiáng)化學(xué)習(xí)方法,包括以下步驟:根據(jù)相干合成光束路數(shù)建立動(dòng)作空間和設(shè)置相干合成Q?learning學(xué)習(xí)參數(shù);根據(jù)動(dòng)作空間建立Q值表;選擇一個(gè)動(dòng)作,智能體的輸出值為輸出值加減微小動(dòng)作電壓或相位;根據(jù)光電探測(cè)器返回給智能體的環(huán)境狀態(tài)確定獎(jiǎng)勵(lì)函數(shù);更新Q值表;由于相干合成時(shí)域無(wú)限,所以智能體的學(xué)習(xí)訓(xùn)練不會(huì)停止。該算法不需要大量時(shí)間進(jìn)行訓(xùn)練,而且因?yàn)槠鋵W(xué)習(xí)性,所以在相干合成中比傳統(tǒng)的算法更穩(wěn)定,同時(shí)調(diào)整參數(shù)更加容易。
聲明:
“用于相干合成的強(qiáng)化學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)