《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 一種基于PPO算法的低空基站優(yōu)化模型
一種基于PPO算法的低空基站優(yōu)化模型
電子技術(shù)應(yīng)用
薄云鵬1,2,亢抗3,潘桂新3,汪敏1
1.中國科學(xué)院云南天文臺(tái);2.中國科學(xué)院大學(xué);3.中國聯(lián)合網(wǎng)絡(luò)通信有限公司廣東省分公司
摘要: 通過優(yōu)化現(xiàn)有地面網(wǎng)絡(luò)基站來實(shí)現(xiàn)低空網(wǎng)絡(luò)服務(wù)具有成本低、建設(shè)快等優(yōu)點(diǎn),面對低空基站優(yōu)化過程中存在的無線環(huán)境復(fù)雜、配置參數(shù)多樣、優(yōu)化目標(biāo)互相影響等問題,提出了一種基于近端策略優(yōu)化算法的多維低空網(wǎng)絡(luò)基站優(yōu)化模型:通過射線追蹤技術(shù)計(jì)算不同類型、不同角度基站的低空覆蓋能力,并構(gòu)建支持多目標(biāo)優(yōu)化和多參數(shù)配置的低空網(wǎng)絡(luò)基站優(yōu)化模型,利用PPO算法得到基站配置策略。在仿真環(huán)境中進(jìn)行訓(xùn)練與結(jié)果驗(yàn)證,證明該模型可有效生成基站優(yōu)化方案,且相較于基于A2C方法的模型具有更快的收斂速度和更好的基站優(yōu)化效果。
中圖分類號:TN929.5 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.256278
中文引用格式: 薄云鵬,亢抗,潘桂新,等. 一種基于PPO算法的低空基站優(yōu)化模型[J]. 電子技術(shù)應(yīng)用,2025,51(7):60-64.
英文引用格式: Bo Yunpeng,Kang Kang,Pan Guixin,et al. A low-altitude base station optimization model based on PPO algorithm[J]. Application of Electronic Technique,2025,51(7):60-64.
A low-altitude base station optimization model based on PPO algorithm
Bo Yunpeng1,2,Kang Kang3,Pan Guixin3,Wang Min1
1.Yunnan Observatories, Chinese Academy of Sciences;2.University of Chinese Academy of Sciences;3.China United Network Communications Co., Ltd., Guangdong Branch
Abstract: Optimizing existing terrestrial network base stations to provide low-altitude network services offers advantages such as cost-effectiveness and rapid deployment. Facing challenges in the optimization process of low-altitude base stations, including complex wireless environments, diverse configuration parameters, and interrelated optimization objectives, this paper proposes a multidimensional low-altitude network base station optimization model based on the Proximal Policy Optimization (PPO) algorithm. By employing ray tracing technology, the model calculates the low-altitude coverage capability of base stations with different types and angles. It constructs an optimization model that supports multiple objectives and parameter configurations for low-altitude network base stations. The PPO algorithm is utilized to derive base station configuration strategies, which are then trained and validated in a simulated environment. This demonstrates that the model can effectively generate optimization schemes for base stations and exhibits faster convergence speed and better optimization results compared to models based on the Actor-Critic (A2C) method.
Key words : low-altitude base station;low-altitude communication;PPO;reinforcement learning

引言

近年來,隨著低空經(jīng)濟(jì)的發(fā)展,無人機(jī)的數(shù)量和應(yīng)用急劇增加,無人機(jī)的通信需求也隨之快速擴(kuò)張[1]。而傳統(tǒng)的基于地面站的無人機(jī)通信方式受地面站性能和所用的非授權(quán)頻段的限制,存在易受干擾、通信范圍受限、安全性差等問題,難以滿足新應(yīng)用場景的需求,因此,人們認(rèn)為利用蓬勃發(fā)展的5G及以上蜂窩網(wǎng)絡(luò)支持無人機(jī)通信是最有前途和成本效益的方法[2-6]。

然而,現(xiàn)有的蜂窩網(wǎng)絡(luò)以服務(wù)地面用戶為主[7],據(jù)此開展的網(wǎng)絡(luò)規(guī)劃和優(yōu)化也主要面向地面目標(biāo),并且由于天線自身存在零位、旁瓣等問題,低空場景中信號覆蓋不全、鄰區(qū)關(guān)系雜亂、切換頻繁、信號干擾嚴(yán)重等現(xiàn)象極為突出,使得目前的蜂窩網(wǎng)絡(luò)難以滿足無人機(jī)低空通信的需要[2, 5, 8]。因此,亟需通過建立專門的低空網(wǎng)絡(luò)來開展對低空無人機(jī)應(yīng)用場景的通信服務(wù)。

當(dāng)前的低空通信組網(wǎng)方案主要有同站空地同頻組網(wǎng)、同站空地異頻組網(wǎng)、異站空地同頻組網(wǎng)、異站空地異頻組網(wǎng)等[2, 9],其中,同站組網(wǎng)方案通過在地面蜂窩網(wǎng)絡(luò)站址上對現(xiàn)有設(shè)備進(jìn)行調(diào)整優(yōu)化或新增少量AAU設(shè)備等方式實(shí)現(xiàn)低空網(wǎng)絡(luò)的建立,具有成本低、建設(shè)方便等優(yōu)點(diǎn)。對于具體的低空網(wǎng)絡(luò)建設(shè)方案,已有很多關(guān)于低空基站的選址[10]以及對天線的仰角[11-12]的調(diào)整方面的研究,然而上述研究往往只聚焦于站址或仰角等單一配置的調(diào)整,對于實(shí)際應(yīng)用中通過優(yōu)化已有地面基站建立低空網(wǎng)絡(luò)過程中的對合適基站進(jìn)行選擇以及對高度、天線角度、設(shè)備選型等多方面配置策略的聯(lián)合設(shè)計(jì)而言,其實(shí)用價(jià)值有限,需要設(shè)計(jì)一種多要素聯(lián)合的低空基站優(yōu)化方法,實(shí)現(xiàn)低成本、高效率的低空網(wǎng)絡(luò)建設(shè)。

傳統(tǒng)的蜂窩網(wǎng)絡(luò)的基站規(guī)劃方法往往根據(jù)經(jīng)驗(yàn)?zāi)P凸烙?jì)信號的傳播,而已有研究證實(shí),城市環(huán)境內(nèi)的復(fù)雜建筑物的遮擋和反射會(huì)極大地改變空對地信道特性[13-15],因此統(tǒng)計(jì)性信道模型往往難以準(zhǔn)確描述信道特征。而射線追蹤技術(shù)可通過計(jì)算無線電波與場景之間的電磁相互作用,模擬真實(shí)的信號傳播過程,具有更高的靈活性[15]。然而射線追蹤作為一種確定性傳播工具,其所需計(jì)算量往往遠(yuǎn)大于統(tǒng)計(jì)性模型,因而在應(yīng)用時(shí)需采取實(shí)時(shí)計(jì)算等措施降低計(jì)算量,提升效率。

強(qiáng)化學(xué)習(xí)是一種通過智能體與環(huán)境的交互來積累信息、改進(jìn)策略的機(jī)器學(xué)習(xí)方法,該方法通過環(huán)境對智能體動(dòng)作的反饋來進(jìn)行智能體的訓(xùn)練與學(xué)習(xí),具有無需提前獲取先驗(yàn)信息的優(yōu)點(diǎn)。對低空基站優(yōu)化問題而言,使用強(qiáng)化學(xué)習(xí)方法可免于提前進(jìn)行各基站不同優(yōu)化方案的覆蓋效果的繁雜計(jì)算,提升優(yōu)化速度,降低計(jì)算量與時(shí)間成本。


本文詳細(xì)內(nèi)容請下載:

http://m.theprogrammingfactory.com/resource/share/2000006596


作者信息:

薄云鵬1,2,亢抗3,潘桂新3,汪敏1

(1.中國科學(xué)院云南天文臺(tái),云南 昆明 650200;

2.中國科學(xué)院大學(xué),北京 100049;

3.中國聯(lián)合網(wǎng)絡(luò)通信有限公司廣東省分公司,廣東 廣州 510700)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。