强化学习模型及其在避障中的应用