第104章 智能星网
交付评审在蓝湾通信总部进行。
左城带著唐旭和马昊到了蓝湾的会议室。评审委员会来了七个人,除了陆明远,还有蓝湾通信的技术副总裁、卫星事业部的总工程师,以及几个外聘的通信专家。阵容比前两次评审都要强,说明蓝湾对这次评审的重视程度很高。
“左总,请开始匯报吧。“陆明远主持会议,表情很正式。
左城打开ppt,第一页只写了六个字:智能星网调度。
“各位评审委员,天穹第三阶段的星间链路调度算法,我们已经从固定策略升级为基於深度强化学习的ai调度方案。“左城说,“频谱利用率从之前的百分之六十二提升到了现在的百分之八十二,超过设计目標两个百分点。这意味著天穹卫星网络的可用容量增加了三分之一。“
会议室里一片安静。百分之八十二这个数字显然超出了评审委员会所有人的预期。
技术副总裁率先开口:“左总,你们的ai调度方案是什么原理?深度强化学习在卫星通信领域的应用,据我所知,目前全世界还没有成熟的案例。“
“我们的方案確实是全球首创。“左城说,“原理是让ai智能体在仿真环境中不断试错学习,通过奖励机制引导它找到最优的频谱分配策略。与传统固定策略相比,ai方案能实时感知链路状態变化,毫秒级別做出调度决策。“
“训练数据是从哪来的?“卫星事业部总工程师问。
“我们用天穹前两阶段的在轨运行数据构建了高保真仿真环境。“唐旭补充说,“仿真环境与真实环境的误差控制在百分之五以內。“
“模型的泛化能力如何?如果卫星数量扩展到一千颗以上,算法还能適用吗?“
左城早有准备:“我们做了扩展性测试。在六百颗卫星的仿真环境中,频谱利用率仍能维持在百分之七十八以上。更大规模的测试正在跑,但初步结果证明算法的可扩展性良好。“
外聘专家中一位头髮花白的老教授开口了:“左总,深度强化学习的可解释性一直是业界的顾虑。如果ai做出了一个调度决策,你们能解释它为什么这么做吗?如果出了问题,怎么追溯原因?“
这个问题很尖锐,也是ai在工业领域应用的最大障碍。
“好问题。“左城说,“我们做了两层设计来解决这个问题。第一层,模型的所有决策都记录在日誌中,包括输入状態、输出动作、奖励值,可以事后回溯。第二层,我们设计了一个安全约束模块,ai的调度决策必须在预设的安全边界內做出,超出边界的决策会被自动拦截,回退到传统策略。也就是说,ai永远在人设定的围栏里活动。“
老教授点了点头,似乎对回答还算满意。他旁边的另一位专家也跟著问了几个关於训练稳定性的问题,左城一一作答。
评审持续了三个小时。评审委员会对技术方案提出了十几个问题,左城和唐旭一一作答。马昊在数据部分做了补充,他展示了训练过程的收敛曲线和不同架构的对比结果,数据非常扎实。
最后,陆明远宣布评审结果:“天穹第三阶段交付评审,技术评分93分,通过。恭喜402。“