师,您提出的强化学习算法,我尝试着进行了收敛性分析,虽然能够搞下去,但是对混合时间的假设比较强,有没有更好的数学工具能够放宽这个假设?”  “你可以试一下多步李雅普诺夫法……或许……可以把混合时间减小到合理的范围。”  ……  两人在白板前讨论了很久,写了擦,擦了写,不知不觉,三个多小时过去了。  “看来老师的做法是可行的呢。”  “总算是解决了其中一个问题。”  “老师,谢谢您!我对随机逼近有限时间分析这部分的理论应用套路,总算是有些熟悉了。请再多给我一些时间,我会尽快解决剩下的问题。”  “没事,理论证明急不得,慢慢做。”  “谢谢老师。那我先回去了。”  办公室又只剩下尚斌一人,他拿起保温杯,发现里面盛着的茶水是满的。  “讨论了一下午数学问题,连水都忘了喝,不过倒是没感觉渴。”  吨吨吨。  尚斌喝光一大杯普洱茶,伸了个懒腰,点开一份标书,开始琢磨明天的事宜。  几天前,作为参与者,他与自己的导师李文斌院士,一起投标泰拉帝国军事科学院的兵棋推演系统开发。  今晚9点,就要出竞标结果了。