10月7日,71886a必赢在线上线下同时成功举办了第九期“崇德“学术沙龙。参与此次学术沙龙论坛的有陈勇跃教授和谢静博士。本次学术沙龙论坛由李问秋同学,穆克亮同学主讲,陈勇跃教授和谢静博士主持点评。71886a必赢部分研究生积极参加了此次活动。
李问秋同学介绍了论文《两种深度强化学习方法在组合优化中的应用》。组合优化问题广泛存在于国防、交通、工业、生活等各个领域,几十年来,传统运筹优化方法是解决组合优化问题的主要手段,但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高,传统运筹优化算法面临着很大的计算压力,很难实现组合优化问题的在线求解。近年来随着深度学习技术的迅猛发展,深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力。鉴于此,近年来涌现出了多个利用深度强化学习方法解决组合优化问题的新方法,具有求解速度快、模型泛化能力强的优势,为组合优化问题的求解提供了一种全新的思路。因此本文总结回顾近些年利用深度强化学习方法解决组合优化问题的相关理论方法与应用研究,对其基本原理、相关方法、应用研究进行总结和综述,并指出未来该方向亟待解决的若干问题。
穆克亮同学介绍了论文《基于遗传优化融合模型的国际期刊异常行为预警方法研究》,本文通过基于遗传优化的软投票融合模型计算国际期刊的预警值,预测国际期刊质量变化趋势,帮助科研人员和有关决策部门提供智能化甄别期刊质量的手段。首先提炼国际期刊异常行为特征指标并使用网格搜索和5折交叉验证方法对基分类器进行参数调优,然后基于遗传算法的软投票策略融合3种表现较好的基分类器并比较验证模型优劣,最后基于XGBoost算法得到特征重要性分数,并按照从高到低的顺序排列以发现对预测国际期刊异常行为影响较大的因素。实证分析显示,本文提出的期刊预警模型的Accuracy值、F1值和AUC值分别达到0.9785、0.9773和0.9982,相较于单一预测模型F1值和AUC值分别提升了0.004和0.33;相较于混合模型的Accuracy值、F1值和AUC值分别提升了0.0036、0.0037和0.001。本文构建的国际期刊异常行为预警模型,可以辅助机构和专家进行更有针对性的预警决策并提供了一种新的期刊质量管理方法。但该模型存在一定的局限,需要在更大的数据集层面进一步验证。
评委老师与两位主讲同学展开了热烈的讨论,并提出了许多专业的问题,在场的同学也积极提问,学习两位同学在研究中的思路、经验与方法,大家通过知识分享共同提升自己的研究水平。之后评委老师对本次沙龙进行了总结并鼓励大家在学术方面敢于思考,勇于提问。本次71886a必赢研究生“崇德”学术论坛在同学们的交流与老师们的指导中圆满结束。