12月13日下午,永利官网通過在線視頻的方式舉行了“崇德管理論壇”第十期學術交流活動。中南大學商學院博導施文教授應邀為廣大師生作題為《Estimating the maximum mean: An upper confidence bounded approach》的輔導報告。


報告中,施教授介紹,如何估計多種決策随機方案中最優決策的績效值一直是MS/OR和強化學習的重要問題。該問題在諸如馬爾可夫決策過程(Fu,2017)和風險管理(Lesnevski等,2007)等領域都有非常廣泛的應用。本文首次在機器學習Multiarmed bandit(MAB)的Upper confidence bound(UCB)框架下解決該問題。一般化原有的UCB的Exploration & Exploitation的平衡機制,給出了Exploration疊代的更快範圍;在新的平衡機制下,證明了最優系統的仿真成本分配比例漸進收斂于1,而次優系統的漸進收斂于0;提出的大平均估計量(GA)的性質空白,給出了GA的強一緻性、中心極限定理以及均方差;提出了一個自适應的最大分配比例估計量(LSA),并且也證明了同樣的性質。
專家簡介:
施文,中南大學商學院教授、博導,荷蘭蒂爾堡大學、美國匹茲堡大學Katz商學院和香港城市大學商學院訪問學者。主要研究領域為大數據分析、機器學習與文本挖掘、系統仿真及其在汽車召回/物流管理中的應用等。以第一作者身份在包括國際商學院公認的頂級期刊INFORMS Journal on Computing (UT Dallas 24),國際權威/主流期刊Naval Research Logistics、European Journal of Operational Research、Transportation Research Part A:Policy and Practice、 Reliability Engineering and System Safety、Simulation Modelling Practice and Theory以及國家自然科學基金委A類期刊《管理科學學報》《系統工程理論與實踐》《科研管理》和《系統工程學報》等發表論文40餘篇。
主持了包括國家自然科學基金青年項目、面上項目、博士後基金、省部級及各類項目7項,參與17項;曾獲得省級人文社科優秀成果獎(最高等級A),校級優秀論文特等獎(全校共2人)和一等獎(全校共4人)等,獲中國物流年會優秀論文二等獎2次和三等獎1次。
指導學生獲中國高校大數據挑戰賽全國一等獎、省級“互聯網+”大賽一等獎、省級優秀本科學位論文。