夏火松教授團隊長期研究信息管理與知識管理,在知識管理與智慧管理、管理信息系統、電子商務、商務智能與大數據挖掘、物流管理工程、金融科技(FinTech)等領域的教學、科研及産業規劃和管理咨詢等社會服務工作中,不斷取得好成績,在結合我校特色紡織産業中的知識管理與智慧管理已經取得重要進展。
該團隊最近在管理科學與工程技術期刊International Journal of Production Research(SCI 影響因子9.018,Q1,也是中科院分區中工程技術類TOP期刊)在線發表了一篇論文(Huosong Xia, Yuan Wang, Sajjad Jasimuddin, Justin Zuopeng Zhang & Andrew Thomas (2022) A big-data-driven matching model based on deep reinforcement learning for cotton blending, International Journal of Production Research, DOI: 10.1080/00207543.2022.2153942)。
該論文主要解決我國棉紡織行業正處于數字化轉型和升級的關鍵時期,如何應對勞動力成本上升和原材料價格大幅波動等壓力和挑戰時,在高保質量産品同時,解決智能制造中成本競争優勢的智能配棉問題。該研究課題是徐衛林院士提出與湖北武漢裕大華衛江總經理支持經費下開展了1年多的階段研究成果。該研究從大數據和強化學習的角度,結合獎勵機制和馬爾可夫決策,設計了一個結合棉花匹配及交易數據、評論與新聞等交互數據和棉花期貨指數等測量數據的獎勵值,進行智能配棉中不同原料的組合開展的研究成果。該成果提出了基于大數據驅動與深度強化學習來解決智能配棉問題,構建了運用深度強化學習與大數據驅動的棉花匹配模型。設計了智能配棉策略,并使用強化學習的激勵機制來疊代最優紗線匹配方案,以實現智能棉花匹配的目标。研究數值分析與模拟,以及利用收集的近2年手工配棉數據驗證結果表明,利用大數據與深度強化學習模型建立的的大數據智能匹配模型效果較好。
成果研究三個問題如下:
QA1:如何在保證産品質量的前提下降低制造企業的成本?
QA2:如何利用大數據驅動匹配模型優化深度RL模型?
QA3:基于深度RL的大數據驅動匹配模型如何優化智能制造成本?
成果設計了基于大數據的獎勵價值計算模型:

棉花混紡模型的獎勵值如式(2)所示:

其中price表示棉花價格;N表示棉花的種類;P為各棉所占比例;Price表示紗線價格,Index表示棉花期貨指數;a1、a2和a3褒示這三種數據在獎勵中的比例。
數據集劃分:
(a) 40支紗線。訓練集= 31,驗證集= 80 ,測試集= 46,總數= 45

實驗驗證如下:RL中的Q神經網絡模型,研究發現Q神經網絡有很好的收斂性,如左圖所示。通過梯度下降等方法更新網絡的參數,使均方誤差(MSE)損失越來越小直至收斂。模型的學習任務是改進預測值和實際值之間的平衡,提出的RL模型的結果也達到了最優解。




實例仿真與分析:以湖北省裕大華紡織企業的60根紗線為例進行混棉,尋找價格最低的混棉方案。論文使用相關分析來分析變量之間的相關性。最後,将調優前後的變量數量從7個減少到4個。原農司分為農八區棉、農六區棉、農七區棉統一為新疆棉花。

研究實驗結果:對數據進行1000次疊代,實驗結果如圖所示。在每次試驗結束時,給出一個最佳的棉花混紡方案。但在疊代的過程中,也會出現一些突出的突出現象。但在疊代過程中,每兩支紗線所需的棉花成本在1.86225 - 1.86275之間,變化不大。說明在177種混棉方案中,以成本最低的混棉方案最為合适 60支紗線不改變質量可以找到的最好的結果。
論文将模型中棉混紡價格最高的方案與價格最低的方案進行了比較,結果如下表所示:

研究發現:本文從智能制造紡織企業出發,采用RL的方法,在不改變質量的前提下降低紗線成本,找到每根紗線成本最低的混棉方案(調整每種棉花的加入比例)。
(1)在保證質量的基礎上,設計了一個大數據驅動的匹配模型來優化深度強化學習。大數據模型驅動的深度RL模型用于優化智能制造成本(Chen, He, and Shi 2014;Song and Li 2016);
(2)設計離線策略,構建記憶庫和神經網絡,利用RL的激勵機制疊代優化配紗方案,實現智能配棉的目标;
(3)從大數據和RL的角度出發,結合交易數據、交互數據和測量數據,結合Reward機制和Markov決策(Arora and Doshi2021)。
附:
(Huosong Xia, Yuan Wang, Sajjad Jasimuddin, Justin Zuopeng Zhang & Andrew Thomas (2022) A big-data-driven matching model based on deep reinforcement learning for cotton blending, International Journal of Production Research, DOI: 10.1080/00207543.2022.2153942)