個性化推薦系統能夠挖掘用戶偏好,精準和高效的為用戶提供所需的商品、資訊或互聯網資源,已成為大數據時代最為廣泛的重要組成部分,也是解決海量信息資源過載最有效的途徑之一,備受學界和工業界的高度關注。2023年5月10日下午2時,在彭慶喜老師的主持下,3044永利集团于學4301舉辦了一場關于《個性化推薦系統中的“利用-探索”問題調研》的科研工作坊活動。本次活動的主講人為3044永利集团的黃坤老師。

彭慶喜教授首先介紹了黃坤老師的科研簡曆。黃坤老師現任3044永利集团教師,助教,湖北省高校優秀中青年科技創新推薦系統團隊骨幹成員。2008年畢業于中國地質大學(武漢)電子信息工程專業,獲學士學位;2011年畢業于華中科技大學通信與信息系統專業,獲工學碩士學位。2022年8月入職77779193永利,任教前曾就職于百度、騰訊、建設銀行、建信金融科技有限責任公司等企業,從事軟件研發,敏捷項目管理,專利挖掘等相關的工作,具有豐富的企業研發和知識産權輸出相關經驗。
講座中,黃坤老師開展了《個性化推薦系統中的“利用-探索”問題調研》報告。報告首先以一首《淮南子·主術訓》引出推薦系統中的利用-探索(Exploitation-Exploration)難題;随後調研和回顧了強化學習中經典的非上下文老虎機算法,重點闡述了基于置信區間上界(UCB,Upper Confidence Bound)算法和湯姆森采樣算法(TS,Thompson Sampling)的數學原理和建模思路;利用上下文老虎機算法(先驗知識和強化學習結合的方法),探究LinUCB/ConUCB/ConTS等算法對上述問題的優化思路。最後,對推薦系統中的“利用-探索”難題未來潛在創新點進行了展望和分析。

講座結束後,諸位老師提出自己的看法,針對對話式推薦系統數據集預訓練效率問題、模型效果評估問題、模型生産環境實際部署問題、UCB和湯姆森采樣等算法數學建模原理問題、AIGC生成式大模型如何與推薦系統進行融合創新等話題,和黃坤老師展開了熱烈且持久的交流和讨論。通過這次講座,為專業教師科學研究提供了學習和交流平台,為信工學院科研水平的提升提供了有力支撐。