随着人工智能技术的迅猛发展,机器学习在各领域的应用日益广泛,其可信性问题也成为学术界和工业界关注的核心议题。2024年11月4日,清华大学丘成桐数学科学中心的杨宇红教授应邀在东南大学进行了一场主题为"A Framework to Understand Model Stealing Attacks and Defenses”的学术报告。此次报告由东南大学统计与数据科学学院院长金加顺教授和数学学院院长虞文武教授共同邀请。
杨宇红教授是统计学与机器学习领域的著名学者,1996年在耶鲁大学获得统计学博士学位,其研究方向涵盖模型选择、模型平均、多臂赌博问题、因果推断、高维数据分析以及机器学习等。他在Annals of Statistics、Journal of the American Statistical Association、IEEE Transactions on Information Theory等顶尖期刊发表了诸多高水平论文,并被斯坦福大学列入全球前2%高被引科学家榜单。
在本次报告中,杨教授围绕机器学习模型的隐私保护问题,深入探讨了模型窃取攻击的威胁及其应对策略。他通过生动的实例揭示了攻击者如何以极低成本通过查询-响应交互逆向重建高精度模型的问题,并分析了现有防御方法的局限性。针对这个问题,杨教授及其合作者提出了一套以统计理论为基础的模型隐私框架,从攻击强度与防御效果量化的角度,提供了评估和优化防御机制的新视角。他重点阐述了如何在效用损失与隐私保护之间取得平衡,并提出了应对非独立同分布攻击和依赖扰动的具体策略。
报告结束后,数学学院和统计与数据科学学院的师生踊跃提问,与杨教授展开了热烈而深入的交流。杨教授耐心细致地解答了大家提出的各类问题,并进一步分享了他对研究工作的独到直觉和深刻见解。此次报告为东南大学师生带来了机器学习安全领域的前沿见解,激发了与会者的深入思考和讨论,为未来相关研究提供了新的方向和启发。