报告题目:MODEL CHECKING IN MASSIVE DATASET VIA STRUCTURE-ADAPTIVE-SAMPLING
报 告 人:王兆军 教授 南开大学
报告时间:2020年7月30日 9:00-10:00
报告地点:腾讯会议ID:717 287 468
或点击链接直接加入会议:
https://meeting.tencent.com/s/gEsVrxjponll
校内联系人:程建华 chengjh@jlu.edu.cn
报告摘要:
Lack-of-fit testing is often essential in many applications of statistical/machine learning. Despite the availability of large datasets, in many applications, collecting labels for all data points is impossible due to measurement constraints. We propose a design-adaptive testing procedure to check a model when only a limited number of responses can be accessed. To select a small subset of covariates from a large pool of given design points, we derive an optimal sampling strategy, the structure-adaptive-sampling, with which the proposed test possesses the asymptotically best power. Numerical results on both synthetic and real-world data confirm the effectiveness of the proposed method.
报告人简介:
王兆军,南开大学统计与数据科学学院教授、博士生导师、执行经理和党总支书记,统计研究院经理,国务院学位委员会统计学科评议组成员,国家统计专家咨询委员会委员,中国现场统计研究会副理事长,中国工业统计教学研究会副会长,天津数据科学与技术学会理事长,天津市学位委员会数学与统计学科评议组召集人,曾获国务院政府特殊津贴,全国百篇优博指导教师,教育部全国高校自然科学奖二等奖及天津市自然科学奖一等奖。王兆军教授的主要研究方向包括统计过程控制(SPC)、非(半)参数回归、降维、高维数据分析、变点等,已在Journal of the American Statistical Association、Annals of Statistics、Biometrika、Statistica Sinica、Journal of Quality Technology、Journal of Multivariate Analysis、Technometrics、Test等专业顶级期刊上发表高质量学术论文110余篇,先后主持国家自然科学基金重点项目、面上项目、教育部博士点基金项目等10余项科研项目,现担任Statistical Theory and Related Fields、《统计信息论坛》、《数学进展》等杂志编委和《数理统计与管理》等杂志副主编。此外,王兆军教授还培养了很多优秀的员工。