11月1日下午,加拿大艾伯塔省卫生与服务部王小明教授应邀来校为学院师生作题为“丢失数据分析”的讲座。学院相关专业青年教师与学生共同聆听讲座,感受双语知识的风暴。学院教学督导王德发教授主持讲座。
讲座中,王小明教授指出,如果数据缺失量比较少,缺失数据对整个数据的影响不大,各种处理方式差异也不明显,只要进行简单地处理就好,如均值填补或者索性直接删除。但如果数据量本身比较少,缺失数据占比又较高,不同方法的数据缺失处理结果则会有较大差别。引起缺失数据的原因可能是基于连续对调查对象进行定期访问,后期被访者不愿配合调查而导致数据的缺失。此外,王小明教授还介绍了其他可能引起数据缺失的原因,以及几种比较常用的数据缺失处理方法。最后,王教授结合自身实际医学项目经验,展示了一组包含缺失值的数据,以及经过处理之后完整的数据。王教授认为,尽管目前有很多软件已具备识别缺失数据并自动处理的功能,但是在大数据时代,了解处理缺失数据的方法还是十分必要的。
当今时代,数据越来越受到人们的重视,高质量的数据对于学院统计专业尤其重要,可以说没有高质量的数据就没有高质量的统计分析。王教授的讲座为学院师生带来了一场视听盛宴,同时也坚定了学子们学好统计学的信心。