丁香实验_LOGO
登录
提问
提问
我要登录
|免费注册
丁香通

spss进行多重插补问题

相关实验:基于 SPSS 的数据管理与基础运算

user-title

白衣910825

老师们我想问一下,预测模型的数据里面有缺失值,但是我不会用R语言进行插补,所以我使用SPSS进行了多重插补,插补完成后我想将数据导出来继续用R语言分析,但是我只要一导出来,缺失的数据依然缺失,请问这是怎么回事?

wx-share
分享

3 个回答

user-title

sswei

有帮助

个案剔除法(Listwise Deletion)
  最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise
deletion),也是很多统计软件(如SPSS和SAS)默认的缺失值处理方法。在这种方法中如果任何一个变量含有缺失数据的话,就把相对应的个案从分析中剔除。如果缺失值所占比例比较小的话,这一方法十分有效。至于具体多大的缺失比例算是“小”比例,专家们意见也存在较大的差距。有学者认为应在5%以下,也有学者认为20%以下即可。然而,这种方法却有很大的局限性。它是以减少样本量来换取信息的完备,会造成资源的大量浪费,丢弃了大量隐藏在这些对象中的信息。在样本量较小的情况下,删除少量对象就足以严重影响到数据的客观性和结果的正确性。因此,当缺失数据所占比例较大,特别是当缺数据非随机分布时,这种方法可能导致数据发生偏离,从而得出错误的结论。

user-title

loveliufudan

有帮助

这可能是因为在SPSS进行多重插补时,缺失值已经被填充为估计的值,但是在导出数据时,缺失值并没有被完全替换,因此在R语言中仍然显示为缺失值。

一种解决方法是在SPSS中将多重插补后的数据导出为一个新的数据集,而不是使用SPSS的导出功能。这样可以确保在导出时缺失值已经被替换为估计值。另一种方法是在R语言中使用类似“na.omit”或“complete.cases”的函数,将含有缺失值的行或列删除,以确保数据完整性。

user-title

毛利小五郎的徒弟

有帮助

可以把缺失值按照脱落计算,后续再插补

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序