山风晚晚
请问各位大佬,我在做疾病鉴别,但是收集的特征太多了,想筛选一下特征,有什么办法吗??做了共线性诊断,没有共线的。做了相关性分析,很多指标相关性显著,我是否可以将显著的只保留一个指标,然后再做回归分析??救救我,谢谢大家。
土井挞克树
先做相关性或者单因素的,然后做多因素回归
loveliufudan
一般来说,特征筛选可以使用以下几种方法:
Filter Method: 基于某些统计指标,如相关系数,卡方检验等,将特征分为重要与不重要两类,选择重要特征。
Wrapper Method: 使用某些模型,如逻辑回归、决策树等,来评估特征的重要性。
Embedded Method: 在模型的训练过程中对特征进行选择,常见的算法有Lasso、Ridge等。
对于你的情况,如果没有共线性的情况,你可以尝试使用相关性分析的结果,只保留相关性显著的一个特征,再做回归分析。当然,在筛选特征时,需要考虑特征之间的相关性及特征的本质,保证筛选出的特征有代表性。