How to check for correlation among continuous and categorical variables?(如何检查连续变量和分类变量之间的相关性?)
本文介绍了如何检查连续变量和分类变量之间的相关性?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个包含类别变量(二进制)和连续变量的数据集。我正在尝试应用线性回归模型来预测一个连续变量。有人能告诉我如何检查分类变量和连续目标变量之间的相关性吗?
当前编码:
除停留时间外,所有变量都是绝对的。这应该起作用吗?
推荐答案
将类别变量转换为虚拟变量here并将变量放入numpy.array中。例如:
data.csv:
提取数据:
df:
将类别变量color_head
转换为虚拟变量:
df_new:
将其放入Numpy数组:
计算相关性:
输出:
请参阅:
numpy.corrcoef
这篇关于如何检查连续变量和分类变量之间的相关性?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!