Julia中的虚拟变量

在R中,对于分类变量的每个级别运行虚拟变量的回归都有很好的功能。 例如,将R因子自动扩展为每个因子水平的1/0指示变量的集合

朱莉娅有没有这样做的等效方法。

x = randn(1000)
group = repmat(1:25 , 40)
groupMeans = randn(25)
y = 3*x + groupMeans[group]

data = DataFrame(x=x, y=y, g=group)
for i in levels(group)
    data[parse("I$i")] = data[:g] .== i
end
lm(y~x+I1+I2+I3+I4+I5+I6+I7+I8+I9+I10+
    I11+I12+I13+I14+I15+I16+I17+I18+I19+I20+
    I21+I22+I23+I24, data)

如果您使用的是DataFrames包,则在pool数据之后,该包将负责其余部分:

汇总列对于使用GLM包非常重要在拟合回归模型时,输入中的PooledDataArray列将被转换为ModelMatrix中的0/1指示符列 - 每个PooledDataArray级别都有一列。

你可以在这里看到关于池中数据的其他文档

链接地址: http://www.djcxy.com/p/84085.html

上一篇: Dummy Variables in Julia

下一篇: Why does the speed of memcpy() drop dramatically every 4KB?