我有一个非常大的数据集

  mdf <- data.frame (sn = 1:40, var = rep(1:10, 4), block = rep(1:4, each = 10),  
yld = c(1:40)) 

我有小数据集

blockdf <- data.frame(block = 1:4, yld = c(10, 20, 30, 40)) # block means  

除了 yld 之外,两个数据集中的所有变量都是因子。

我想从每个 mdf$yld 数据集中减去 block 均值 (blockdf$yld),这样 block 效果应该对应于 mdf 数据帧中的 block 。

for example: value 10 will be substracted from all var within  
   first block yld in mdf  
                   20  -  second block yld in mdf 
 
and so on 

请注意,我有时可能会在代表中出现不平衡的 var 数量。所以我想以能够处理不平衡情况的方式编写它

请您参考如下方法:

这应该可以解决问题

block_match <- match(mdf$block, blockdf$block) 
transform(mdf, yld = yld - blockdf[block_match, 'yld']) 


评论关闭
IT序号网

微信公众号号:IT虾米 (左侧二维码扫一扫)欢迎添加!