比如给定两组dataset,一组含数据地区(城市名如New York,Boston),邮编(如12203),人口(如7840,563),吸烟index(如63.4275),一组含邮编(如72265),人口(如842),商店index(如129.799),如何用R inner-join两个datasets by 邮编,最终生成一个含地区,吸烟index,商店index的数据组?
两组数据中邮编有重复的,也有在一组中存在另一组中不存在的。并且aggregate吸烟和商店index时不能加和,要用人口做权重 apply the weighted arithmetic mean。
将两个数据框进行内联结(inner join)应该可以使用merge()函数。
merge()函数的基础用法是:
如果两个数据框中存在着一些非公共“观测”,可以对all参数幅值,将她们加入数据框中。