join连接多个文件多个域
有几个文件要做连接,用到了join命令,但是join命令只能指定文件中某个域进行连接
如果要指定多个域连接怎么办?
比如:cat test1:
1 a 11
1 b 22
2 a 33
2 b 44
cat test2 :
1 a x
1 b y
1 c z
2 a x
2 b y
2 c z
3 d yzm
指定第1,2个域连接后:
1 a 11 x
1 b 22 y
2 a 33 x
2 b 44 y
test1 test2数据量很大,大约上亿,怎样处理效率最高?join?awk?