要测试比较Hive, impala和shark/spark的性能,可以从哪几个方面入手?


要分析比较着三者的性能,我准备搭个集群做测试,请问可以从哪几个方面入手评测?谢谢

hadoop 分布式

hea7ven 11 years, 2 months ago

最近也在关注这个问题。
不过还没有着手实际去测试。

理论上来讲shark的性能要好于hive,因为shark很多操作是基于内存的
会一定程度上避免hive磁盘IO产生的瓶颈
这个也有一些第三方的测试数据来说明。

另外impala的性能据说会比hive要高很多的,宣称就是如此。

帕萩莉诺蕾姬 answered 11 years, 2 months ago

Your Answer