可以读本地文件,但是只能spark本地模式运行计算这个从本地读的数据,是吧?
hadoop spark hdfs
spark并不依赖于hdfs。 spark的数据来源有很多,最常见的是kafka。 spark是一种分布式内存数据计算模式,建立在RDD数据模型之上。
tachyon format时候出错,用hdfs做下层文件系统
tachyon format时候要连hdfs哪个端口?
spark集群中每个节点都有一个独立数据库,可以实现分布式统计计算吗?
Yarn的出现到底给MapReduce、Spark等带来了什么?
Spark里的DAG是怎么回事?
sqoop client java api将mysql的数据导到hdfs