spark 与 hbase 的快捷交互

##以往在 spark 中读写 hbase，往往需要进行相当多的操作，这里提供一个快捷的操作方式。
测试坏境为本地模式，依赖为 spark1.6.x，hbase0.98，以及 spark-hbase-connector。这里需要说明的是，这种读写的方式没有提供原生 api 中的各种过滤接口，因此，适合进行归档的应用场景。如果需要进行复杂过滤条件下的读操作，最好使用原生 api。
项目的 git 地址 https://github.com/nerdammer/spark-hbase-connector?spm=5176.doc28131.2.6.cycZVO

##maven 依赖如下：

it.nerdammer.bigdata
spark-hbase-connector_2.10
1.0.3

##废话不多说，直接上代码：
import org.apache.spark.{SparkConf, SparkContext}
import it.nerdammer.spark.hbase._

object FastSparkWithHbase {
def main(args: Array[String]): Unit = {
val sparkConf = new SparkConf().setAppName("hbase").set("spark.hbase.host", "192.168.93.111").setMaster("local[*]")
val sc = new SparkContext(sparkConf)


val rdd = sc.parallelize(0 to 20)
  .map(i => (i.toString, i + 1, "see" + util.Random.nextInt(100)))

//写数据,需要保证表结构已存在
rdd.toHBaseTable("spark_t").toColumns("col1", "col2").inColumnFamily("colfamily1").save()

 //读数据,不支持复杂过滤器，可以考虑转换成rdd（不建议）
  val hBaseRDD: HBaseReaderBuilder[(String, Int, String)] = sc.hbaseTable[(String, Int, String)]("spark_t")
  .select("id+1", "stringValue").inColumnFamily("mycf")

hBaseRDD.foreach(println(_))

sc.stop()

}
}

大数据搭建总结

[图片] 安装虚拟机 VMware 创建虚拟机,一路 next 就好,可以在安装时配置好 ip,不用修改 ifcfg-end33 文件先创建一个模板虚拟机出来,后面的其他机器可以在这基础上克隆,模板机需要修改的: 配置好 ip(ping locahost/网关/外网都能 ping 通即可) 关闭防火墙 systemc ..

记一次内存告警

[图片] 今天给大家分享一次生产上遇到的内存问题。生产上的一个应用经常运行一段时间后就内存告警，在一次告警中，先 dump 了内存下来，然后再重启了应用。 dump 命令： jmap -dump:format=b,file=memory.pro {pid} 用 VisualVM 打开文件，看了一下，发现占用很高的是 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

spark 与 hbase 的快捷交互

相关帖子

Hbase 正常启动，执行命令报错 Server is not running yet

CentOS7 安装 Hbase 2.1.10

CentOS7 安装 Hbase-0.98.24

大数据搭建总结

大数据学习笔记（9）-- hbase 的 java 客户端的基本使用

大数据学习笔记（8）-- hbase 的安装

记一次内存告警

欢迎来到这里！

近期热议

推荐标签标签

最新标签

spark 与 hbase 的快捷交互

相关帖子

Hbase 正常启动，执行命令报错 Server is not running yet

CentOS7 安装 Hbase 2.1.10

CentOS7 安装 Hbase-0.98.24

大数据搭建总结

大数据学习笔记（9）-- hbase 的 java 客户端的基本使用

大数据学习笔记（8）-- hbase 的安装

记一次内存告警

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

推荐标签标签