Parquet 读写

最新推荐文章于 2024-02-26 16:19:48 发布

VIP文章乄浅醉

最新推荐文章于 2024-02-26 16:19:48 发布

阅读量1.1w

点赞数

分类专栏： hadoop 文章标签： parquet

本文链接：https://blog.csdn.net/gg584741/article/details/51614752

版权

write and read

       MessageType schema = MessageTypeParser.parseMessageType("message Pair {\n" +
                " required binary left (UTF8);\n" +
                " required binary right (UTF8);\n" +
                "}");

        GroupFactory factory = new SimpleGroupFactory(schema);

        Group group = factory.newGroup().append("left","L").append("right","R");

        Path path = new Path("data.parquet");

        Configuration configuration = new Configuration();
        GroupWriteSupport writeSupport = new GroupWriteSupport();

        writeSupport.setSchema(schema,configuration);

        ParquetWriter<Group> writer = new ParquetWriter<Group>(path,writeSupport,
                ParquetWriter.DEFAULT_COMPRESSION_CODEC_NAME,
                ParquetWriter.DEFAULT_BLOCK_SIZE,
                ParquetWriter.DEFAULT_PAGE_SIZE,
                ParquetWriter.DEFAULT_PAGE_SIZE, /* dictionary page size */

最低0.47元/天解锁文章

优惠劵

乄浅醉

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
Parquet 读写

write and read MessageType schema = MessageTypeParser.parseMessageType("message Pair {\n" + " required binary left (UTF8);\n" + " required binary right (UTF8);\n"
复制链接

扫一扫