seatunnel 高性能分布式数据集成平台

一、介绍

seatunnel 是一个非常易用，高性能、支持实时流式和离线批处理的海量数据处理产品，架构于Apache Spark 和 Apache Flink之上，每天可以稳定高效同步数百亿数据，已在近百家公司生产上使用。

可以直接运行的软件包下载地址：https://github.com/InterestingLab/seatunnel/releases

快速入门：https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/quick-start

关于 seatunnel 的详细文档

二、为什么我们需要 seatunnel

seatunnel 尽所能为您解决海量数据同步中可能遇到的问题：

数据丢失与重复

任务堆积与延迟

吞吐量低

应用到生产环境周期长

缺少应用运行状态监控

三、seatunnel 使用场景

海量数据同步

海量数据集成

海量数据的 ETL

海量数据聚合

多源数据处理

四、seatunnel 的特性

简单易用，灵活配置，无需开发

实时流式处理

离线多源数据分析

高性能、海量数据处理能力

模块化和插件化，易于扩展

支持利用 SQL 做数据处理和聚合

支持 Spark Structured Streaming

支持 Spark 2.x

如需转载，请注明文章出处和来源网址：http://www.divcss5.com/html/h64930.shtml