桑强 编辑
Vincent AI前线导读:在数据仓库的建立过程中,核心技术是抽取、转换、装载(ETL),它为数据仓库提供及时、高质而准确的数据。由于ETL包括众多的处理任务,且这些任务之间有一定的约束关系,如何高效的调度和管理这些任务是数据仓库ETL实施中非常重要的工作,也是提高数据仓库开发效率和资源利用率的关键。在大数据平台,随着业务发展,每天承载着成千上万的ETL任务调度,这些任务的形态各种各样。怎么样让大量的ETL任务准确的完成调度而不出现问题,甚至在任务调度执行中出现错误的情况下,任务能够完成自我恢复甚至执行错误告警与完整的日志查询。IDE大数据离线任务调度系统就是在这种背景下衍生的一款分布式调度系统。本文的内容主要讲述的是作业调度系统。更多优质内容请