WDL 1.2.0:增强生物信息学工作流描述语言

WDL 1.2.0 发布概述

WDL(Workflow Description Language)团队宣布了 WDL 1.2.0 的发布,这是对生物信息学工作流描述语言的一次重要更新,旨在提高其灵活性和可用性。此次更新引入了多项关键功能和改进,旨在简化工作流的管理和执行,使开发者和研究人员能够更轻松地实现和管理复杂的生物信息学工作流。

WDL 简介

WDL 是一种开放标准规范,用于描述数据处理工作流,其语法易于人类阅读和编写。WDL 使得定义分析任务、连接任务并并行化执行变得简单,语言设计面向所有用户,包括程序员、分析师和系统操作员。

WDL 1.2.0 的主要改进

  1. Directory 类型
    WDL 1.2.0 引入了 Directory 类型,允许工作流更高效地处理目录,用户可以任务之间传递目录,从而简化分组数据文件的管理。
  2. 环境变量声明
    新版本支持将输入声明为环境变量,使任务能够直接访问环境变量,方便管理配置设置和敏感信息,而无需硬编码到工作流脚本中。
  3. requirementshints 部分
    引入了标准化的 requirementshints 部分,用于指定工作流执行的计算需求和可选提示,帮助优化工作流性能和资源分配。
  4. 标准库函数改进

    • join_paths:用于路径拼接。
    • matchesfind:用于字符串模式匹配。
    • contains:检查数组中是否存在某个值。
    • chunk:将数组分割为等大小的块。
    • keys:获取对象或结构体中的成员名称。
    • contains_key:检查键是否存在。
    • select_first:接受默认值。
    • size:处理所有复合值输入。
    • length:接受更多类型的参数。
    • read_tsv:从标题行或字符串数组读取字段名并返回对象数组。

未来发展方向

WDL 团队计划建立更规律的发布节奏,专注于提供更小但影响深远的特性和澄清,以快速响应社区反馈并改善开发者和最终用户的体验。未来可能引入的功能包括枚举、列表推导和输入验证,同时将进一步增强工作流的可移植性和可重复性。

资源

更多关于 WDL 1.2.0 的信息和完整文档,请访问 WDL 官方网站GitHub 仓库

阅读 28
0 条评论