
Dask:一个用于 Python 的开源并行计算与大数据处理库,能够把大型数组、数据框等拆分成许多小任务,在多核或分布式环境中并行执行;常与 NumPy / pandas 风格接口配合使用。(该词在技术语境中最常见;日常英语里不常用。)
I use Dask to speed up my data processing.
我用 Dask 来加速数据处理。
By converting the pandas workflow to Dask DataFrame, the team could scale the pipeline to datasets that no longer fit in memory while keeping the code structure largely unchanged.
把 pandas 的流程改成 Dask DataFrame 后,团队在基本不改变代码结构的情况下,把流水线扩展到无法完全装入内存的数据集上。
/dsk/
Dask 是现代技术命名词,主要指该并行计算项目本身的名称;一般认为其命名带有“task(任务)”的联想(并行计算的核心正是把工作拆成许多任务并调度执行),但它并非传统意义上有明确历史语源的普通英语词汇。