xarray:给 NumPy 多维数组加上标签的 Python 库

发布时间:2026/6/25 17:29:55
xarray:给 NumPy 多维数组加上标签的 Python 库 文章目录xarray给 NumPy 多维数组加上标签的 Python 库xarray给 NumPy 多维数组加上标签的 Python 库xarray 是一个让带标签多维数组操作变简单的 Python 库目前收获了 4,155 个 Starxarray 的前身叫 xray由 Climate Corporation 的研究人员于 2014 年开源发布2016 年更名为 xarray2018 年成为 NumFOCUS 的财政赞助项目。核心理念NumPy 提供了操作原始多维数组的基础能力但真实数据集通常带有空间、时间等维度的标签信息。xarray 在 NumPy 数组之上引入了维度名称、坐标值和元数据属性让开发者可以用标签而非整数索引来操作数组。这种设计思路借鉴了 pandas。如果说 pandas 解决的是二维表格数据的标签化问题xarray 解决的就是 N 维数组的同类问题。主要能力xarray 提供了一套以标签为核心的数组操作接口按维度名称执行运算x.sum(time)按标签而非位置选取数据x.sel(time2014-01-01)基于维度名称的广播运算无需手动对齐数组形状x-y分组聚合x.groupby(time.dayofyear).mean()数据库风格的外连接对齐自动处理缺失值x,yxr.align(x,y,joinouter)任意元数据以字典形式附加x.attrs与生态的集成xarray 的数据模型源自 netCDF 文件格式因此与 netCDF 读写衔接紧密。同时它与 dask 深度集成支持并行计算可以处理超出内存的数据集。xarray 属于 PyData 生态的一部分与 pandas、NumPy、dask 等工具链兼容。适用场景xarray 主要服务于需要处理带标签多维数组的领域包括物理学、天文学、地球科学、生物信息学、工程学和深度学习等。凡是涉及 N 维张量且维度具有实际物理含义的场景xarray 的标签机制都能减少索引错误。安装通过 pip 安装pipinstallxarray也可以通过 conda 安装condainstall-cconda-forge xarray文档与社区xarray 的完整文档位于 docs.xarray.dev包含 API 参考和使用指南。项目还提供了 Binder 交互式 Notebook可以直接在浏览器里试用。社区交流主要通过 GitHub Discussions 进行问题反馈和功能建议也在该平台提交。Binder 交互式 Notebook可以直接在浏览器里试用。社区交流主要通过 GitHub Discussions 进行问题反馈和功能建议也在该平台提交。