安装¶
先决条件¶
Linux x86_64
支持 CUDA 11.8 或更高版本的NVIDIA 驱动程序。
cuDNN 8.1 或更高版本。
对于 FP8/FP16/BF16 融合注意力,需要 CUDA 12.1 或更高版本、支持 CUDA 12.1 或更高版本的NVIDIA 驱动程序以及 cuDNN 8.9.1 或更高版本。
如果在标准安装路径(例如 CUDA_HOME)中运行时无法找到 CUDA Toolkit 头文件,请在环境中设置 NVTE_CUDA_INCLUDE_PATH。
NGC 容器中的 Transformer Engine¶
Transformer Engine 库已预安装在 NVIDIA GPU Cloud 上 22.09 及更高版本的 PyTorch 容器中。
pip - 从 GitHub¶
附加先决条件¶
安装 (稳定版本)¶
执行以下命令安装最新稳定版本的 Transformer Engine
pip install git+https://github.com/NVIDIA/TransformerEngine.git@stable
这将自动检测是否安装了任何支持的深度学习框架,并为其构建 Transformer Engine 支持。要显式指定框架,请将环境变量 NVTE_FRAMEWORK 设置为逗号分隔列表(例如 NVTE_FRAMEWORK=jax,pytorch)。
安装 (开发版本)¶
警告
Transformer Engine 的开发版本可能包含官方版本尚未提供的新功能,但它不受支持,因此不建议用于一般用途。
执行以下命令安装最新开发版本的 Transformer Engine
pip install git+https://github.com/NVIDIA/TransformerEngine.git@main
这将自动检测是否安装了任何支持的深度学习框架,并为其构建 Transformer Engine 支持。要显式指定框架,请将环境变量 NVTE_FRAMEWORK 设置为逗号分隔列表(例如 NVTE_FRAMEWORK=jax,pytorch)。
要安装特定的 PR,请将 NNN 更改为 PR 编号后执行
pip install git+https://github.com/NVIDIA/TransformerEngine.git@refs/pull/NNN/merge
安装 (从源代码)¶
执行以下命令从源代码安装 Transformer Engine
# Clone repository, checkout stable branch, clone submodules
git clone --branch stable --recursive https://github.com/NVIDIA/TransformerEngine.git
cd TransformerEngine
export NVTE_FRAMEWORK=pytorch # Optionally set framework
pip install . # Build and install
如果已经克隆了 Git 仓库,请确保同时也克隆子模块
git submodule update --init --recursive
可以通过设置“test”选项来安装额外的测试依赖项
pip install .[test]
要使用调试符号构建 C++ 扩展(例如使用 -g 标志)
pip install . --global-option=--debug