cast.h¶
用于向/从 FP8 进行类型转换的函数。
函数
-
void nvte_fp8_quantize(const NVTETensor input, NVTETensor output, cudaStream_t stream)¶
将张量转换为 FP8。
- 参数
input – [in] 要进行类型转换的输入张量。
output – [inout] 输出 FP8 张量。
stream – [in] 用于此操作的 CUDA stream。
-
void nvte_fp8_dequantize(const NVTETensor input, NVTETensor output, cudaStream_t stream)¶
将张量从 FP8 转换出来。
- 参数
input – [in] 要进行类型转换的输入张量。
output – [out] 输出张量。
stream – [in] 用于此操作的 CUDA stream。