训练常用环境变量
本节介绍的环境变量建议在训练前提前设置好。
NPU私有格式
0为关闭,建议关闭:
export FLAGS_npu_storage_format=0
NPU在线编译
false为关闭,建议小模型关闭,大模型打开:
export FLAGS_npu_jit_compile=false
aclnn_scale
在大模型场景设置False性能更好,小模型场景设置True性能更好:
export FLAGS_npu_scale_aclnn=True
aclnn_split
在大模型场景设置False性能更好,小模型场景设置True性能更好:
export FLAGS_npu_split_aclnn=True
npu算子加黑名单
npu算子加黑名单跑cpu,禁用NPU算子名单,可用来暂时规避精度问题,或者确认问题算子(set_value为算子名称):
export CUSTOM_DEVICE_BLACK_LIST=“set_value”
指定NPU卡号
export ASCEND_RT_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
Paddle view机制
当前在NPU部分模型上性能较差,0为关闭,建议关闭:
export FLAGS_use_stride_kernel=0
Paddle内存分配方式
默认为最大值申请,可能在个别模型上引入内存问题,建议使用auto_growth随使用申请
export FLAGS_allocator_strategy_kernel=auto_growth
kernel缓存大小
设置kernel缓存大小,以防止模型训练后期性能衰减
export ASCEND_MAX_OP_CACHE_SIZE=5000
CANN日志环境变量
设置日志打屏
1为打屏,可开启后将日志重定向到.log文件中
export ASCEND_SLOG_PRINT_TO_STDOUT=1
设置日志等级
0为INFO级,所有的日志均输出,3为ERROR级
export ASCEND_GLOBAL_LOG_LEVEL=0
Paddle日志环境变量
Paddle的glog等级中,0为无日志,10为全开日志,一般开启到3即可
export GLOG_v=3
开启glog后重定向.log文件需要在语句最后加入 2>&1
命令,例如:
python tools/train.py -c PP-OCRv4_server_rec_ic15_data.yaml -o
Global.use_gpu=False Global.use_npu=True > ocr.log 2>&1
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。