环境变量

本文介绍MindSpore的环境变量。

数据处理

环境变量	功能	类型	取值	说明
DATASET_ENABLE_NUMA	是否开启Dataset模块的numa绑核功能，在大多数分布式场景下numa绑核都能提升数据处理效率和端到端性能	String	True: 开启Dataset模块的numa绑核功能	与libnuma.so配合使用
MS_CACHE_HOST	开启cache时，cache服务所在的IP	String	Cache Server所在机器的IP	与MS_CACHE_PORT一起使用
MS_CACHE_PORT	开启cache时，cache服务所在的端口	String	Cache Server所在机器的端口	与MS_CACHE_HOST一起使用
MS_DATASET_SINK_QUEUE	指定数据下沉队列的容量大小	Integer	1~128：有效的队列容量大小设置范围
MS_DEV_MINDRECORD_SHARD_BY_BLOCK	当对MindRecord进行分片采样时，是否切换数据的切分策略为按块采样	String	True: 数据的切分策略为按块采样 False: 数据的切分策略为按片采样	默认值：False。只对DistributedSampler采样器生效。
MS_ENABLE_NUMA	是否开启全局numa绑核功能，提升端到端性能	String	True: 开启全局numa绑核功能
MS_FREE_DISK_CHECK	是否开启剩余磁盘空间检查	String	True: 开启剩余磁盘空间检查 False: 关闭剩余磁盘空间检查	默认值：True，在使用多个并发同时在共享存储上创建MindRecord时，建议设置为False。
MS_INDEPENDENT_DATASET	是否开启Dataset独立进程模式，此时Dataset会运行于独立的子进程中，仅支持Linux平台	String	True: 开启Dataset独立进程模式 False: 关闭Dataset独立进程模式	默认值：False。此功能当前处于Beta测试阶段，不支持与AutoTune、Offload、Cache、DSCallback一同使用。如果在使用中遇到问题，欢迎反馈。
OPTIMIZE	是否执行dataset数据处理 pipeline 树优化，在适合数据处理算子融合的场景下，可以提升数据处理效率	String	true: 开启pipeline树优化 false: 关闭pipeline树优化

具体用法详见单节点数据缓存和数据处理性能优化。

图编译执行

环境变量	功能	类型	取值	说明
MS_DEV_JIT_SYNTAX_LEVEL	指定静态图模式的语法支持级别	Integer	0：指定静态图模式的语法支持级别为STRICT，仅支持基础语法，且执行性能最佳。可用于MindIR导入导出。 2：指定静态图模式的语法支持级别为LAX，支持更多复杂语法，最大程度地兼容Python所有语法。由于存在可能无法导出的语法，不能用于MindIR导入导出。
MS_JIT_MODULES	指定静态图模式下哪些模块需要JIT静态编译，其函数方法会被编译成静态计算图	String	模块名，对应import导入的顶层模块的名称。如果有多个，使用英文逗号分隔。例如： export MS_JIT_MODULES=mindflow,mindyolo。	默认情况下，第三方库之外的模块都会进行JIT静态编译。MindSpore套件等一些模块如 mindflow、 mindyolo 等并不会被视作第三方库。如果有类似MindSpore套件的模块，内部存在 nn.Cell、 @ms.jit 修饰函数或需要编译成静态计算图的函数方法，可以通过配置该环境变量，使该模块进行JIT静态编译而不会被当成第三方库。
MS_JIT_IGNORE_MODULES	指定静态图模式下哪些模块是第三方库，不进行JIT静态编译，其函数方法会被解释执行。	String	模块名，对应import导入的顶层模块的名称。如果有多个，使用英文逗号分隔。例如： export MS_JIT_IGNORE_MODULES=numpy,scipy。	静态图模式能够自动识别第三方库，一般情况下不需要为NumPy、SciPy这些可识别的第三方库设置该环境变量。如果 MS_JIT_IGNORE_MODULES 和 MS_JIT_MODULES 同时指定同一个模块名，前者生效，后者不生效。
MS_DEV_FALLBACK_DUMP_NODE	是否打印代码中由静态图语法增强技术支持的语法表达式	Integer	1：开启打印功能。不设置或其他值：关闭打印功能。
MS_JIT	是否使用JIT即时编译	Integer	0：不使用JIT即时编译，网络脚本直接按照动态图（PyNative）模式执行。不设置或其他值：根据网络脚本判断执行静态图（Graph）模式还是动态图（PyNative）模式。
MS_JIT_BYTECODE_LOGS	使用JIT bytecode模式时打印对应模块的日志	String	配置项，多个配置项以逗号分隔，例如 export MS_JIT_BYTECODE_LOGS="bytecode,guard" all：打印所有模块日志 bytecode：打印代码原始字节码和修改后字节码 guard：打印guard相关日志 graph_break：打印裂图相关日志
MS_DEV_FORCE_USE_COMPILE_CACHE	是否直接使用编译缓存，不检查网络脚本有无被修改	Integer	1：不检查网络脚本是否被修改，直接读取编译缓存。建议只在调试过程中使用，例如网络脚本只增加了print语句用于打印调试。不设置或其他值：检测网络脚本的改动，网络没有被修改时，才读取编译缓存。
MS_DEV_SIDE_EFFECT_LOAD_ELIM	优化冗余显存拷贝操作	Integer	0: 不做显存优化，占用显存最多。 1: 保守地做部分显存优化。 2: 在损耗一定编译性能的前提下，尽量多地优化显存。 3: 不保证网络的精度，显存消耗最少。默认值：1
MS_DEV_SAVE_GRAPHS	是否保存IR文件	Integer	0：不保存IR文件。 1：运行时会输出图编译过程中产生的一些中间文件。 2：在等级1的基础上，生成更多后端流程相关的IR文件。 3：在等级2的基础上，生成可视化计算图和更多详细的前端IR文件。
MS_DEV_SAVE_GRAPHS_PATH	设置保存计算图的路径	String	保存计算图的路径
MS_DEV_DUMP_IR_FORMAT	配置IR图中展示哪些信息	Integer	0：除return节点外，只打印节点的operator和节点的输入，并且简化子图的打印信息。 1：打印除debug info和scope以外的所有信息。 2或不设置：打印所有信息。
MS_DEV_DUMP_IR_INTERVAL	设置间隔多少个IR文件打印保存一个IR文件，减少IR图的打印数量。	Integer	1或不设置：打印保存所有IR文件。其他数值：按照指定的间隔个数保存IR文件。	该环境变量与MS_DEV_DUMP_IR_PASSES同时打开时，优先遵从MS_DEV_DUMP_IR_PASSES的规则，该环境变量不会生效。
MS_DEV_DUMP_IR_PASSES	根据文件名指定保存哪些IR文件。	String	文件名或文件名的一部分。如果有多个，使用逗号隔开。例如 export MS_DEV_DUMP_IR_PASSES=recompute,renormalize。	设置该环境变量时，无论MS_DEV_SAVE_GRAPHS设置为什么等级，详细的前端IR文件都会参与筛选和打印。
MS_DEV_DUMP_IR_PARALLEL_DETAIL	控制是否打印 DUMP IR 图的详细信息 tensor_map 和 device_matrix。	Integer	1: 打印 DUMP IR 图详细信息，输出 inputs_tensor_map、outputs_tensor_map 和 device_matrix。不设置或其他值：不打印上述 DUMP IR 相关详细信息。
MS_JIT_DISPLAY_PROGRESS	指定是否打印编译进度的信息。	Integer	1：打印关键的编译进度的信息。不设置或其他值：不打印编译进度的信息。
MS_DEV_PRECOMPILE_ONLY	指定是否仅预编译网络，而不执行网络。	Integer	1：仅预编译网络，而不执行网络。不设置或其他值：不预编译网络，即编译并且执行网络。
MS_KERNEL_LAUNCH_SKIP	指定执行过程中需要跳过的算子或者子图	String	ALL或者all：跳过所有算子和子图的执行算子名字（如ReLU）：跳过所有ReLU算子的执行子图名字（如kernel_graph_1）：跳过子图kernel_graph_1的执行，用于子图下沉模式
GC_COLLECT_IN_CELL	是否对未使用的Cell对象进行垃圾回收	Integer	1：对未使用的Cell对象进行垃圾回收不设置或其他值：不会显式调用垃圾回收机制	此环境变量后续将删除，不建议使用。
MS_DEV_USE_PY_BPROP	指定算子的bprop使用Python版本，不使用cpp expander	String	算子名称，可以指定多个算子，以","分隔	实验性质的环境变量，如果不存在Python版本的bprop函数，会执行出错
MS_DEV_DISABLE_BPROP_CACHE	关闭bprop缓存图功能	String	"on"，表示关闭bprop缓存图功能	实验性质的环境变量，关闭缓存功能会导致构图时间延长
MS_ENABLE_GRACEFUL_EXIT	设置使能进程优雅退出	Integer	1：使用进程优雅退出功能。不设置或者其他值：不使用进程优雅退出功能。	使能进程优雅退出功能，依赖callback函数，具体请参考进程优雅退出用例。
MS_DEV_BOOST_INFER	针对前端图编译提供编译优化开关。该开关可加速类型推导模块，以加速网络编译。	Integer	0: 关闭该优化功能。不设置或其他值: 打开该优化功能。	此环境变量后续将删除。
MS_DEV_RUNTIME_CONF	设置运行时控制选项	String	配置项，格式为key:value，多个配置项以逗号分隔，例如 export MS_DEV_RUNTIME_CONF=inline:false,pipeline:false。 inline: 子图cell共享场景下，是否开启后端inline，仅在O0或O1模式下生效，默认值为true。 switch_inline: 是否开启后端控制流inline，仅在O0或O1模式下生效，默认值为true。 multi_stream: 后端分流方式, 取值可为 1）true 通信计算各一条流。 2）false：关闭多流，通信计算单流。3）group(默认值)：通信算子按照通信域分流。 pipeline: 是否使能运行时流水，仅在O0或O1模式下生效，默认值为true。 all_finite: 是否使能溢出检测大算子，仅在O0或O1模式下生效，默认值为true。 memory_statistics: 是否开启内存统计，默认值为false。 compile_statistics: 是否开启编译性能统计，默认值为false。 backend_compile_cache: 是否使用图编译等级O0/O1下的后端编译缓存，仅在前端编译缓存（MS_COMPILER_CACHE_ENABLE）开启时生效，默认值为true。 view: 是否使能view算子功能，仅在O0或O1模式下生效，默认值为true。 actor_thread_fix_bind：在使能线程级绑核功能时，是否使能对 runtime 线程采用“固定绑定”的策略。runtime 共包含5个actor线程，采用“固定绑定”策略时，每个线程顺序绑定范围段内的一个 CPU，例如对device0的runtime绑定范围为"5-9"，即 actor_thread0 绑定CPU 5， actor_thread1 绑定CPU 6，以此类推。默认值为false。
MS_DEV_VIEW_OP	在MS_DEV_RUNTIME_CONF开启view的情况下，指定某些算子进行view替换	String	算子名称，可以指定多个算子，以","分隔	实验性质的环境变量
MS_ALLOC_CONF	设置内存策略	String	配置项，格式为key:value，多个配置项以逗号分隔，例如 export MS_ALLOC_CONF=enable_vmm:true,memory_tracker:true。 enable_vmm: 是否使能虚拟内存，默认值为true。 vmm_align_size: 设置虚拟内存对齐大小，单位为MB，默认值为2。 memory_tracker: 是否开启memory tracker，默认值为false。 memory_tracker_path: 开启memory tracker并保存到指定路径，默认值关闭memory tracker且保存路径为空。 simple_tracker: 是否开启tracker简化模式，不保存tracker_graph.ir，只保留最后一个user task。开启memory_tracker时生效，默认值为false。 acl_allocator: 是否使用ACL内存分配器，默认值为true。 somas_whole_block: 是否使用SOMAS整块内存分配，默认值为false。 enable_small_pool: 是否开启小内存池，默认值为false。开启后小于1MB的内存申请使用小内存池单独管理。
MS_DEV_GRAPH_KERNEL_FLAGS	设置图算融合的融合策略	String	配置项，格式为 `--key=value`，多个配置项以空格分隔，多个value以逗号分隔，例如 `export MS_DEV_GRAPH_KERNEL_FLAGS="--enable_expand_ops=Square --enable_cluster_ops=MatMul,Add"` opt_level：设置优化级别。默认值： 2 。 enable_expand_ops：将不在默认列表的算子强行展开，需有相应算子的expander实现。 disable_expand_ops：禁止对应算子展开。 enable_expand_ops_only：仅允许对应算子展开。当设置该选项时，忽略以上两个选项。 enable_cluster_ops：在默认融合算子名单的基础上，把对应算子加入参与融合的算子集合。 disable_cluster_ops：禁止对应算子加入参与融合的算子集合。 enable_cluster_ops_only：仅允许对应算子加入参与融合的算子集合。当设置该选项时，忽略以上两个选项。 disable_fusion_pattern：禁止对应融合pattern参与融合。 enable_fusion_pattern_only：仅允许对应融合pattern参与融合。当设置该选项时，忽略以上选项。 enable_pass：默认关闭的pass可以通过该选项强制使能。 disable_pass：默认使能的pass可以通过该选项强制关闭。 dump_as_text：将关键过程的详细信息生成文本文件保存到 graph_kernel_dump 目录里。默认值： False 。 enable_debug_mode：在图算kernelmod launch前后插同步，并在launch失败时打印调试信息，仅支持GPU后端。默认值： False 。 path：指定读取json配置。当设置该选项时，忽略以上选项。	详细说明参考自定义融合
MS_DEV_PYNATIVE_FUSION_FLAGS	设置动态图异步执行模式下的算子融合选项	String	配置项，格式为 `--key=value`，多个配置项以空格分隔，多个value以逗号分隔。例如 `export MS_DEV_PYNATIVE_FUSION_FLAGS="--opt_level=1 --enable_ops=MatMul,MatMulExt"` opt_level：是否开启算子融合，0表示不开启，1表示开启。默认值：0。 enable_ops：在开启算子融合的前提下，将部分默认不参与融合的算子加入融合。该配置项支持的算子：Dense、MatMul、MatMulExt、BatchMatMul、BatchMatMulExt、GroupedMatmul。
MS_DEV_DISABLE_AUTO_H2D	控制在动态图流程中算子是否启用Dispatch功能。启用后，算子会根据输入tensor所在的设备，自动选择对应的设备执行。	Integer	1：开启动态图Dispatch功能，关闭动态图算子输入隐式拷贝。如果输入多个tensor的设备不一致，则会抛异常。 2：开启动态图Dispatch功能。如果输入多个tensor的设备不一致，则会打印堆栈信息，然后按高优先级的设备执行（例如：同时存在Ascend和CPU的tensor，则优先到Ascend执行）。 3：开启动态图Dispatch功能。如果输入多个tensor设备不一致，按高优先级的设备执行。不设置或其他值：不开启Dispatch功能
MS_DEV_LAUNCH_BLOCKING	控制算子是否同步下发。开启后，算子下发将采用单线程，并且会同步流。	Integer	1：开启算子同步下发不设置或其他值：不开启算子同步下发
MS_DEV_HCCL_CONF	设置HCCL_BUFFSIZE显存策略	String	配置项，格式为key:value，多个配置项以逗号分隔，例如 export MS_DEV_HCCL_CONF=enable_hccl_config:True,hccl_customized_default:100MB,hccl_list_config:0-1-2-3=200MB,hccl_stride_config:0-6:2=50MB。 enable_hccl_config: 是否使能HCCL_BUFFSIZE显存，默认值为false。 hccl_customized_default: 设置HCCL_BUFFSIZE全局默认大小，单位为MB。 hccl_list_config: 设置指定rank_list的HCCL_BUFFSIZE，单位为MB。 hccl_stride_config: 设置指定rank范围、按照指定stride切分通讯组，并配置此rank_list的HCCL_BUFFSIZE，单位为MB。
MS_DEV_HOST_BLOCKING_RUN	控制动态图算子是否单线程下发。开启后，动态图算子将采用单线程下发。	Integer	1：动态图算子采用单线程下发。不设置或其他值：动态图算子不开启单线程下发。
MS_DEV_TENSOR_INDEX_BOOST	控制图编译阶段是否启用Tensor索引优化。开启后，将使用view算子和inplace算子实现Tensor索引功能，提升索引操作的执行效率。	Integer	1：启用Tensor索引优化不设置或其他值：不启用Tensor索引优化	仅限Ascend AI处理器环境，图编译等级为O0或O1流程使用。实验性质的环境变量。
MS_SUPPORT_BINARY	控制是否支持在图模式下运行.pyc或者.so。	Integer	1：支持图模式下运行pyc或者so。不设置或其他值：不支持。
MS_DEV_OPTIMIZE_OP_IMPL	控制是否在图编译阶段采用数学等价但性能更优的底层算子调用策略。	Integer	1：采用数学等价但性能更优的算子调用逻辑。不设置或其他值：保持默认算子调用逻辑。	设置后不支持在程序中进行中途修改。

Dump调试

环境变量	功能	类型	取值	说明
MINDSPORE_DUMP_CONFIG	指定云侧Dump功能或端侧Dump功能所依赖的配置文件的路径	String	文件路径，支持相对路径与绝对路径
MS_DIAGNOSTIC_DATA_PATH	使用云侧Dump功能时，如果Dump配置文件没有设置 path 字段或者设置为空字符串，则 $MS_DIAGNOSTIC_DATA_PATH /debug_dump 就会被当做path的值。若Dump配置文件中设置了 path 字段，则仍以该字段的实际取值为准。	String	文件路径，只支持绝对路径	与MINDSPORE_DUMP_CONFIG配合使用
MINDSPORE_DUMP_IGNORE_USELESS_OUTPUT	是否忽略无用的dump输出，例如Send算子的输出。	String	"1"：忽略无用的dump输出 "0"：保留无用的dump输出	默认值："1"。该环境变量仅在MINDSPORE_DUMP_CONFIG配置时生效。
MS_DEV_DUMP_BPROP	在当前路径dump算子反向图的ir文件	String	"on"，表示在当前路径dump算子反向图的ir文件	实验性质的环境变量
ENABLE_MS_DEBUGGER	是否在训练中启动Debugger	Boolean	1：开启Debugger 0：关闭Debugger	与MS_DEBUGGER_HOST、MS_DEBUGGER_PORT一起使用
MS_DEBUGGER_PARTIAL_MEM	是否开启部分内存复用（只有在Debugger选中的节点才会关闭这些节点的内存复用）	Boolean	1：开启Debugger选中节点的内存复用 0：关闭Debugger选中节点的内存复用
MS_OM_PATH	配置task异常时dump数据路径以及图编译出错时dump的analyze_fail.ir文件的保存目录，保存路径为：指定的路径/rank_${rank_id}/om	String	文件路径，支持相对路径与绝对路径
MS_DUMP_SLICE_SIZE	指定Print、TensorDump、TensorSummary、ImageSummary、ScalarSummary、HistogramSummary算子的数据切片大小。	Integer	0~2048，单位：MB，默认值为0。当取值为0时，表示不对数据切片。
MS_DUMP_WAIT_TIME	指定Print、TensorDump、TensorSummary、ImageSummary、ScalarSummary、HistogramSummary算子的二阶段超时时间。	Integer	0~600，单位：秒，默认值为0。当取值为0时，表示使用默认超时时间，即 mindspore.get_context("op_timeout") 的取值。	该环境变量仅仅在MS_DUMP_SLICE_SIZE不为零的情况下生效。目前二阶段的等待时间无法超过mindspore.get_context("op_timeout")的值。

具体用法详见 Dump功能调试。

分布式并行

环境变量	功能	类型	取值	说明
RANK_ID	指定深度学习时调用Ascend AI处理器的逻辑ID。	Integer	0~7，多机并行时不同server中DEVICE_ID会有重复，使用RANK_ID可以避免这个问题（多机并行时 RANK_ID = SERVER_ID * DEVICE_NUM + DEVICE_ID，DEVICE_ID指当前机器的第几个Ascend AI处理器。）
RANK_SIZE	指定深度学习时调用Ascend AI处理器的数量。注意：Ascend AI处理器，使用多卡执行分布式用例时，由用户指定。	Integer	1~8，调用Ascend AI处理器的数量
RANK_TABLE_FILE	路径指向文件，包含指定多Ascend AI处理器环境中Ascend AI处理器的 device_id 对应的 device_ip 。注意：Ascend AI处理器，使用多卡执行分布式用例时，由用户指定。	String	文件路径，支持相对路径与绝对路径
MS_COMM_COMPILER_OPT	Ascend后端图模式下编译时，指定可以复用的通信算子的上限。注意：Ascend AI处理器，使用多卡执行分布式用例时，由用户指定。	Integer	-1或正整数：使能通信子图复用，-1表示使用框架默认值，其他正整数表示用户指定值不设置或其他值：关闭通信子图复用
MS_HCCL_ZERO_COPY	控制是否开启HCCL零拷贝功能，减少单server内集合通信过程中的片内拷贝次数。	Integer	1：开启HCCL零拷贝功能 0或不设置：关闭HCCL零拷贝功能	默认值：0。仅支持Ascend A3系列产品的单机多卡场景，且依赖虚拟内存功能，需设置 MS_ALLOC_CONF=enable_vmm:true 。其他约束请参见《CANN HCCL API（C）》中“零拷贝功能 > 使用前必读”章节。
DEVICE_ID	昇腾AI处理器的ID，即Device在AI server上的序列号。	Integer	昇腾AI处理器的ID，取值范围：[0, 实际Device数量-1]。
MS_ROLE	指定本进程角色。	String	MS_SCHED: 代表Scheduler进程，一个训练任务只启动一个Scheduler，负责组网，容灾恢复等，不会执行训练代码。 MS_WORKER: 代表Worker进程，一般设置分布式训练进程为此角色。 MS_PSERVER: 代表Parameter Server进程，只有在Parameter Server模式下此角色生效。	Worker和Parameter Server进程会向Scheduler进程注册从而完成组网。当进程角色指定为MS_SCHED或MS_PSERVER时，MindSpore会自动将其运行在CPU后端。
MS_SCHED_HOST	指定Scheduler的IP地址。	String	合法的IP地址。	当前版本暂不支持IPv6地址。
MS_SCHED_PORT	指定Scheduler绑定端口号。	Integer	1024～65535范围内的端口号。
MS_NODE_ID	指定本进程的ID，集群内唯一。	String	代表本进程的唯一ID，默认由MindSpore自动生成。	MS_NODE_ID在以下情况需要设置，一般情况下无需设置，由MindSpore自动生成：开启容灾场景：容灾恢复时需要获取当前进程ID，从而向Scheduler重新注册。开启GLOG日志重定向场景：为了保证各训练进程日志独立保存，需设置进程ID，作为日志保存路径后缀。指定进程rank id场景：用户可通过设置MS_NODE_ID为某个整数，来指定本进程的rank id。
MS_WORKER_NUM	指定角色为MS_WORKER的进程数量。	Integer	大于0的整数。	用户启动的Worker进程数量应当与此环境变量值相等。若小于此数值，组网失败；若大于此数值，Scheduler进程会根据Worker注册先后顺序完成组网，多余的Worker进程会启动失败。
MS_SERVER_NUM	指定角色为MS_PSERVER的进程数量。	Integer	大于0的整数。	只在Parameter Server训练模式下需要设置。
MS_INTERFERED_SAPP	开启自动并行SAPP的手自一体功能。	Integer	1代表开启，不设置或其他值：关闭。
MS_ENABLE_RECOVERY	开启容灾。	Integer	1代表开启，0代表关闭。默认为0。
GROUP_INFO_FILE	指定通信域信息存储路径	String	通信域信息文件路径，支持相对路径与绝对路径
MS_SIMULATION_LEVEL	指定模拟编译等级。	Integer	为0时，不占卡模拟图编译；为1时，不占卡模拟图编译和算子编译；为2时，占卡模拟图编译和算子编译，内存分析更准确；为3时，占卡模拟执行除通信算子以外的算子。默认不开启。	此环境变量主要用于单卡模拟分布式多卡特定rank卡的编译情况，需要RANK_SIZE和RANK_ID配合使用。
DUMP_PARALLEL_INFO	导出自动并行/半自动并行模式下的并行相关通信信息。dump文件路径可以通过环境变量 MS_DEV_SAVE_GRAPHS_PATH 设置。	Integer	1代表开启该dump功能，其他值或者不设置该环境变量代表关闭。	每张卡保存的json文件包含的字段含义如下： hccl_algo: 集合通信算法。 op_name: 通信算子名称。 op_type: 通信算子类型。 shape: 通信算子的shape信息。 data_type: 通信算子的数据类型。 global_rank_id: 全局rank编号。 comm_group_name: 通信算子的通信域名称。 comm_group_rank_ids: 通信算子的通信域。 src_rank: Receive算子的对端算子的rank_id。 dest_rank: Send算子的对端算子的rank_id。 sr_tag: src和dest相同时，不同send-receive对的标识ID。
MS_CUSTOM_DEPEND_CONFIG_PATH	根据用户指定路径下的配置文件xxx.json插入控制边，在MindSpore中使用原语ops.Depend表达依赖控制关系。	String	该环境变量只在图模式下使能。	json文件包含的字段含义如下： get_full_op_name_list(bool)：是否生成算子名称列表，可选，默认为false。 stage_xxx(string)：用于多卡多图场景，即不同的卡执行不同的图（如流水并行），其中stage_xxx只是一个序号标签，序号值没有实际指向意义。 graph_id(int)：用于区分子图信息，graph_id号需要与实际执行的graph_id一致, 不一致插入控制边的动作将失效。 depend_src_list(List[string])：需要插入控制边的源端算子名称列表，需要和depend_dest_list中的算子按顺序一一对应，否则插入控制边的动作将失效。 depend_dest_list(List[string])：需要插入控制边的终端算子名称列表，需要和depend_src_list中的算子按顺序一一对应，否则插入控制边的动作将失效。 delete_depend_list(List[string])：需要被删除的算子名称列表，算子名称不存在或者和graph_id不匹配，删除节点的动作将失效。
MS_DEV_ENABLE_PASS_CIRCLE_RECOVERY	控制是否使能自动检测并行pass导致的计算图成环，并回退并行pass对计算图的修改功能。	Integer	1：开启自动检测并行pass导致的计算图成环，并回退并行pass对计算图的修改功能。不设置或其他值：关闭自动检测并行pass导致的计算图成环，并回退并行pass对计算图的修改功能。

动态组网相关的具体用法详见动态组网。

算子编译

环境变量	功能	类型	取值	说明
MS_COMPILER_CACHE_ENABLE	表示是否加载或者保存图编译缓存。当 MS_COMPILER_CACHE_ENABLE 被设置为 1 时，在第一次执行的过程中，一个编译缓存会被生成并且导出为一个MINDIR文件。当该网络被再次执行时，如果 MS_COMPILER_CACHE_ENABLE 仍然为 1 并且网络脚本没有被更改，那么这个编译缓存会被加载。注意：目前只支持有限的Python脚本更改的自动检测，这意味着可能有正确性风险。当前不支持编译后大于2G的图。这是一个实验特性，可能会被更改或者删除。	Integer	0：关闭编译缓存功能 1：开启编译缓存功能	如果与 MS_COMPILER_CACHE_PATH 一起使用，编译缓存文件将保存在 ${MS_COMPILER_CACHE_PATH} /rank_${RANK_ID}/ 目录下。其中 RANK_ID 为多卡训练场景中的卡号，单卡场景默认 RANK_ID=0 。
MS_COMPILER_CACHE_PATH	MindSpore编译缓存目录，存储图和算子编译过程生成的缓存文件，如 graph_cache 、 kernel_meta 、 somas_meta 等	String	缓存文件路径，支持相对路径与绝对路径
MS_COMPILER_OP_LEVEL	Ascend后端编译时，开启debug功能，生成TBE指令映射文件。注意：仅Ascend AI处理器环境使用。	Integer	0~4，允许设置级别取值范围。 0：不开启算子debug功能，删除算子编译缓存文件 1：生成TBE指令映射文件 .cce 和Python-cce映射文件 _loc.json ，开启debug功能 2：生成TBE指令映射文件 .cce 和Python-cce映射文件 _loc.json ，开启debug功能，关闭编译优化开关，开启ccec调试功能（ccec编译器选项设置为-O0-g） 3：不开启算子debug功能，默认值 4：生成TBE指令映射文件 *.cce 和UB融合计算描述文件 {$kernel_name}_compute.json	发生AICore Error时，如果需要保存算子cce文件，可以设置 MS_COMPILER_OP_LEVEL 为1或2。
MS_ASCEND_CHECK_OVERFLOW_MODE	设置浮点计算结果输出模式	String	SATURATION_MODE: 饱和模式。 INFNAN_MODE: INF/NAN模式。默认值: INFNAN_MODE。	饱和模式：计算出现溢出时，饱和为浮点数极值（+-MAX）。 INF/NAN模式：遵循IEEE 754标准，根据定义输出INF/NAN的计算结果。
MS_CUSTOM_AOT_WHITE_LIST	指定自定义算子使用动态库的合法路径。	String	动态库的合法路径。框架会根据自定义算子使用动态库的合法路径进行校验。当自定义算子使用的动态库不在路径中时，框架会报错并拒绝使用对应动态库。当设置为空时，不对自定义算子动态库进行校验。默认：空。

常见问题详见 FAQ 。

日志

环境变量	功能	类型	取值	说明
GLOG_log_dir	指定日志输出的路径	String	文件路径，支持相对路径与绝对路径	与 GLOG_logtostderr 一起使用若 GLOG_logtostderr 的值为0，则必须设置此变量若指定了 GLOG_log_dir 且 GLOG_logtostderr 的值为1时，则日志输出到屏幕，不输出到文件日志保存路径为：指定的路径/rank_${RANK_ID}/logs/ ，非分布式训练场景下， RANK_ID 为0；分布式训练场景下， RANK_ID 为当前设备在集群中的ID C++和Python的日志会被输出到不同的文件中，C++日志的文件名遵从 GLOG 日志文件的命名规则，这里是 mindspore.机器名.用户名.log.日志级别.时间戳.进程ID ，Python日志的文件名为 mindspore.log.进程ID GLOG_log_dir 只能包含大小写字母、数字、"-"、"_"、"/"等字符
GLOG_max_log_size	控制MindSpore C++模块日志单文件大小，可以通过该环境变量更改日志文件默认的最大值	Integer	正整数，默认值：50MB	如果当前写入的日志文件超过最大值，则新输出的日志内容会写入到新的日志文件中
GLOG_logtostderr	控制日志的输出方式	Integer	1：日志输出到屏幕 0：日志输出到文件默认值：1	与GLOG_log_dir一起使用
GLOG_stderrthreshold	日志模块在将日志输出到文件的同时也会将日志打印到屏幕，GLOG_stderrthreshold用于控制此情况下打印到屏幕的日志级别	Integer	0-DEBUG 1-INFO 2-WARNING 3-ERROR 4-CRITICAL 默认值：2
GLOG_v	控制日志的级别	Integer	0-DEBUG 1-INFO 2-WARNING 3-ERROR，表示程序执行出现报错，输出错误日志，程序可能不会终止 4-CRITICAL，表示程序执行出现异常，将会终止执行程序默认值：2	指定日志级别后，将会输出大于或等于该级别的日志信息
VLOG_v	控制verbose日志的输出，在 import mindspore 之前通过export来配置该环境变量	String	通过命令： export VLOG_v=20000;python -c 'import mindspore'; 查看MindSpore可用的 verbose 日志级别。	格式1： VLOG_v=number，仅输出verbose level值等于 number 的日志。格式2： VLOG_v=(number1,number2)，仅输出verbose level值介于 number1 和 number2 之间（包含 number1 和 number2）的日志。特别地， VLOG_v=(,number2) 输出 verbose level 介于 1 ~ number2 的日志，而 VLOG_v=(number1,) 输出 verbose level 介于 number1 ~ 0x7fffffff 的日志。上面 number、 number1、 number2 的取值只接受非负十进制整数值，最大值取值为 int 类型的最大值 0x7fffffff。 VLOG_v 字符串中不能包含空白字符。注意：括号 () 对于 bash 有特殊含义，当指定范围时，需要用引号包起来，如 export VLOG_v="(number1,number2)" 或 export VLOG_v='(number1,number2)'。如果直接把环境变量的设置写到命令行中，可以不加引号，如通过命令 VLOG_v=(1,) python -c 'import mindspore' 查看 MindSpore 已经使用的 verbose tag 标志。
logger_backupCount	用于控制MindSpore Python模块日志文件数量	Integer	默认值：30
logger_maxBytes	用于控制MindSpore Python模块日志单文件大小	Integer	默认值：52428800 bytes
MS_SUBMODULE_LOG_v	指定MindSpore C++各子模块的日志级别	Dict {String:Integer…}	0-DEBUG 1-INFO 2-WARNING 3-ERROR	赋值方式为： MS_SUBMODULE_LOG_v="{SubModule1:LogLevel1,SubModule2:LogLevel2,…}" 其中被指定子模块的日志级别将覆盖 GLOG_v 在此模块内的设置，此处子模块的日志级别 LogLevel 与 GLOG_v 的日志级别含义相同， MindSpore子模块列表详见 sub-module_names。例如可以通过 GLOG_v=1 MS_SUBMODULE_LOG_v="{PARSER:2,ANALYZER:2}" 把 PARSER 和 ANALYZER 模块的日志级别设为WARNING，其他模块的日志级别设为INFO
GLOG_logfile_mode	用于控制MindSpore中GLOG日志文件的权限，是GLOG的环境变量	八进制数字	可参考Linux文件权限设置的数字表示，默认值：0640
MS_RDR_ENABLE	是否开启程序运行数据记录器（RDR），如果MindSpore出现了运行异常，会自动导出MindSpore中预先记录的数据以辅助定位运行异常的原因	Integer	1：开启RDR功能 0：关闭RDR功能	配合 MS_RDR_MODE 与 MS_RDR_PATH 使用
MS_RDR_MODE	指定运行数据记录器（RDR）导出数据的模式	Integer	1：仅在训练进程异常终止时导出数据 2：训练进程异常终止或正常结束时导出数据默认值：1	配合 MS_RDR_ENABLE=1 使用
MS_RDR_PATH	配置程序运行数据记录器（RDR）的文件导出的根目录路径	String	目录路径，仅支持绝对路径	配合 MS_RDR_ENABLE=1 使用，最终RDR文件将 ${MS_RDR_PATH} /rank_${RANK_ID}/rdr/ 目录下。其中 RANK_ID 为多卡训练场景中的卡号，单卡场景默认 RANK_ID=0 。
MS_EXCEPTION_DISPLAY_LEVEL	控制异常信息显示级别	Integer	0: 显示与模型开发者和框架开发者相关的异常信息 1: 显示与模型开发者相关的异常信息默认值：0

注意：glog不支持日志文件的绕接，如果需要控制日志文件对磁盘空间的占用，可选用操作系统提供的日志文件管理工具，例如：Linux的logrotate。请在 import mindspore 之前设置日志相关环境变量。

静默故障检测

环境变量

功能

类型

取值

说明

MS_SDC_DETECT_ENABLE

是否使能CheckSum检测静默故障

Integer

0：关闭CheckSum检测静默故障

1：使能CheckSum检测静默故障

目前本特性仅支持在O0或O1模式下，对bfloat16数据类型的MatMul算子进行CheckSum校验

MS_NPU_ASD_CONFIG

设置静默检测选项

String

配置项，格式为key:value，多个配置项以逗号分隔，例如 export MS_NPU_ASD_CONFIG=enable:true,with_checksum:true,grad_sample_interval:10,upper_thresh1:1000000,upper_thresh2:100,cooldown:5,strikes_num:3,strikes_window:480,checksum_cooldown:180

enable: 是否开启特征值检测，默认值为false

with_checksum: 是否联动CheckSum检测，默认值为false

grad_sample_interval: 梯度特征值采样间隔，默认值为10，即1/10的采样率

upper_thresh1: 特征值检测的一级阈值，格式为大于等于3的正整数，默认值为1000000

upper_thresh2: 特征值检测的二级阈值，格式为大于等于3的正整数，默认值为100

cooldown: 特征值异常冷却时间和CheckSum执行时间，格式为正整数，单位为分钟，默认值为5

strikes_num: 触发CheckSum检测的特征值异常次数，默认值为3

strikes_window: 统计特征值异常次数的时间窗口，格式为正整数，单位分钟，默认值为480

checksum_cooldown: CheckSum检测冷却时间，格式为正整数，单位为分钟，默认值为180

目前本特性仅支持检测自动并行和半自动并行模式的网络

特征值检测的更多内容详见特征值检测。

三方库

环境变量	功能	类型	取值	说明
OPTION_PROTO_LIB_PATH	PROTO依赖库路径	String	目录路径，支持相对路径与绝对路径
PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION	选择Protocol Buffers后端使用什么语言实现	String	"cpp"：使用C++后端实现 "python"：使用Python后端实现不设置或其他值：使用Python后端实现
ASCEND_OPP_PATH	OPP包安装路径	String	OPP包安装的绝对路径	仅限Ascend AI处理器环境需要，一般提供给用户的环境已配置好，无需关心。
ASCEND_AICPU_PATH	AICPU包安装路径	String	AICPU包安装的绝对路径	仅限Ascend AI处理器环境需要，一般提供给用户的环境已配置好，无需关心。
ASCEND_CUSTOM_OPP_PATH	自定义算子包安装路径	String	自定义算子包安装的绝对路径	仅限Ascend AI处理器环境需要，一般提供给用户的环境已配置好，无需关心。
ASCEND_TOOLKIT_PATH	TOOLKIT包安装路径	String	TOOLKIT包安装的绝对路径	仅限Ascend AI处理器环境需要，一般提供给用户的环境已配置好，无需关心。
CUDA_HOME	CUDA安装路径	String	CUDA包安装的绝对路径	仅限GPU环境需要，一般无需设置，如在GPU环境中安装了多种版本的CUDA，为了避免混淆，建议配置此环境变量。
MS_ENABLE_THM	使能训练监控（Training Health Monitor）功能	String	"{HCCL_WATCHDOG:1,HCCL_STATUS_SAVE:1}"。HCCL_WATCHDOG：使用一个线程监控集合通信域内是否存在故障，默认开启。HCCL_STATUS_SAVE：使用一个线程记录集合通信算子执行状态，默认关闭。	仅限在 Ascend 后端开启图模式，且 jit_level 设置为 "O0" 或 "O1"。使用 HCCL_STATUS_SAVE 功能时，可以同时配置 HCCL_STATUS_SAVE_CONFIG 字段，配置形式为 JSON 文件（例如：{HCCL_STATUS_SAVE:1,HCCL_STATUS_SAVE_CONFIG='./abc.json'}）。文件内容： {"HCCL_STATUS_SAVE_PATH": str, "HCCL_STATUS_SAVE_INTERVAL": int} ，其中 HCCL_STATUS_SAVE_PATH 为通信算子执行状态文件保存路径（绝对路径，否则保存在默认路径 /tmp 下），HCCL_STATUS_SAVE_INTERVAL 为保存文件间隔。如果不配置 HCCL_STATUS_SAVE_CONFIG，默认保存在 /tmp 目录下，保存间隔30秒。
MS_ENABLE_TFT	使能训练故障容错（Training Fault Tolerance）功能。	String	"{TTP:1,UCE:1,ARF:1,TSP:1}"。TTP (Try To Persist)：临终 CKPT 功能、UCE (Uncorrectable Memory Error)：UCE 故障容错恢复功能、TRE (Training Result Error)：训练结果异常恢复功能、ARF (Air Refuelling)：进程级重调度恢复功能、TSP(Training Step Pause)：训练迭代暂停、RSC (Register Stop/Start Controller)： POD级重调度功能。上述特性可以分开使能，如果只想启用其中的某一个功能，则将对应的值设置为 1 即可。（开启 UCE 或者 ARF 功能时，默认开启 TTP 功能。TRE 功能不可以与 UCE 或 ARF 功能同时使用。仅开启 RSC （当前版本必须依赖MindX）时，其他训练故障容错功能不生效。）	仅限在 Ascend 后端开启图模式，且 jit_level 设置为 "O0" 或 "O1"。
MS_TFT_IP	MindIO的controller线程所在IP，供processor链接。	String	IP地址。	仅限在 Ascend 后端开启图模式，且 jit_level 设置为 "O0" 或 "O1"。
MS_TFT_PORT	MindIO的controller线程绑定端口，供processor链接。	Integer	正整数。	仅限在 Ascend 后端开启图模式，且 jit_level 设置为 "O0" 或 "O1"。
AITURBO	使能华为云存储加速	String	"1": 使能华为云存储加速。其他值：关闭华为云存储加速。默认值：空。	仅限华为云环境。

CANN

CANN的环境变量详见昇腾社区。请在 import mindspore 之前设置CANN的环境变量。

环境变量

功能

类型

取值

说明

MS_FORMAT_MODE

设置Ascend的默认优选格式，整网设置为ND格式

Integer

1: 算子优先选择ND格式。

0：算子优先选择私有格式。

默认值：1。

此环境变量影响算子的format选择，从而对网络执行性能和内存占用产生影响，可通过设置此选项测试得到性能和内存更优的算子格式选择。

Profiler

环境变量

功能

类型

取值

说明

MS_PROFILER_OPTIONS

设置Profiler的配置信息

String

配置Profiler的采集选项，格式为JSON字符串。其中以下几个参数类型与实例化Profiler方式有差异，取值含义相同：

activities (list, 可选) - 设置采集性能数据的设备，可传多个设备，默认值：[CPU, NPU]。可取值：[CPU]、[NPU]、[CPU, NPU]。

aic_metrics (str, 可选) - 设置AI Core指标类型。默认值：AicoreNone。可取值：AicoreNone、ArithmeticUtilization、PipeUtilization、Memory、MemoryL0、ResourceConflictRatio、MemoryUB、L2Cache、MemoryAccess。

profiler_level (str, 可选) - 设置采集性能数据级别。默认值：Level0。可取值：Level0、Level1、Level2。

其他参数可参考 MindSpore profile参数详解。

此环境变量使能与输入参数实例化Profiler方式使能性能数据采集的方式二选一。

PROFILING_MODE

设置CANN Profiling的模式

String

true：开启Profiling功能。

false或者不配置：关闭Profiling功能。

dynamic：动态采集性能数据模式。

此环境变量为CANN Profiling使能环境变量，Profiler读取此环境变量用于检查避免重复开启CANN Profiling。用户不需要手动设置此环境变量。

源码构建

环境变量	功能	类型	取值	说明
MSLIBS_CACHE_PATH	MindSpore源码编译时，编译的第三方库的安装路径。	String	"~/.mslib": 源码编译过程中编译的第三方库的安装位置。默认值：空。	设置该变量后，MindSpore源码编译过程中编译的第三方库会被安装到变量指定的目录下，从而支持在多次编译间共享第三方库，大幅降低编译耗时。
MSLIBS_SERVER	MindSpore源码编译时，从该变量指向的地址下载第三方库源码。	String	"tools.mindspore.cn"：MindSpore官方下载源。默认值：空。	设置该变量后，MindSpore源码编译时会从变量指向的路径下载第三方库源代码，避免访问github的网络不稳定问题，提升下载速度。该变量在编译选项包含-S on时不生效。