lite_boost

LiteBoost是MindSpore Lite面向昇腾硬件的推理加速工具包,提供高性能自定义算子、多卡并行推理、量化稀疏等推理加速能力。

并行

lite_boost.parallel.initialize_usp

初始化并行推理所需的HCCL分布式环境。

lite_boost.parallel.ParallelManager

对支持的模型进行原地修改,使其支持分布式并行推理。

算子

lite_boost.ops.rain_fusion_attention

块稀疏融合注意力前向计算。

lite_boost.ops.sparse_attention

高层稀疏注意力入口。