mindspore_lite.LLMEngineStatus

class mindspore_lite.LLMEngineStatus(status)[源代码]

LLMEngine的状态类,用于表示推理任务状态。

参数:
  • status (object) - LLMEngine的状态。

property block_size

获取PagedAttention块大小。

property empty_max_prompt_kv

获取该LLMEngine的prompt KV cache空计数。

property num_free_blocks

获取PagedAttention空闲块数量。

property num_total_blocks

获取PagedAttention块总数。