mindspore.dataset.text.CaseFold

class mindspore.dataset.text.CaseFold[源代码]

将UTF-8编码字符串中的字符规范化为小写,相比 str.lower 支持更多字符。

支持的输入规范化形式详见 ICU_Normalizer2

说明

Windows平台尚不支持 CaseFold

支持平台:

CPU

样例:

>>> import mindspore.dataset.text as text
>>> case_op = text.CaseFold()
>>> text_file_dataset = text_file_dataset.map(operations=case_op)