mindspore.dataset.text.Lookup ============================= .. image:: https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/website-images/master/resource/_static/logo_source.svg :target: https://gitee.com/mindspore/mindspore/blob/master/docs/api/api_python/dataset_text/mindspore.dataset.text.Lookup.rst :alt: 查看源文件 .. py:class:: mindspore.dataset.text.Lookup(vocab, unknown_token=None, data_type=mstype.int32) 根据词表,将分词标记(token)映射到其索引值(id)。 参数: - **vocab** (:class:`~.text.Vocab`) - 词表对象,用于存储分词和索引的映射。 - **unknown_token** (str, 可选) - 备用词汇,用于要查找的单词不在词汇表时进行替换。 如果单词不在词汇表中,则查找结果将替换为 `unknown_token` 的值。 如果单词不在词汇表中,且未指定 `unknown_token` ,将抛出运行时错误。默认值: ``None`` ,不指定该参数。 - **data_type** (mindspore.dtype, 可选) - Lookup输出的数据类型。默认值: ``mstype.int32`` 。 异常: - **TypeError** - 参数 `vocab` 类型不为 :class:`mindspore.dataset.text.Vocab` 。 - **TypeError** - 参数 `unknown_token` 类型不为str。 - **TypeError** - 参数 `data_type` 类型不为 :class:`mindspore.dtype` 。 教程样例: - `文本变换样例库 `_