# 比较与tf.data.TextLineDataset的功能差异

## tf.data.TextLineDataset ```python class tf.data.TextLineDataset( filenames, compression_type=None, buffer_size=None, num_parallel_reads=None ) ``` 更多内容详见[tf.data.TextLineDataset](https://www.tensorflow.org/versions/r2.6/api_docs/python/tf/data/TextLineDataset)。 ## mindspore.dataset.TextFileDataset ```python class mindspore.dataset.TextFileDataset( dataset_files, num_samples=None, num_parallel_workers=None, shuffle=Shuffle.GLOBAL, num_shards=None, shard_id=None, cache=None ) ``` 更多内容详见[mindspore.dataset.TextFileDataset](https://mindspore.cn/docs/zh-CN/r2.0.0-alpha/api_python/dataset/mindspore.dataset.TextFileDataset.html#mindspore.dataset.TextFileDataset)。 ## 使用方式 TensorFlow：从文本文件列表创建数据集，支持解压操作，能够设置缓存大小。 MindSpore：从文本文件列表创建数据集，支持设置读取样本的数目。 ## 代码示例 ```python # The following implements TextFileDataset with MindSpore. import mindspore.dataset as ds dataset_files = ['/tmp/example0.txt', '/tmp/example1.txt'] dataset = ds.TextFileDataset(dataset_files) # The following implements TextLineDataset with TensorFlow. import tensorflow as tf filenames = ['/tmp/example0.txt', '/tmp/example1.txt'] dataset = tf.data.TextLineDataset(filenames) ```