比较与tf.data.TextLineDataset的功能差异
tf.data.TextLineDataset
class tf.data.TextLineDataset(
    filenames,
    compression_type=None,
    buffer_size=None,
    num_parallel_reads=None
)
更多内容详见tf.data.TextLineDataset。
mindspore.dataset.TextFileDataset
class mindspore.dataset.TextFileDataset(
    dataset_files,
    num_samples=None,
    num_parallel_workers=None,
    shuffle=Shuffle.GLOBAL,
    num_shards=None,
    shard_id=None,
    cache=None
)
使用方式
TensorFlow:从文本文件列表创建数据集,支持解压操作,能够设置缓存大小。
MindSpore:从文本文件列表创建数据集,支持设置读取样本的数目。
代码示例
# The following implements TextFileDataset with MindSpore.
import mindspore.dataset as ds
dataset_files = ['/tmp/example0.txt',
                 '/tmp/example1.txt']
dataset = ds.TextFileDataset(dataset_files)
# The following implements TextLineDataset with TensorFlow.
import tensorflow as tf
filenames = ['/tmp/example0.txt',
             '/tmp/example1.txt']
dataset = tf.data.TextLineDataset(filenames)
