MNIST#

class MNIST(root=None, train=True, download=True)[源代码]#

MNIST 数据集。MNIST_数据库(修改后的国家标准与技术研究所数据库) 是一个手写数字的大型数据库,通常用于训练各种图像处理系统。该数据库还广泛用于机器学习领域的训练和测试中。它是将 `NIST`_的原始数据集进行”re-mixing”来创建的。另外,NIST数据集中的黑白图片都被归一化以适应28x28像素值的边界框。MNIST数据库包含6万张训练图像和1万张测试图像。

以上介绍来自`MNIST database - Wikipedia <https://en.wikipedia.org/wiki/MNIST_database>`_.

参数:
  • root (Optional[str]) – MNIST数据集下载或加载的路径。如果默认为``None``,则将被设置为``~/.cache/megengine``(默认路径)

  • train (bool) – 如果设置为 True,使用训练数据集; 否则使用测试集

  • download (bool) – 如果是 True ,则从网上下载数据集并将其放在 root 目录中。如果数据集已经下载,则不会再次下载。

返回:

MNIST Dataset 可以与:class:~.DataLoader 一起工作。

示例

>>> from megengine.data.dataset import MNIST   
>>> mnist = MNIST("/data/datasets/MNIST")  # Set the root path   
>>> image, label = mnist[0]  
>>> image.shape   
(28, 28, 1)

在 1.11 版更改: 原始URL已更新为镜像URL

“请避免通过脚本频繁访问这些文件”!根据MNIST数据集的原始提供者的请求,现在该数据集将从镜像站点 https://ossci-datasets.s3.amazonaws.com/mnist/ 下载

参见

  • MNIST数据集在 MegEngine 快速上手 教程中作为示例使用。

  • 你可以在网上找到很多使用MNIST数据集的机器学习项目。