5.MNIST数据集简介

格式：pptx
大小：2.34 MB
文档页数：41

下载文档原格式

/ 41

MNIST数据集介绍

MNIST数据集介绍
⼤多数⽰例使⽤⼿写数字的MNIST数据集[^1]。

该数据集包含60,000个⽤于训练的⽰例和10,000个⽤于测试的⽰例。

这些数字已经过尺⼨标准化并位于图像中⼼，图像是固定⼤⼩(28x28像素)，其值为0到1。

为简单起见，每个图像都被平展并转换为784(28 * 28)个特征的⼀维numpy数组。

概览
⽤法
在我们的⽰例中，我们使⽤TensorFlow 脚本来加载该数据集。

它对于管理我们的数据⾮常有⽤，并且可以处理：
加载数据集
将整个数据集加载到numpy数组中
# 导⼊ MNIST
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)
# 加载数据
X_train = mnist.train.images
Y_train = bels
X_test = mnist.test.images
Y_test = bels
next_batch函数，可以遍历整个数据集并仅返回所需的数据集样本部分(以节省内存并避免加载整个数据集)。

# 获取接下来的64个图像数组和标签
batch_X, batch_Y = mnist.train.next_batch(64)。

MNIST数据集介绍

MNIST数据集介绍MNIST（Modified National Institute of Standards and Technology）是一个广泛使用的手写数字数据集，被认为是计算机视觉领域中最常用的数据集之一、它由美国国家标准与技术研究所（National Institute of Standards and Technology，简称NIST）所创建并修改，用于训练和测试机器学习算法，特别是在图像识别和数字分类方面。

MNIST数据集的主要任务是将手写数字图片进行分类，即将0到9的数字正确地识别出来。

这个任务是一个经典的图像分类问题，对于机器学习和深度学习领域的算法评估和模型训练有着很高的重要性。

大量的研究和算法都是在MNIST数据集上进行验证的，因此它已成为一个被广泛接受和使用的基准数据集。

在MNIST数据集上进行算法评估和模型训练通常要遵循以下步骤：2.数据预处理：对于图像数据，常用的预处理方法包括将图像进行标准化处理，即将像素值进行归一化，确保像素值的范围符合算法的要求。

此外，还可以对图像进行平滑（如高斯滤波）、降噪、转化为灰度图像等操作。

3.特征工程：对于图像分类问题，人工提取和选择适当的特征对算法的性能至关重要。

在MNIST数据集中，可以使用边缘检测、梯度方向直方图、像素密度等特征来描述数字图像。

4.模型选择和训练：根据具体的任务需求和算法的性能，选择合适的模型进行训练。

针对MNIST数据集的手写数字分类任务，常用的模型包括K近邻算法、支持向量机、决策树、随机森林、神经网络等。

5.模型评估和调优：通过划分训练集和验证集，使用验证集上的评估指标来评估模型的性能。

常用的评估指标包括准确率、召回率、精确率以及F1值。

根据评估结果，可以对模型进行调优和改进，提高其在测试数据上的性能。

MNIST数据集的特点在于它的简单性和标准化。

手写数字的图像可以很容易地转化为数字矩阵，因此非常适合用于算法的验证和对比。

第5章：MNIST数据集简介

训练集（training set）由来自250个不同人手写的数字构成，其中50%是高中学生，50%来自人口普查局（the Census Bureau）的工作人员。测试集（test set）也是同样比例的手写数字数据。
5.1：MNIST数据集简介
1 MNIST数据集的概念 2 MNIST数据集功能 3 MNIST数据集组成
3：MNIST数据集组成
MNIST数据单元分为两个部分：一张包含手写数字的图片一个对应的标签我们把图片设为“xs”，把这些标签设为“ys”。训练数据集和测试数据集都含有xs和ys，可以将训练数据集的图片名称设定为mnist.train.images，将训练数据集的标签设定为 bels。
1 MNIST数据集的概念 2 MNIST数据集功能 3 MNIST数据集组成
1：MNIST数据集的概念
当学习任意一门计算机语言进行编程时，首先接触的第一个程序就是打印“Hello World”。大家接触每一种编程语言都会有Hello World作为第一个编程任务，在人工智能机器学习领域也不例外。学习人工智能的初学者，通过使用MNIST（Mixed National Institute of Standards and Technology database）手写数字识别任务的练习，来对人工智能TensorFlow进行最初步的应用。
2：MNIST数据集功能
数据集有两个功能：（1）提供了大量的数据作为训练集和测试集，为
一些兴趣爱好者和学习者提供了丰富的资源信息。（2）形成一个业界领域具有一定对比程度的项目，不同的研究者使用了相同的数据集，从而可以更加方便地将结果进行对比，从而验证出哪种设计的程序识别率更高。
MNIST是一个简单的计算机视觉数据集。它由图5-1所示的手写数字的图像组成。

《人工智能基础与应用》5-MNIST数据集及神经网络

失函数也是一种常见的损失函数
5.2.3 损失函数
第5章 MNIST数据集及神经网络
15
4．交叉熵
如何判断输出的结果与期望结果有多接近呢？交叉熵（Cross Entropy）是常用的方法之一。
p( x)log q( x) ，是分类问题的真实分布概率，是分类问题的预测
交叉熵的公式为 H ( p, q)
1．LeNet-5实现的过程
（1）输入层。
（2）卷积层（第一层）。
（3）池化层（第二层）。
（4）卷积层（第三层）。
（5）池化层（第四层）。
（6）全连接层（第五层）。
（7）全连接层（第六层）。
（8）全连接层，输出层（第七层）。
第5章 MNIST数据集及神经网络
23
5.4.1 LeNet-5模型及其实现
（4）减弱正则化约束或者去掉正则化约束。
5.4.1 LeNet-5模型及其实现
第5章 MNIST数据集及神经网络
25
3．过拟合
过拟合是指模型在训练集上表现很好，但在验证和测试阶段效果比较差，即模型的泛化能力很
差。过拟合的解决方法如下。
（1）增加训练数据量。
（2）减少数据特征，去掉数据中非共性的特征。
第5章 MNIST数据集及神经网络
第5章
MNIST数据集及神经网络
工业和信息化精品系列教材——人工智能技术
人工智能基础与应用（微课版）
人民邮电出版社
1
重点知识
A KEY
第5章 MNIST数据集及神经网络
MNIST数据集简介
神经元常用函数
深度神经网络
经典卷积神经网络介绍
循环神经网络
优化器及优化方法

分类问题和数据集介绍

分类问题和数据集介绍
分类问题是一种常见的机器学习任务，它要求算法根据已有的标签数据来预测新数据的标签。

分类问题广泛应用于图像识别、自然语言处理、医疗诊断等领域。

在机器学习中，我们通常使用数据集来进行模型的训练和测试。

数据集是由已知标签的数据组成的集合，这些数据可以是图像、文本、音频等不同类型的数据。

分类问题的数据集通常由正例和负例组成，正例是指带有标签的数据，而负例则是指没有标签的数据。

在分类问题的训练过程中，机器学习算法会学习从输入特征到标签的映射关系，从而能够对新的数据进行分类。

下面介绍几个常用的分类问题数据集：
1. MNIST手写数字数据集：该数据集由美国国家标准与技术研究院（NIST）收集，包含了大量的手写数字图片和对应的标签。

这些图片的大小为28x28像素，每个像素的值在0-255之间。

该数据集的标签包括了0-9之间的数字，是分类问题中非常经典的数据集之一。

2. CIFAR-10数据集：该数据集由加拿大高等研究院（CIFAR）收集，包含了10个类别的60000张32x32像素的彩色图片和对应的标签。

这些图片涵盖了飞机、汽车、鸟类等10个不同类别的对象。

该数据集的标签包括了每个图片所属的类别，是图像分类问题中常用的大型数据集之一。

3. IMDB电影评论数据集：该数据集由美国加州大学伯克利分校收集，包含了大量电影评论文章和对应的标签。

这些文章是由影评人撰写的关于电影的评论，每篇文章都有一个对应的情感标签（正面或负面）。

该数据集的标签包括了每个文章的情感极性，是文本分类问题中常用的大型数据集之一。

1。

pytorch例子

pytorch例子PyTorch是深度学习领域的一种流行框架，具有易用性和灵活性。

下面是一些PyTorch例子的介绍，这些例子可以帮助初学者快速入门，同时也可以帮助更有经验的用户了解PyTorch的一些高级功能。

1. MNIST手写数字识别MNIST是深度学习领域的经典数据集之一，该数据集包含60,000个训练样本和10,000个测试样本，每个样本都是28×28像素的灰度图像，表示0到9之间的一个数字。

这个例子使用PyTorch来训练一个能够正确识别手写数字的神经网络模型。

通过这个例子，可以学习如何使用PyTorch定义模型、加载数据、训练和测试模型等基本操作。

2. CIFAR-10图像分类CIFAR-10是另一个常用的图像分类数据集，它包含10个类别的60,000个32×32的彩色图像。

这个例子使用PyTorch来训练一个能够正确分类CIFAR-10图像的卷积神经网络（CNN）。

通过这个例子，可以学习如何使用PyTorch构建CNN、使用数据增强技术来提高模型的泛化能力等。

3. 神经风格迁移神经风格迁移是一种有趣的应用，它可以将一张图像的“风格”（例如一幅著名画家的画作）应用到另一张图像上。

这个例子使用PyTorch实现了一种基于神经网络的风格迁移算法。

通过这个例子，可以学习如何使用PyTorch来定义和训练一个神经网络，以及如何将该网络应用于图像处理任务。

4. 情感分析情感分析是一种文本分类任务，它旨在确定一段文本的情感极性（例如正面、负面或中性）。

这个例子使用PyTorch来训练一个情感分析模型，该模型可以将IMDb电影评论分类为正面或负面。

通过这个例子，可以学习如何使用PyTorch来处理文本数据、使用词嵌入技术来表示单词、定义和训练一个循环神经网络（RNN）等。

5. GAN生成对抗网络生成对抗网络（GAN）是一种无监督学习算法，它可以生成与原始数据类似的新数据。

这个例子使用PyTorch来实现一种基于GAN 的图像生成算法，该算法可以生成与给定数据集类似的图像。

knn手写数字识别训练集

knn手写数字识别训练集
1. MNIST 数据集：MNIST 是一个广泛使用的手写数字识别数据集，包含大量的手写数字图像和对应的标签。

它由 0 到 9 的数字组成，每个数字有数千个样本。

MNIST 数据集容易获取，并且常被用于 KNN 算法的基准测试。

2. EMNIST 数据集：EMNIST 是 MNIST 数据集的扩展版本，包含更多的手写数字图像，包括小写字母和大写字母。

它提供了更多的训练数据和更具挑战性的测试集。

3. USPS 数据集：USPS 是一个较小的手写数字识别数据集，包含大约 9000 个样本。

它包含了不同手写风格和字体的数字图像。

你可以从相关的机器学习库或数据集网站下载这些数据集，并将其用于 KNN 算法的训练。

在训练过程中，你可以使用 KNN 算法来计算测试样本与训练集中的最近邻样本的距离，并根据最近邻样本的标签来预测测试样本的标签。

请注意，在使用 KNN 算法进行手写数字识别时，选择合适的 K 值是很重要的。

K 值的选择会影响算法的准确性和泛化能力。

通常，你需要通过交叉验证等技术来找到最优的 K 值。

此外，你还可以考虑对数据进行预处理和特征提取，以提高 KNN 算法的性能。

例如，归一化图像的大小、灰度值或进行特征提取等操作。

希望这些信息对你有所帮助！如果你有任何进一步的问题，请随时提问。

测试模型能力的各种评测标准数据集

测试模型能力的各种评测标准数据集在测试模型能力的过程中，使用评测标准数据集是一种常用的方法。

评测标准数据集是开发人员和研究人员用来评估和比较不同模型性能的数据集。

这些数据集在各个领域中被广泛应用，例如自然语言处理、计算机视觉、语音识别等。

在下面的文章中，我将介绍几个著名的评测标准数据集，并解释它们如何帮助测试模型的能力。

1. MNIST手写数字数据集MNIST是一个经典的数据集，包含了大量的手写数字图像。

每个图像都是一个28x28像素的灰度图像，分为0到9十个不同的类别。

这个数据集被广泛用于测试图像识别和分类算法的能力。

由于MNIST数据集相对较小且比较简单，它被用作验证新的机器学习算法和模型的基准。

2. COCO图像标注数据集COCO（Common Objects in Context）是一个用于图像理解和分割的大型数据集。

它包含超过20万个图像，并标注了超过80个不同类别的物体。

此外，每个图像都有详细的语义标注，如物体边界框和实例级语义分割。

这个数据集广泛应用于计算机视觉任务的评估，如目标检测、图像分割和图像生成等。

3. IMDb电影评论数据集IMDb电影评论数据集提供了数万条电影评论文本，其中一半是积极的评论，另一半是消极的评论。

这个数据集被广泛用于情感分析任务，旨在测试模型对文本情感的识别能力。

研究人员经常使用这个数据集来训练和评估情感分析模型的性能。

4. Penn Treebank数据集Penn Treebank是一个用于自然语言处理任务的语料库。

该语料库包含了大量的新闻文章和其他类型的文本，如广告和论文等。

这个数据集主要用于基于规则的句法分析和语言建模任务的评估。

通过测试模型在这个数据集上的性能，可以评估其对句法结构和语言规则的理解能力。

5. LibriSpeech语音识别数据集LibriSpeech是一个用于语音识别任务的大规模语音数据集。

这个数据集包含来自数千位演讲者的音频片段，并且这些片段涵盖了不同的语言和口音。

详解MNIST数据集

详解MNIST数据集MNIST 数据集已经是⼀个被”嚼烂”了的数据集, 很多教程都会对它”下⼿”, ⼏乎成为⼀个 “典范”. 不过有些⼈可能对它还不是很了解, 下⾯来介绍⼀下.Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000 个样本)Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签)MNIST 数据集来⾃美国国家标准与技术研究所, National Institute of Standards and Technology (NIST). 训练集 (training set) 由来⾃ 250 个不同⼈⼿写的数字构成, 其中 50% 是⾼中学⽣, 50% 来⾃⼈⼝普查局 (the Census Bureau) 的⼯作⼈员. 测试集(test set) 也是同样⽐例的⼿写数字数据.不妨新建⼀个⽂件夹 – mnist, 将数据集下载到 mnist 以后, 解压即可:图⽚是以字节的形式进⾏存储, 我们需要把它们读取到 NumPy array 中, 以便训练和测试算法.import osimport structimport numpy as npdef load_mnist(path, kind='train'):"""Load MNIST data from `path`"""labels_path = os.path.join(path,'%s-labels-idx1-ubyte'% kind)images_path = os.path.join(path,'%s-images-idx3-ubyte'% kind)with open(labels_path, 'rb') as lbpath:magic, n = struct.unpack('>II',lbpath.read(8))labels = np.fromfile(lbpath,dtype=np.uint8)with open(images_path, 'rb') as imgpath:magic, num, rows, cols = struct.unpack('>IIII',imgpath.read(16))images = np.fromfile(imgpath,dtype=np.uint8).reshape(len(labels), 784)return images, labelsload_mnist函数返回两个数组, 第⼀个是⼀个 n x m 维的 NumPy array(images), 这⾥的 n 是样本数(⾏数), m 是特征数(列数). 训练数据集包含60,000 个样本, 测试数据集包含 10,000 样本. 在 MNIST 数据集中的每张图⽚由 28 x 28 个像素点构成, 每个像素点⽤⼀个灰度值表⽰. 在这⾥, 我们将 28 x 28 的像素展开为⼀个⼀维的⾏向量, 这些⾏向量就是图⽚数组⾥的⾏(每⾏ 784 个值, 或者说每⾏就是代表了⼀张图⽚). load_mnist函数返回的第⼆个数组(labels) 包含了相应的⽬标变量, 也就是⼿写数字的类标签(整数 0-9).第⼀次见的话, 可能会觉得我们读取图⽚的⽅式有点奇怪:magic, n = struct.unpack('>II', lbpath.read(8))labels = np.fromfile(lbpath, dtype=np.uint8)为了理解这两⾏代码, 我们先来看⼀下 MNIST ⽹站上对数据集的介绍:TRAINING SET LABEL FILE (train-labels-idx1-ubyte):[offset] [type] [value] [description]0000 32 bit integer 0x00000801(2049) magic number (MSB first)0004 32 bit integer 60000 number of items0008 unsigned byte ?? label0009 unsigned byte ?? label........xxxx unsigned byte ?? labelThe labels values are 0 to 9.通过使⽤上⾯两⾏代码, 我们⾸先读⼊ magic number, 它是⼀个⽂件协议的描述, 也是在我们调⽤fromfile⽅法将字节读⼊ NumPy array 之前在⽂件缓冲中的 item 数(n). 作为参数值传⼊struct.unpack的>II有两个部分:>: 这是指⼤端(⽤来定义字节是如何存储的); 如果你还不知道什么是⼤端和⼩端, 是⼀个⾮常好的解释. (关于⼤⼩端, 更多内容可见<<深⼊理解计算机系统 – 2.1 节信息存储>>)I: 这是指⼀个⽆符号整数.通过执⾏下⾯的代码, 我们将会从刚刚解压 MNIST 数据集后的 mnist ⽬录下加载 60,000 个训练样本和 10,000 个测试样本.为了了解 MNIST 中的图⽚看起来到底是个啥, 让我们来对它们进⾏可视化处理. 从 feature matrix 中将 784-像素值的向量 reshape 为之前的28*28 的形状, 然后通过 matplotlib 的imshow函数进⾏绘制:import matplotlib.pyplot as pltfig, ax = plt.subplots(nrows=2,ncols=5,sharex=True,sharey=True, )ax = ax.flatten()for i in range(10):img = X_train[y_train == i][0].reshape(28, 28)ax[i].imshow(img, cmap='Greys', interpolation='nearest')ax[0].set_xticks([])ax[0].set_yticks([])plt.tight_layout()plt.show()我们现在应该可以看到⼀个 2*5 的图⽚, ⾥⾯分别是 0-9 单个数字的图⽚.此外, 我们还可以绘制某⼀数字的多个样本图⽚, 来看⼀下这些⼿写样本到底有多不同:fig, ax = plt.subplots(nrows=5,ncols=5,sharex=True,sharey=True, )ax = ax.flatten()for i in range(25):img = X_train[y_train == 7][i].reshape(28, 28)ax[i].imshow(img, cmap='Greys', interpolation='nearest')ax[0].set_xticks([])ax[0].set_yticks([])plt.tight_layout()plt.show()执⾏上⾯的代码后, 我们应该看到数字 7 的 25 个不同形态:另外, 我们也可以选择将 MNIST 图⽚数据和标签保存为 CSV ⽂件, 这样就可以在不⽀持特殊的字节格式的程序中打开数据集. 但是, 有⼀点要说明, CSV 的⽂件格式将会占⽤更多的磁盘空间, 如下所⽰:train_img.csv: 109.5 MBtrain_labels.csv: 120 KBtest_img.csv: 18.3 MBtest_labels: 20 KB如果我们打算保存这些 CSV ⽂件, 在将 MNIST 数据集加载⼊ NumPy array 以后, 我们应该执⾏下列代码:np.savetxt('train_img.csv', X_train,fmt='%i', delimiter=',')np.savetxt('train_labels.csv', y_train,fmt='%i', delimiter=',')np.savetxt('test_img.csv', X_test,fmt='%i', delimiter=',')np.savetxt('test_labels.csv', y_test,fmt='%i', delimiter=',')⼀旦将数据集保存为 CSV ⽂件, 我们也可以⽤ NumPy 的genfromtxt函数重新将它们加载⼊程序中:X_train = np.genfromtxt('train_img.csv',dtype=int, delimiter=',')y_train = np.genfromtxt('train_labels.csv',dtype=int, delimiter=',')X_test = np.genfromtxt('test_img.csv',dtype=int, delimiter=',')y_test = np.genfromtxt('test_labels.csv',dtype=int, delimiter=',')不过, 从 CSV ⽂件中加载 MNIST 数据将会显著发给更长的时间, 因此如果可能的话, 还是建议你维持数据集原有的字节格式.。

人工智能开发技术中的常用数据集介绍

人工智能开发技术中的常用数据集介绍随着人工智能技术的不断发展，数据集作为训练和验证模型的重要工具，扮演着不可或缺的角色。

在人工智能开发中，使用经典的数据集可以帮助开发者更好地理解和掌握相关算法，并为实际应用提供有力支撑。

本文将介绍几个常见的人工智能开发中使用的数据集。

1. MNIST手写数字集MNIST是一个手写数字图片数据集，由60,000个训练样本和10,000个测试样本组成。

每个样本是一个28x28像素的灰度图像，代表了一个0到9之间的手写数字。

这个数据集被广泛应用于图像分类和数字识别任务中。

研究者们往往会使用MNIST数据集来验证和比较不同算法的性能。

2. ImageNet图像分类数据集ImageNet图像分类数据集是一个庞大的视觉对象识别数据库，拥有超过一百万张标记图像。

这个数据集覆盖了大量不同类别的物体，从动物到自然场景，从日常物品到人物等。

ImageNet数据集的建立极大地推动了图像分类和目标识别的发展，并为深度学习算法的突破提供了坚实的基础。

3. CIFAR-10图像分类数据集CIFAR-10是一个由60,000张32x32彩色图像组成的数据集，其中有10个不同的类别。

这个数据集包含了各种真实世界的物体，例如飞机、汽车、猫、狗等。

CIFAR-10数据集常用于图像分类和目标识别的训练和测试，让开发者能够快速验证他们的算法在现实场景中的表现。

4. COCO物体检测与分割数据集COCO是一个广泛应用于物体检测、分割和关键点检测等任务的数据集。

它包含了超过328,000张标记图像，覆盖91个不同的物体类别。

COCO数据集的特点是图像具有较高的复杂性，包含了多个物体以及物体的遮挡和部分可见情况。

这个数据集的使用对于测试算法的鲁棒性以及在复杂场景中的表现非常有帮助。

5. Reuters新闻语料库Reuters新闻语料库是一个常用的文本分类和文本挖掘的数据集。

它包含了来自Reuters新闻社的11,228条新闻文本，覆盖了90个不同的主题类别，如金融、体育、政治等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

5.3：softmax回归模型简介
将等号右边的式子展开，可得到判定为第i类的概率：
因此，可以将输入值作为幂指数来进行求值运算，然后，再将这些结果值进行一定程度的正则化。
5.3：softmax回归模型简介
将softmax回归模型整个计算过程进行可视化，如图5-8所示。
5.3：softmax回归模型简介
对于输入的xs进行加权求和，再分别对其加上一个偏置项，最后再输入至softmax函数中，将上述内容的连线部分变为公式，可得出如图5-9所示的内容。
5.3：softmax回归模型简介
另外，还可将整个计算过程使用向量的方式来进行表示，即将元素相乘变为用矩阵乘法和向量相加。这样做既是一种有效的思考方式，也有助于提高计算效率，如图所示。
片。 t10k-labels-idx1-ubyte.gz: 测试集图片对应的数字标签。
1：数据的准备
➢ 通过Python源代码可以进行数据集的自动下载和安装，然后使用下列程序代码内容将之导入到项目里面，代码如下所示。
1：数据的准备
➢ 接下来继续通过代码的具体内容来分析MNIST内容，代码如下所示。
➢ MNIST数据集官方网站上下载以下四种数据文件作为训练集与测试集：
Train-images-idx3-ubyte.gz: 训练集图片 55000张训练图片和5000张验证图片。
Train-labels-idx1-ubyte.gz: 训练集图片对应的数字标签。 t10k-images-idx3-ubyte.gz: 测试集图片-10000张测试图
2：数据重构
数据集中的灰度图片是28*28像素图片，它们的尺寸是784，即训练数据集内的每张图片都是由一个784维度的向量来表示的，训练集输出的张量格式是[55000,784]。
数字标签数据被解压为一维的张量：[image index]，它定义了每个样本数值的类别分类。即训练集的标签的数据规模是 [55000]。 ➢
3：MNIST数据集组成
MNIST数据单元分为两个部分： ➢ 一张包含手写数字的图片 ➢ 一个对应的标签我们把图片设为“xs”，把这些标签设为“ys”。训练数据集和测试数据集都含有xs和ys，可以将训练数据集的图片名称设定为mnist.train.images，将训练数据集的标签设定为 bels。
2：MNIST数据集功能
数据集有两个功能：（1）提供了大量的数据作为训练集和测试集，为
一些兴趣爱好者和学习者提供了丰富的资源信息。（2）形成一个业界领域具有一定对比程度的项目，不同的研究者使用了相同的数据集，从而可以更加方便地将结果进行对比，从而验证出哪种设计的程序识别率更高。
MNIST是一个简单的计算机视觉数据集。它由图5-1所示的手写数字的图像组成。
5.2：MNIST数据下载
1 数据的准备 2 数据重构 3 数据集对象
1：数据的准备
下载MNIST数据集，需要到它的官方网站进行下载，如图5-5 所示：
图5-5
1：数据的准备
MNIST数据集是一个完全公开的数据集，任何的算法都可以拿来并应用 MNIST数据集进行测试，如图5-6所示。
图5-6
1：数据的准备
5.3：softmax回归模型简介
softmax回归应用通常要先对图片像素值进行加权求和，从而得到一
张给定图片属于某个特定数字类的证据（evidence）。如果这个像素能够有证据来证明这张图片不属于该类别，相应的权值就会用负数来进行标注；反之，如果这个像素拥有足够的证据来证明这张图片属于这个类别，那么相应的权值就会用正数来进行标注。
1：MNIST数据集的概念
➢ 手写数字的MNIST数据集
手写数字的MNIST数据集来自于美国国家标准与技术研究所（NIST），它是一个庞大的手写数字数据库，也是网上著名的公开数据集之一。
包含了60,000个训练示例图片以及10,000个测试图片，数据集的图片分别代表了阿拉伯数字0～阿拉伯数字9中的任意一个数字，图片只包含灰度值信息，规格尺寸为28×28，所以每一张图片就是拥有784（28×28）列的数据，数字位于整张图片的最中央位置，它是NIST提供的更大集合的一个子集。
➢ 定义loss，指定优化器来优化loss，代码如下所示。
5.4：TensorFlow模型基本步骤
➢ 传入数据并进行迭代训练，代码如下所示。
➢ 使用测试集或者验证集对准确率进行评测，代码如下所示。
第五章：T机器学习
1. MNIST数据集简介 2. MNIST数据下载 3. softmax回归模型简介 4. TensorFlow模型基本步骤 5. 构建softmax回归模型
3：MNIST数据集组成
每一张图片包含28像素×28个像素点，可以用一个数字数组来表示这张图片，如图5-2所示。将这个数字数组展开成一个向量，长度是28×28 = 784。数字间的顺序不重要，只要保持各个图片采用相同的方式展开。
图5-2
3：MNIST数据集组成
➢ MNIST数据集的图片就是在784维向量空间里面的点，并且拥有比较复杂的结构。在MNIST训练数据集中， mnist.train.images是一个形状为[60000, 784]的张量，第一个维度数字用来索引图片，第二个维度数字用来索引每张图片中的像素点。在此张量里的每一个元素，都表示某张图片里的某个像素的强度值，值介于0和1之间，如图5-3所示：
图5-3
3：MNIST数据集组成
➢ MNIST数据集的标签bels是介于0到9的数字，用来描述给定的训练图片里所表示的数字。标签数据用“onehot vectors”的形式来表示，所谓的"one-hot"是指一位有效编码，即，我们使用n维度的向量来表示n个类别，这其中，每一个类别都会占据相对独立的一个位置，因此，一个one-hot 向量即为除了某一特定位置的数字是1以外，其余各维度数字都是0。数字n将表示成一个只有在第n维度（从0开始）数字为 1的10维向量。
将MNIST数据集从官方网站下载完毕，下载下来的数据集图片被分成两部分： ➢ 包含了60000张图片的训练数据集（mnist.train） ➢ 包含了10000张图片的测试数据集（mnist.test）其中，训练数据集用来提供给使用者进行模型的训练，以期训练出合适的模型；测试数据集用来提供给使用者对前一个阶段训练出的模型进行性能上的测试，在机器学习模型设计阶段，必须要设置一个单独的测试数据集用来评估模型的性能，这个测试数据集不用于训练。
1：数据的准备
➢ 最后通过下列代码可以查看相关数据集信息，代码如下所示。
2：数据重构
MNIST数据集中的四种数据文件没有使用标准的图片格式储存，需要使用extract_images()和extract_labels()函数进行手动解压。
图片数据会被解压成二维的张量：[image index, pixel index]，其中每一项表示图片中特定像素的强度值，范围从0～ 255缩放到到-0.5～0.5。其中image index代表数据集中图片的编号，从0到数据集的上限数值。pixel index代表图片中像素点的个数，从0到图片的像素上限数值。以train-开头的文件中包含60000个样本，其中55000个样本作为训练集，5000个作为验证集。
第五章：MNIST机器学习
1. MNIST数据集简介 2. MNIST数据下载 3. softmax回归模型简介 4. TensorFlow模型基本步骤 5. 构建softmax回归模型
5.4：TensorFlow模型基本步骤
使用TensorFlow实现简单的机器学习算法softmax回归，基本步骤分为以下四个部分。 ➢ 定义算法模型，代码如下所示。
3：数据集对象
底层的源代码将会执行下载、解压、重构图片和标签数据来组成以下三种数据集对象。
l data_sets.train：55000组图片和标签，用于训练。 l data_sets.validation：5000组图片和标签，用于迭代验证训练的准确性。 l data_sets.test：10000组图片和标签，用于最终测试训练的准确性。执行read_data_sets()函数将会返回一个DataSet实例，其中包含了上述的三种数据集。函数DataSet.next_batch()用于获取以batch_size 为大小的一个包含了图片和标签的元祖，该元祖会被用于当前的 TensorFlow运算Session中代码如下所示。 images_feed, labels_feed = data_set.next_batch(FLAGS.batch_size)
第五章：MNIST机器学习
1. MNIST数据集简介 2. MNIST数据下载 3. softmax回归模型简介 4. 模型的训练与评估 5. TensorFlow模型基本步骤 6. 构建softmax回归模型
5.3：softmax回归模型简介
softmax回归模型是一个线性的多类分类模型，用来给不同的图片对象分配概率。 softmax回归应用通常要先对图片像素值进行加权求和，从而得到一张给定图片属于某个特定数字类的证据（evidence）。如果这个像素能够有证据来证明这张图片不属于该类别，相应的权值就会用负数来进行标注；反之，如果这个像素拥有足够的证据来证明这张图片属于这个类别，那么相应的权值就会用正数来进行标注。
3：MNIST数据集组成
因此，bels是一个[60000, 10]的10维度数字矩阵，如图5-4所示。
图5-4
第五章：MNIST机器学习
1. MNIST数据集简介 2. MNIST数据下载 3. softmax回归模型简介 4. 模型的训练与评估 5. TensorFlow模型基本步骤 6. 构建softmax回归模型
如图5-7所示的图片显示了一个模型学习到的图片上每个像素对于特定数字类的权值。红色代表的权值为负数，蓝色代表的权值为正数。

5.MNIST数据集简介

合集下载

MNIST数据集介绍

MNIST数据集介绍

第5章：MNIST数据集简介

《人工智能基础与应用》5-MNIST数据集及神经网络

分类问题和数据集介绍

pytorch例子

knn手写数字识别训练集

测试模型能力的各种评测标准数据集

详解MNIST数据集

人工智能开发技术中的常用数据集介绍

文档推荐

最新文档