data = input_data.read_data_sets('../mnist/data_set') x, y = data.train.next_batch(200) for i, (arr, label) inenumerate(zip(x, y)): print(i, label) gen_image(arr, i, label)
这样,就得到了200张 28*28的图片供下一步制作训练集。
制作npy格式的数据集
numpy能够将矩阵保存为文件,也能从文件中读取矩阵,因此可以考虑使用numpy制作数据集。
1 2 3 4
import os import numpy as np from PIL import Image from sklearn.model_selection import train_test_split
1. 图片转为矩阵并保存
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x, y = [], []
for i, image_path inenumerate(os.listdir('./images')): label = int(image_path.split('_')[0]) label_one_hot = [0if i != label else1for i inrange(10)] y.append(label_one_hot)
import os import h5py import numpy as np from PIL import Image from sklearn.model_selection import train_test_split
1. 图片转为矩阵并保存
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
x, y = [], []
for i, image_path inenumerate(os.listdir('./images')): label = int(image_path.split('_')[0]) label_one_hot = [0if i != label else1for i inrange(10)] y.append(label_one_hot)
data = input_data.read_data_sets('../mnist/data_set') x, y = data.train.next_batch(200) for i, (arr, label) inenumerate(zip(x, y)): print(i, label) gen_image(arr, i, label)
这样,就得到了200张 28*28的图片供下一步制作训练集。
制作npy格式的数据集
numpy能够将矩阵保存为文件,也能从文件中读取矩阵,因此可以考虑使用numpy制作数据集。
1 2 3 4
import os import numpy as np from PIL import Image from sklearn.model_selection import train_test_split
1. 图片转为矩阵并保存
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x, y = [], []
for i, image_path inenumerate(os.listdir('./images')): label = int(image_path.split('_')[0]) label_one_hot = [0if i != label else1for i inrange(10)] y.append(label_one_hot)
import os import h5py import numpy as np from PIL import Image from sklearn.model_selection import train_test_split
1. 图片转为矩阵并保存
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
x, y = [], []
for i, image_path inenumerate(os.listdir('./images')): label = int(image_path.split('_')[0]) label_one_hot = [0if i != label else1for i inrange(10)] y.append(label_one_hot)