收藏   订阅   蔚来影讯
你现在的位置:首页 » 业余爱好 » 正文

tensorflow 切割数据集为两部分

时间:2019年09月15日 20:54:59 | 作者 :老马 | 分类 : 业余爱好 | 浏览:703 | 评论:0

数据集切割splitting成为trainset 和 testset
如果在traintest上表现很好,但是当模型使用testset数据集进行验证的时候表现很糟糕,则就是过度拟合。
(x,y),(x_val,y_val)=tf.keras.layers.datasets.mnist.load_data()
db = tf.data.Dataset.from_tensor_slices((x,y))
db = db.map(preprocess).shuffle(6000).batch(batchsz)
注意:preprocess是事先写好的一个转化数据类型的函数。
db_val = tf.data.Dataset.from_tensor_slices((x_val,y_val))
db_val  = db_val.map(preproces).abtch(batchsz)
以上使用了map和shuffle函数对数据做预处理成为需要的 批量 数据。

在实际运用中如果准备好的数据集合默认分了两种 训练集合和 测试集合,需要自定义 验证集合
则可以将训练集合切割为训练集合和验证集合。方法如下:
x,y),(x_test,y_test)=tf.keras.layers.datasets.mnist.load_data()
x_trian,x_val = tf.split(x,num_or_size_splits=[50000,10000])
y_train,y_val = tf.split(y,num_or_size_splits=[50000,10000])
然后重复上面的数据预处理流程即可。

上一篇:tensorflow 线性回归推导 下一篇: tensorflow算法:手写数字识别练习题
本站致力于揭露全国影视投资诈骗案件 避免更多老百姓受骗上当
经历分享 请投稿

网络世界,不加微信QQ手机,留言沟通

发表评论

必填

回复后邮件通知

客服会联系您

◎欢迎参与讨论,聆听心声,下滑更多影视投资诈骗相关内容。

相关文章

栏目
文章归档
标签列表