一、EasyDL专业版介绍
EasyDL专业版适用于AI初學者及AI专业工程师支持一站式获取视觉及自然语言处理两大技术方向相关AI能力,系统内置基于百度海量数据训练的预训练模型及预置网絡可在少量训练数据上达到更优的训练效果。模型部署上可将模型灵活部署为公有云API、私有服务器部署、设备端SDK、软硬一体方案
二、EasyDL專业版分类模型的使用
下面讲一下EasyDL做图像分类的一些体会和参数设置:
-
因为是分类任务,对比了上面图片的2个模型实测结果是:在同样嘚参数配置下,百度超大规模数据集的Resnet50的比公开数据集的SE-Resnet50要更好一些可见模型性能是一方面,训练的数据也非常重要如果是迁移学习,还是要在超大规模数据集的模型基础上进行迁移
-
数据增强在模型训练中的作用是非常大的。成本比较低效果比较明显。比起修改模型完善模型细节,数据增强也更加容易实现
EasyDL有提供默认配置,手动配置和自动搜索三种数据增强的策略
手动配置和自动搜索是用户┅般选择的策略。如果对数据集有比较深入的研究和体会可以自己设置手动配置一般用户直接选择自动搜索即可。
自动搜索数据增强策畧会占用GPU时间百度会赠送EasyDL新用户100个小时的GPU训练时间。自动搜索会占用1个小时以上的GPU训练时间
可以先用自动搜索策略确定数据增强的参數。然后根据自动搜索的结果再进行手动配置不断尝试找到更理想的数据增强参数。当然这样比较消耗时间 -
mix-up是个选择项如果设置成true则啟用mix-up,设置成false则禁止mix-up一般会设置成true。也可以根据当前数据集进行对比测试确定是否启用mix-up
-
训练集、验证集和评测集
上传数据集以后,EasyDL会洎动划分训练集和验证集评测集需要单独上传。训练的结果受到了训练集和验证集的影响评测集是单独的数据集,可以更加客观的评價模型的训练结果如果是验证集更方面指标都比较好,但是评测集不理想则可能发生了过拟合 -
batch_size选择16,这个根据训练GPU的性能决定尽量選择大的数值。更大的batch_size会有更好的训练效果
-
如果采用了数据增强,一般会增加训练的epochs数据增强其实增加了数据集的数量,需要增加训練次数EasyDL的数据增强不会保存增加的数据集,是在训练的过程当中随机产生新数据
三、口罩识别的训练和实现
口罩识别可以用分类模型吔可以选择目标检测模型。目标检测除了给出分类结果还可以提供目标的位置信息如果是训练目标检测模型会更复杂一些,训练的时间┅般也会更长一些
口罩佩戴识别是比较基础的深度学习任务。分为戴口罩和不戴口罩
还可以同时检测口罩是否佩戴正确。正确戴口罩错误戴口罩和不戴口罩。错误戴口罩还分为戴口罩露鼻子、口罩上下戴反或者还有其他可以细化的分类。细化分类标签有利于模型训練可以观察每种分类的准确率,精确率和召回率等针对性的补充数据再次训练。
口罩识别使用YOLO-V3模型多一些