现在有某个软件需要在特定场景下的门禁系统进行识别照片来判断照片中人物的男女性别, 目前通过各种渠道和方法采集了 1 0w 张人脸图片。 那么( ) 是更为合理的。
采集的照片训练集用 7w 张,测试集3w张
全都用来训识别模型最好
采集的照片训练集用 7w 张,验证集1w张,测试集 2w 张
不需要训练啊,收集这么多数据是多余和浪费的