AI开放平台可以训练算法实现不同场景的个性化智能需求,但算法训练也需要数据,所以为了更好地保证AI算法的应用效果,AI开放平台训练模型对采集的素材也有一定的要求,下面一起跟着小编来了解下吧!
1、同源性要求
场景同源:训练素材需要实际使用场景下采集的素材。
成像同源:训练素材的成像方式需要和实际使用场景的方式同源,如拍摄设备、图像宽高比致,所以需使用实际点位相机拍摄的图片,不能使用网上图片或者手机拍摄照片。
2、丰富性要求
目标形态,尺寸、颜色、遮挡、角度多样,且包含不同的时间、地点,覆盖真实应用场景。
形态:如果同个目标有不同形态,例如小区内常见垃圾桶有多种样式(固定式、移动式、翻盖式;红色、蓝色灯),每种样式的素材都建议收集。
尺寸(角度):如果在不同画面中大小、角度不同,目标样式也会有差异,则建议收集不同大角度(或画面不同位置)的素材。
3、像素要求
图像分类:需分析特征或对象比例,每个标签下图片数大于40张。
物体检测:每个标签下已标注图片数大于40张。
图像比对:1个≤场景集≤200个,每个场景集下背景图片数>40张,每个场景集下已标注前景图片数>40张。
检索对比:每个标签下目标数>5个,已标注图片总数>40张。
视频分类:每个标签下最少需要300个视频,每个视频包含一个完整事件,时长1.5s-15s。
视频事件分析:最少包含300起目标事件,每个事件时长1.5s-15s。
以上是AI开放平台数据训练素材如何采集的介绍,数据作为深度学习的三要素之一,通过规范化采集的标准图片,算法才能更好的被训练,实际应用的效果也会更好,希望可以帮助到大家更好的应用AI开放平台,继续关注慧翼科技也可了解AI开放平台的算法训练及应用等更多资讯。