human select
定义:在二分类场景中,选中是一类,不选是一类。(人工标注)
图片属性标注也可以处理,但是效果不好
human select
定义:在二分类场景中,选中是一类,不选是一类。(人工标注)
图片属性标注也可以处理,但是效果不好
再多分类检测标注时,尤其是有预标注的情况下,框不会默认为预标注的属性,还需要手动从新再选择一遍;并且不同属性的框颜色还是一样的,图中目标比较多的情况,分不清哪个框对应的哪个属性建议有预标信息的情况下属性默认未预标属性(这块用户可选择,例如保留属性、不保留属性),不同属性的标注框更换不同的颜色
多分类检测,框颜色都一样,框属性也显示
功能和我想象的完全不一样,首先必须有预标注,对预标注框抠图标分类,这功能不像是标注检测数据的,而修复检测数据的;并且只能修复错标注,不能修复漏标注建议该功能不要放在这里,误区会比较大;或者明细出功能用途,避免误导用户自动填充的属性名称和我原始名称不一致,多了个前缀,看起来是平台对名称有统一格式要求
功能更完善,漏框,属性错误,属性前缀去掉
标注进度这个选择有点鸡肋,创建完后不能直接标,要先将【待开始】换成【进行中】才能开始标注
多人协同,把自己默认+上,点开始,把进行中自动变开始 标注过程中加人
创建好的标注任务新增类别找不着地方,该功能藏的过于隐蔽、不醒目
明显一点
有预标注的情况下,当前标注页面想舍弃不想保留的数据,需要创建一个删除的类别,给图片选上该类别,后续该类别删除;无预标注的情况下,这个可以实现的,想舍弃的数据没有属性,后续删除无类别数据
负样本:跳过 不要的:舍弃
去除预标注的属性点跳过生成的数据集,该图片保留原始标注属性
舍弃,单独输出一个路径
标注页面上没有link到生成数据集的链接,寻找标注后数据集繁琐(默认在原始数据集下创建标后的数据集版本)
可以考虑
创建任务时,如果数据全部都有预标注,且属性配置不打开重新标注,提示无数据标注;
已经标注的应该拦截
标注检测任务时,尤其是小目标,需要对图片进行缩放,当前平台的图片缩放体验不佳
可以考虑后面调整
标注方式选择手动标注,就一张一张标,这个是不是放快速标注&多人协作里面比较好
有道理的
分类标注图片默认会resize图片变形,变形的图没原图好标,想显示原尺寸还得手动调
是个问题,可以调整
OCR标注信息框会挡住图片,需要手动挪开弹窗看图片文字信息
听起来不是很好判断?文字可能出现在任何地方,可以考虑放在右下角
该功能有没有撤回功能,例如某一下点错了,想撤回,回到上一个点位置从新标注,否则就得全部从新点一圈
可以考虑,但是目前可以点击结束后再调整
建议仅读取对应的任务类型属性,检测读检测的、分类读分类的
可以考虑
在创建标注任务时类别管理设置必须填一个值才能创建,但有预标数据包含全部类别,创建后原始类别也会带过来,此时操作冗余
是个问题,要调整
当前标注页面无法舍弃不想保留的数据,例如标注遇到花屏、不符合目标场景的数据
考虑添加
数据标注了部分想提前结束,已标注和未标注区分不开
可以考虑添加
预标注信息不能为框的默认类别
是个问题
命名
前三行第一列的中英文
便于用户快速区分、查找、了解数据集内容是什么,当前由平台自动生成的一个名称例如:dataprocessing20250514hHUlM6
可以考虑支持,考虑把模型整条逻辑串起来
日常工作中需要对检测目标大小进行过滤,如剔除30*30以下的目标大小
有框后去除
日常工作中需要对原始数据集进行BMK和Training的划分,需要支持按文本信息划分(可能原始数据集自带,也可能数据清洗标注后有tag),及设置划分比例
自带的标记,按比例,数据清洗的标记 数据处理和数据集管理逻辑明确
数据质检功能优化:当前该功能去重比较麻烦,因为不知道会去掉多少,可能默认0.8阈值去重不符合预期需要来回调,前面的参数、抽帧都需要重跑;能否改进为类似模型测评页面,我输入一个阈值,看一下剩下的图片数量、重复度,找到满意的去重阈值后导出该阈值的数据。和inpectdet去重工具的去重流程差不多。
固定输出,预览
自定义保留数据量
固定输出多少张图,相似度阈值可控,其他质检可控?
RGB转换IR图像:某些功能只在IR成像下布控,制造IR数据补充去除画面异常数据:删除花屏、成像异常数据
可以考虑,有要保留的,又要去掉的,都支持
可能会需要维护剔除的ir数据,以及看一下数据质检去重的效果,进行调整剔除的ir数据需要给个预览页,需要支持数据留存质检过滤掉的数据需要给个预览页,需要支持数据留存本批上传数据差异性较大,应不涉及重复性,也被去掉了4张,不知道去重逻辑是什么另,数据质检原理是什么,是仅包含去重逻辑么?
ir去除逻辑 https://wiki.megvii-inc.com/pages/viewpage.action?pageId=473157818 质检-这个已经有展示的了 对图片本身的质检,将检测纯色、重复、相似、模糊、质量较差等问题图片<br /> 逻辑分开 datamaster的快速质检模式 和数据集管理的预览类似
抠框失败,失败原因:数据中无文本信息,请检查原数据集,这里的文本信息指的什么?其次我本身上传的纯图片,无文本内容,这个选项应该不开放
再确认一下,考虑下掉
内置模型只要人脸人体模型,可能需要开放更多的内置模型丰富该功能的使用场景常规数据处理还需包含:人头、人机非、人体骨骼点、PB、属性、花屏上述内置模型需要可多选,需要有顺序关系,需要可设置参数
可以安排,然后看是否高频,后面确认优先级
平台支持的视频格式比较少(当前只支持mp4 .avi ),在日常使用经常遇到264、265裸流和ts格式视频
可以考虑
客服回复:该视频经过IR处理后剩余的图片为0,所以导致该错误;视频为RGB成像,全被IR过滤掉了,平台bug【剔除IR数据】不能开启,更换开启【数据质检】阈值0.8,两种抽帧间隔均剩1张图片【数据质检】推荐更多阈值,例如画面变动比较小的给一个阈值阈值;或者视频处理时取消【数据质检】功能,该功能本身和抽帧间隔互斥,用户想获取更多数据,调高抽帧数量,后者又会去重掉了
解了bug应该就可以了,不过抽帧也可以考虑单独算作一个数据处理
报错提示不直观如下图,都需要由工程老师看日志来解决问题,判断是参数设置不对、重名、还是平台bug等
可以考虑,要和技术老师一起对一下,明确报错类型
后端开发完接口才给出接口文档,合理吗?
程序员喜欢什么样的需求文档?
购物车界面的业务逻辑拆分成了两部分: 接口部分:Cart 和 CalculateCart 是接口。变动相对来说不频繁。 实现部分:具体的 calcXszkPromotion,calcMemberPromotion 这些界面渲染方法
利用依赖倒置,我们可以把 CalculateCart 定义在依赖关系的底层,由限时折扣,会员优惠这些 Git 仓库去做接口实现。
运营位是指给界面上留下固定的位置给运营来配置
运营位,是指给界面上留下固定的位置,给运营来配置。
把一个界面做成数据驱动的,哪些地方留了多大槽,可以配置什么东西。 营销玩法是无穷的,策略是天天变的,但营销位是相对来说变化不那么频繁的。
服务端数据集成的方式
服务端数据集成的方式。 数据集成可以实现任意复杂的需求,是对需求形态限制最小的集成方式。
这一类需求和离散型 UI 不同。界面上没有明显的大区块。
混合型 UI, 离散型 UI。
购物车是典型的混合型 UI。没有哪个 Git 仓库,可以声称对界面上的某个区块负责。
会员价和限时特价,都想给商品打上自己的标。但是实际算价格的时候,得看哪种优惠算得的价格更低。
在这种比较恶心的复杂需求下,如何最大化 autonomy 呢?
而食品和药品是国计民生大宗重要物资,相应的包装需求十分旺盛。
食品和药品是国计民生大宗重要物资。 由此而附带衍生的需求,如包装需求,十分旺盛。