爱来自ZZULI❤drluo


原文链接:yolo和paddle模型常见输出参数解惑

此文为本人方便查找手动转存记录,请支持原作者。


yolo和paddle模型常见输出参数

第一种

  • Concatoutput_dim_0 :变量,表示预测目标的数量,
  • 7:表示每个目标的七个参数:batch_id,x0,y0,x1,y1,cls_id,score

第二种

  • 85:每一行85个数值,5个center_x,center_y, width, height,score ,80个标签类别得分
  • 25200:三个尺度上的预测框总和 ( 80∗80∗3 + 40∗40∗3 + 20∗20∗3 ),每个网格三个预测框,后续需要非极大值抑制NMS处理
  • 1:没有批量预测推理,即每次输入推理一张图片

第三种

  • num_dets:表示其批次中每个图像中的目标数
  • det_boxes:表示 topk(100) 目标的坐标信息 [x0,y0,x1,y1]
  • det_scores:表示每个 topk(100) 个对象的置信度分数
  • det_classes:表示每个 topk(100) 个对象的类别

第四种

第五种

第六种(paddlepaddle)

  • DynamicDimension :表示动态维度,一般是1
  • im_shape:图像经过resize后的大小,表示为H,W, DynamicDimension 表示batch维度
  • image:输入网络的图像,DynamicDimension 表示batch维度,如果输入图像大小为变长,则H,W为None
  • scale_factor:输入图像大小比真实图像大小,表示为scale_y, scale_x
  • multiclass_nms3_0.tmp_0:bbox, NMS的输出,形状为[N, 6], 其中N为预测框的个数,6为[class_id, score, x1, y1, x2, y2]
  • multiclass_nms3_0.tmp_2:bbox_num, 每张图片对应预测框的个数,例如batch_size为2,输出为[N1, N2], 表示第一张图包含N1个预测框,第二张图包含N2个预测框,并且预测框的总个数和NMS输出的第一维N相同