# f32
--reset

--dt=f32
--stag=ab --wtag=ab,ba --dtag=ab
--runtime_dims_masks=0,2:1,1:0,3:1
--bia-dt=undef,f32 --bia_mask=2

--attr-scales=
--attr-post-ops=
--batch=shapes_2d

--attr-scales=src:common:0.25+wei:common:0.5+dst:common:4
--attr-post-ops=sum
--batch=shapes_2d

--attr-scales=src:common:0.25+wei:per_oc+dst:common:4
--attr-post-ops=relu
--batch=shapes_2d

--stag=ba --wtag=ab,ba --dtag=ab
--runtime_dims_masks=3:1,3:3
--bia-dt=f32 --bia_mask=1,2,3
--attr-scales=src:common:0.25+wei:common:0.5+dst:common:4
--attr-post-ops=add:f32,sum+mul:s32:per_oc+linear:2:-1
--batch=shapes_2d

# test any
--reset
--dt=f32
--stag=ab,ba,any --wtag=ab,ba,any --dtag=ab,any
--batch=shapes_2d

# 3d
--reset
--dt=f32
--stag=abc,acb --wtag=abc,acb --dtag=abc,bac
--bia-dt=undef,f32 --bia_mask=4,6

--runtime_dims_masks=0,1:1
--attr-post-ops=,sum
--batch=shapes_3d

--runtime_dims_masks=2:4,6:6,3:5,7:7
--attr-scales=src:common:0.25+wei:common:0.5+dst:common:4,\
              src:common:0.25+wei:per_oc+dst:common:0.5
--attr-post-ops=sum+relu+add:u8,add:f32:per_tensor+sub:f32:per_oc,add:f32:4
--batch=shapes_3d

# batch size smaller than num_threads
--reset
--stag=abc --wtag=abc --dtag=abc
--bia-dt=f32 --bia_mask=4
2x20x30:2x30x4
2x20x30:1x30x4

# f32 Run-time
--batch=harness_matmul_runtime_f32

# f32 regression
--batch=harness_matmul_regression_f32

# int8
--batch=test_matmul_int8

# bf16
--batch=test_matmul_bfloat16

# bf32
--batch=test_matmul_bf32_bf16

# f16
--batch=test_matmul_float16

# data-tags
--batch=harness_matmul_data_tags

# matmul with strides
--batch=harness_matmul_strides

# 4d

--reset
--dt=f32
--stag=abcd,abdc --wtag=abcd,abdc --dtag=abcd,abdc
--bia-dt=undef,f32

--attr-scales=src:common:0.25+wei:common:0.5+dst:common:4
--attr-post-ops=,relu,sum,sum+relu+add:f32,binary_mul:f32+sum
--batch=shapes_4d
