/aosp_15_r20/external/XNNPACK/src/qs8-gemm/ |
H A D | 4x8-rndnu-aarch32-neon-mlal-lane-ld64.cc | 170 vmlal_s16(q9, d9, d0[0]); in generate() 172 vmlal_s16(q11, d9, d2[0]); in generate() 174 vmlal_s16(q13, d9, d4[0]); in generate() 176 vmlal_s16(q15, d9, d6[0]); in generate() 181 vmlal_s16(q9, d9, d0[1]); in generate() 183 vmlal_s16(q11, d9, d2[1]); in generate() 185 vmlal_s16(q13, d9, d4[1]); in generate() 187 vmlal_s16(q15, d9, d6[1]); in generate() 192 vmlal_s16(q9, d9, d0[2]); in generate() 194 vmlal_s16(q11, d9, d2[2]); in generate() [all …]
|
/aosp_15_r20/external/XNNPACK/src/qc8-gemm/ |
H A D | 4x8-fp32-aarch32-neonv8-mlal-lane-ld64.cc | 167 vmlal_s16(q9, d9, d0[0]); in generate() 169 vmlal_s16(q11, d9, d2[0]); in generate() 171 vmlal_s16(q13, d9, d4[0]); in generate() 173 vmlal_s16(q15, d9, d6[0]); in generate() 178 vmlal_s16(q9, d9, d0[1]); in generate() 180 vmlal_s16(q11, d9, d2[1]); in generate() 182 vmlal_s16(q13, d9, d4[1]); in generate() 184 vmlal_s16(q15, d9, d6[1]); in generate() 189 vmlal_s16(q9, d9, d0[2]); in generate() 191 vmlal_s16(q11, d9, d2[2]); in generate() [all …]
|
/aosp_15_r20/external/XNNPACK/src/qc8-igemm/ |
H A D | 4x8-fp32-aarch32-neonv8-mlal-lane-ld64.cc | 186 vmlal_s16(q9, d9, d0[0]); in generate() 188 vmlal_s16(q11, d9, d2[0]); in generate() 190 vmlal_s16(q13, d9, d4[0]); in generate() 192 vmlal_s16(q15, d9, d6[0]); in generate() 197 vmlal_s16(q9, d9, d0[1]); in generate() 199 vmlal_s16(q11, d9, d2[1]); in generate() 201 vmlal_s16(q13, d9, d4[1]); in generate() 203 vmlal_s16(q15, d9, d6[1]); in generate() 208 vmlal_s16(q9, d9, d0[2]); in generate() 210 vmlal_s16(q11, d9, d2[2]); in generate() [all …]
|
/aosp_15_r20/external/XNNPACK/src/qs8-igemm/ |
H A D | 4x8-rndnu-aarch32-neon-mlal-lane-ld64.cc | 189 vmlal_s16(q9, d9, d0[0]); in generate() 191 vmlal_s16(q11, d9, d2[0]); in generate() 193 vmlal_s16(q13, d9, d4[0]); in generate() 195 vmlal_s16(q15, d9, d6[0]); in generate() 200 vmlal_s16(q9, d9, d0[1]); in generate() 202 vmlal_s16(q11, d9, d2[1]); in generate() 204 vmlal_s16(q13, d9, d4[1]); in generate() 206 vmlal_s16(q15, d9, d6[1]); in generate() 211 vmlal_s16(q9, d9, d0[2]); in generate() 213 vmlal_s16(q11, d9, d2[2]); in generate() [all …]
|
/aosp_15_r20/external/XNNPACK/src/qs8-gemm/gen/ |
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-prfm-cortex-a7.S | 144 VMLAL.S16 q9, d9, d0[0] 146 VMLAL.S16 q11, d9, d2[0] 149 VMLAL.S16 q13, d9, d4[0] 151 VMLAL.S16 q15, d9, d6[0] 168 VMLAL.S16 q9, d9, d0[2] 170 VMLAL.S16 q11, d9, d2[2] 173 VMLAL.S16 q13, d9, d4[2] 175 VMLAL.S16 q15, d9, d6[2] 193 VMLAL.S16 q9, d9, d1[0] 195 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-cortex-a53.S | 132 VMLAL.S16 q9, d9, d0[0] 134 VMLAL.S16 q11, d9, d2[0] 137 VMLAL.S16 q13, d9, d4[0] 139 VMLAL.S16 q15, d9, d6[0] 156 VMLAL.S16 q9, d9, d0[2] 158 VMLAL.S16 q11, d9, d2[2] 161 VMLAL.S16 q13, d9, d4[2] 163 VMLAL.S16 q15, d9, d6[2] 184 VMLAL.S16 q9, d9, d1[0] 186 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-prfm-cortex-a53.S | 147 VMLAL.S16 q9, d9, d0[0] 149 VMLAL.S16 q11, d9, d2[0] 152 VMLAL.S16 q13, d9, d4[0] 154 VMLAL.S16 q15, d9, d6[0] 171 VMLAL.S16 q9, d9, d0[2] 173 VMLAL.S16 q11, d9, d2[2] 176 VMLAL.S16 q13, d9, d4[2] 178 VMLAL.S16 q15, d9, d6[2] 199 VMLAL.S16 q9, d9, d1[0] 201 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-cortex-a7.S | 133 VMLAL.S16 q9, d9, d0[0] 135 VMLAL.S16 q11, d9, d2[0] 138 VMLAL.S16 q13, d9, d4[0] 140 VMLAL.S16 q15, d9, d6[0] 157 VMLAL.S16 q9, d9, d0[2] 159 VMLAL.S16 q11, d9, d2[2] 162 VMLAL.S16 q13, d9, d4[2] 164 VMLAL.S16 q15, d9, d6[2] 182 VMLAL.S16 q9, d9, d1[0] 184 VMLAL.S16 q11, d9, d3[0] [all …]
|
/aosp_15_r20/external/XNNPACK/src/qu8-igemm/gen/ |
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-cortex-a7.S | 154 VMLAL.S16 q9, d9, d0[0] 156 VMLAL.S16 q11, d9, d2[0] 159 VMLAL.S16 q13, d9, d4[0] 161 VMLAL.S16 q15, d9, d6[0] 178 VMLAL.S16 q9, d9, d0[2] 180 VMLAL.S16 q11, d9, d2[2] 183 VMLAL.S16 q13, d9, d4[2] 185 VMLAL.S16 q15, d9, d6[2] 203 VMLAL.S16 q9, d9, d1[0] 205 VMLAL.S16 q11, d9, d3[0] [all …]
|
/aosp_15_r20/external/XNNPACK/src/qc8-gemm/gen/ |
H A D | 4x8-minmax-fp32-aarch32-neon-mlal-lane-cortex-a7.S | 132 VMLAL.S16 q9, d9, d0[0] 134 VMLAL.S16 q11, d9, d2[0] 137 VMLAL.S16 q13, d9, d4[0] 139 VMLAL.S16 q15, d9, d6[0] 156 VMLAL.S16 q9, d9, d0[2] 158 VMLAL.S16 q11, d9, d2[2] 161 VMLAL.S16 q13, d9, d4[2] 163 VMLAL.S16 q15, d9, d6[2] 181 VMLAL.S16 q9, d9, d1[0] 183 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neon-mlal-lane-cortex-a53.S | 131 VMLAL.S16 q9, d9, d0[0] 133 VMLAL.S16 q11, d9, d2[0] 136 VMLAL.S16 q13, d9, d4[0] 138 VMLAL.S16 q15, d9, d6[0] 155 VMLAL.S16 q9, d9, d0[2] 157 VMLAL.S16 q11, d9, d2[2] 160 VMLAL.S16 q13, d9, d4[2] 162 VMLAL.S16 q15, d9, d6[2] 183 VMLAL.S16 q9, d9, d1[0] 185 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neonv8-mlal-lane-cortex-a53.S | 129 VMLAL.S16 q9, d9, d0[0] 131 VMLAL.S16 q11, d9, d2[0] 134 VMLAL.S16 q13, d9, d4[0] 136 VMLAL.S16 q15, d9, d6[0] 153 VMLAL.S16 q9, d9, d0[2] 155 VMLAL.S16 q11, d9, d2[2] 158 VMLAL.S16 q13, d9, d4[2] 160 VMLAL.S16 q15, d9, d6[2] 181 VMLAL.S16 q9, d9, d1[0] 183 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neonv8-mlal-lane-prfm-cortex-a53.S | 144 VMLAL.S16 q9, d9, d0[0] 146 VMLAL.S16 q11, d9, d2[0] 149 VMLAL.S16 q13, d9, d4[0] 151 VMLAL.S16 q15, d9, d6[0] 168 VMLAL.S16 q9, d9, d0[2] 170 VMLAL.S16 q11, d9, d2[2] 173 VMLAL.S16 q13, d9, d4[2] 175 VMLAL.S16 q15, d9, d6[2] 196 VMLAL.S16 q9, d9, d1[0] 198 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neonv8-mlal-lane-cortex-a35.S | 130 VMLAL.S16 q9, d9, d0[0] 132 VMLAL.S16 q11, d9, d2[0] 135 VMLAL.S16 q13, d9, d4[0] 137 VMLAL.S16 q15, d9, d6[0] 154 VMLAL.S16 q9, d9, d0[2] 156 VMLAL.S16 q11, d9, d2[2] 159 VMLAL.S16 q13, d9, d4[2] 161 VMLAL.S16 q15, d9, d6[2] 179 VMLAL.S16 q9, d9, d1[0] 181 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neonv8-mlal-lane-prfm-cortex-a35.S | 141 VMLAL.S16 q9, d9, d0[0] 143 VMLAL.S16 q11, d9, d2[0] 146 VMLAL.S16 q13, d9, d4[0] 148 VMLAL.S16 q15, d9, d6[0] 165 VMLAL.S16 q9, d9, d0[2] 167 VMLAL.S16 q11, d9, d2[2] 170 VMLAL.S16 q13, d9, d4[2] 172 VMLAL.S16 q15, d9, d6[2] 190 VMLAL.S16 q9, d9, d1[0] 192 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neon-mlal-lane-prfm-cortex-a7.S | 143 VMLAL.S16 q9, d9, d0[0] 145 VMLAL.S16 q11, d9, d2[0] 148 VMLAL.S16 q13, d9, d4[0] 150 VMLAL.S16 q15, d9, d6[0] 167 VMLAL.S16 q9, d9, d0[2] 169 VMLAL.S16 q11, d9, d2[2] 172 VMLAL.S16 q13, d9, d4[2] 174 VMLAL.S16 q15, d9, d6[2] 192 VMLAL.S16 q9, d9, d1[0] 194 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neon-mlal-lane-prfm-cortex-a53.S | 146 VMLAL.S16 q9, d9, d0[0] 148 VMLAL.S16 q11, d9, d2[0] 151 VMLAL.S16 q13, d9, d4[0] 153 VMLAL.S16 q15, d9, d6[0] 170 VMLAL.S16 q9, d9, d0[2] 172 VMLAL.S16 q11, d9, d2[2] 175 VMLAL.S16 q13, d9, d4[2] 177 VMLAL.S16 q15, d9, d6[2] 198 VMLAL.S16 q9, d9, d1[0] 200 VMLAL.S16 q11, d9, d3[0] [all …]
|
/aosp_15_r20/external/XNNPACK/src/qs8-igemm/gen/ |
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-cortex-a7.S | 153 VMLAL.S16 q9, d9, d0[0] 155 VMLAL.S16 q11, d9, d2[0] 158 VMLAL.S16 q13, d9, d4[0] 160 VMLAL.S16 q15, d9, d6[0] 177 VMLAL.S16 q9, d9, d0[2] 179 VMLAL.S16 q11, d9, d2[2] 182 VMLAL.S16 q13, d9, d4[2] 184 VMLAL.S16 q15, d9, d6[2] 202 VMLAL.S16 q9, d9, d1[0] 204 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-prfm-cortex-a7.S | 160 VMLAL.S16 q9, d9, d0[0] 162 VMLAL.S16 q11, d9, d2[0] 165 VMLAL.S16 q13, d9, d4[0] 167 VMLAL.S16 q15, d9, d6[0] 184 VMLAL.S16 q9, d9, d0[2] 186 VMLAL.S16 q11, d9, d2[2] 189 VMLAL.S16 q13, d9, d4[2] 191 VMLAL.S16 q15, d9, d6[2] 209 VMLAL.S16 q9, d9, d1[0] 211 VMLAL.S16 q11, d9, d3[0] [all …]
|
/aosp_15_r20/external/XNNPACK/src/qc8-igemm/gen/ |
H A D | 4x8-minmax-fp32-aarch32-neonv8-mlal-lane-cortex-a35.S | 150 VMLAL.S16 q9, d9, d0[0] 152 VMLAL.S16 q11, d9, d2[0] 155 VMLAL.S16 q13, d9, d4[0] 157 VMLAL.S16 q15, d9, d6[0] 174 VMLAL.S16 q9, d9, d0[2] 176 VMLAL.S16 q11, d9, d2[2] 179 VMLAL.S16 q13, d9, d4[2] 181 VMLAL.S16 q15, d9, d6[2] 199 VMLAL.S16 q9, d9, d1[0] 201 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neonv8-mlal-lane-prfm-cortex-a35.S | 157 VMLAL.S16 q9, d9, d0[0] 159 VMLAL.S16 q11, d9, d2[0] 162 VMLAL.S16 q13, d9, d4[0] 164 VMLAL.S16 q15, d9, d6[0] 181 VMLAL.S16 q9, d9, d0[2] 183 VMLAL.S16 q11, d9, d2[2] 186 VMLAL.S16 q13, d9, d4[2] 188 VMLAL.S16 q15, d9, d6[2] 206 VMLAL.S16 q9, d9, d1[0] 208 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neonv8-mlal-lane-cortex-a53.S | 150 VMLAL.S16 q9, d9, d0[0] 152 VMLAL.S16 q11, d9, d2[0] 155 VMLAL.S16 q13, d9, d4[0] 157 VMLAL.S16 q15, d9, d6[0] 174 VMLAL.S16 q9, d9, d0[2] 176 VMLAL.S16 q11, d9, d2[2] 179 VMLAL.S16 q13, d9, d4[2] 181 VMLAL.S16 q15, d9, d6[2] 202 VMLAL.S16 q9, d9, d1[0] 204 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-fp32-aarch32-neon-mlal-lane-prfm-cortex-a7.S | 159 VMLAL.S16 q9, d9, d0[0] 161 VMLAL.S16 q11, d9, d2[0] 164 VMLAL.S16 q13, d9, d4[0] 166 VMLAL.S16 q15, d9, d6[0] 183 VMLAL.S16 q9, d9, d0[2] 185 VMLAL.S16 q11, d9, d2[2] 188 VMLAL.S16 q13, d9, d4[2] 190 VMLAL.S16 q15, d9, d6[2] 208 VMLAL.S16 q9, d9, d1[0] 210 VMLAL.S16 q11, d9, d3[0] [all …]
|
/aosp_15_r20/external/XNNPACK/src/qu8-gemm/gen/ |
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-cortex-a7.S | 134 VMLAL.S16 q9, d9, d0[0] 136 VMLAL.S16 q11, d9, d2[0] 139 VMLAL.S16 q13, d9, d4[0] 141 VMLAL.S16 q15, d9, d6[0] 158 VMLAL.S16 q9, d9, d0[2] 160 VMLAL.S16 q11, d9, d2[2] 163 VMLAL.S16 q13, d9, d4[2] 165 VMLAL.S16 q15, d9, d6[2] 183 VMLAL.S16 q9, d9, d1[0] 185 VMLAL.S16 q11, d9, d3[0] [all …]
|
H A D | 4x8-minmax-rndnu-aarch32-neon-mlal-lane-prfm-cortex-a7.S | 145 VMLAL.S16 q9, d9, d0[0] 147 VMLAL.S16 q11, d9, d2[0] 150 VMLAL.S16 q13, d9, d4[0] 152 VMLAL.S16 q15, d9, d6[0] 169 VMLAL.S16 q9, d9, d0[2] 171 VMLAL.S16 q11, d9, d2[2] 174 VMLAL.S16 q13, d9, d4[2] 176 VMLAL.S16 q15, d9, d6[2] 194 VMLAL.S16 q9, d9, d1[0] 196 VMLAL.S16 q11, d9, d3[0] [all …]
|