/sysdeps/x86_64/fpu/multiarch/ |
A D | svml_d_pow8_core_avx512.S | 93 vmovaps %zmm1, %zmm12 157 vaddpd %zmm7, %zmm1, %zmm7 223 vpsrlq $32, %zmm1, %zmm14 261 vsubpd %zmm11, %zmm1, %zmm1 286 vmovaps %zmm1, %zmm0 298 vmovups %zmm1, 1280(%rsp) 383 vmovups 1280(%rsp), %zmm1 421 vmovaps %zmm1, %zmm6 545 vpsrlq $32, %zmm9, %zmm1 547 vpmovqd %zmm1, %ymm1 [all …]
|
A D | svml_s_acosf16_core_avx512.S | 83 vminps {sae}, %zmm6, %zmm7, %zmm1 87 vmulps {rn-sae}, %zmm1, %zmm1, %zmm8 90 vcmpps $21, {sae}, %zmm6, %zmm1, %k4 93 vcmpps $17, {sae}, %zmm1, %zmm4, %k2 99 vfmadd231ps {rn-sae}, %zmm1, %zmm7, %zmm9 103 vfmadd231ps {rn-sae}, %zmm1, %zmm6, %zmm11 108 vfmadd213ps {rn-sae}, %zmm10, %zmm1, %zmm11 110 vmulps {rn-sae}, %zmm1, %zmm11, %zmm13 112 vxorps %zmm2, %zmm0, %zmm1 114 vfmadd213ps {rn-sae}, %zmm1, %zmm1, %zmm13
|
A D | svml_d_log8_core_avx512.S | 53 vmovups _Two10(%rdx), %zmm1 65 vrcp28pd %zmm1, %zmm5 76 vfmsub213pd %zmm9, %zmm11, %zmm1 88 vmulpd %zmm1, %zmm1, %zmm10 110 vfmadd213pd %zmm1, %zmm10, %zmm11 111 vaddpd %zmm2, %zmm11, %zmm1 112 vfmadd132pd _L2(%rdx), %zmm1, %zmm3 270 vpternlogd $0xff, %zmm1, %zmm1, %zmm1 292 vmovaps %zmm1, %zmm8 293 vmovaps %zmm1, %zmm9 [all …]
|
A D | svml_d_sincos8_core_avx512.S | 98 vaddpd %zmm6, %zmm1, %zmm0 105 vmulpd %zmm1, %zmm1, %zmm15 142 vfmadd213pd %zmm1, %zmm1, %zmm13 147 vptestmq %zmm1, %zmm1, %k0 387 vmulpd %zmm3, %zmm3, %zmm1 416 vmulpd %zmm1, %zmm0, %zmm1 429 vxorpd %zmm2, %zmm1, %zmm1 443 vmovups %zmm1, (%rsi) 455 vmovups %zmm1, 1280(%rsp) 533 vmovups 1280(%rsp), %zmm1 [all …]
|
A D | svml_s_cosf16_core_avx512.S | 115 vmulps %zmm10, %zmm9, %zmm1 116 vfmadd213ps %zmm11, %zmm11, %zmm1 122 vmovaps %zmm1, %zmm0 133 vmovups %zmm1, 1216(%rsp) 218 vmovups 1216(%rsp), %zmm1 325 vpandnd %zmm1, %zmm1, %zmm12{%k1} 326 vmulps %zmm10, %zmm9, %zmm1 328 vfmadd213ps %zmm11, %zmm11, %zmm1 334 vmovaps %zmm1, %zmm0 345 vmovups %zmm1, 1216(%rsp) [all …]
|
A D | svml_s_logf16_core_avx512.S | 64 vcvtdq2ps {rn-sae}, %zmm4, %zmm1 88 vfmadd132ps _sLn2(%rax), %zmm9, %zmm1 94 vmovaps %zmm1, %zmm0 105 vmovups %zmm1, 1216(%rsp) 190 vmovups 1216(%rsp), %zmm1 239 vpaddd _iHiDelta(%rax), %zmm0, %zmm1 266 vpandnd %zmm1, %zmm1, %zmm6{%k1} 268 vcvtdq2ps {rn-sae}, %zmm5, %zmm1 281 vmovaps %zmm1, %zmm0 292 vmovups %zmm1, 1216(%rsp) [all …]
|
A D | svml_s_sinf16_core_avx512.S | 60 vmovups __sInvPI(%rax), %zmm1 94 vpslld $31, %zmm1, %zmm6 126 vmovaps %zmm1, %zmm0 137 vmovups %zmm1, 1216(%rsp) 222 vmovups 1216(%rsp), %zmm1 278 vmovups __sInvPI(%rax), %zmm1 303 vpslld $31, %zmm1, %zmm7 306 vsubps %zmm2, %zmm1, %zmm6 345 vmovaps %zmm1, %zmm0 356 vmovups %zmm1, 1216(%rsp) [all …]
|
A D | svml_d_sin8_core_avx512.S | 48 vmovups __dInvPI(%rax), %zmm1 73 vpsllq $63, %zmm1, %zmm5 112 vpxorq %zmm11, %zmm10, %zmm1 118 vmovaps %zmm1, %zmm0 129 vmovups %zmm1, 1216(%rsp) 214 vmovups 1216(%rsp), %zmm1 257 vpternlogd $0xff, %zmm1, %zmm1, %zmm14 281 vsubpd %zmm1, %zmm2, %zmm5 329 vmovaps %zmm1, %zmm0 340 vmovups %zmm1, 1216(%rsp) [all …]
|
A D | svml_d_acos8_core_avx512.S | 75 vmovups sqrt_coeff_3+__svml_dacos_data_internal(%rip), %zmm1 114 vfmadd213pd {rn-sae}, %zmm1, %zmm0, %zmm2 115 vmovups poly_coeff_2+__svml_dacos_data_internal(%rip), %zmm1 118 vfmadd231pd {rn-sae}, %zmm3, %zmm8, %zmm1 124 vfmadd213pd {rn-sae}, %zmm12, %zmm0, %zmm1 134 vfmadd213pd {rn-sae}, %zmm7, %zmm10, %zmm1 135 vfmadd213pd {rn-sae}, %zmm8, %zmm0, %zmm1 136 vfmadd213pd {rn-sae}, %zmm11, %zmm0, %zmm1 138 vmulpd {rn-sae}, %zmm3, %zmm1, %zmm1 141 vfmadd213pd {rn-sae}, %zmm3, %zmm3, %zmm1 [all …]
|
A D | svml_d_cos8_core_avx512.S | 61 vpandq __dAbsMask(%rax), %zmm5, %zmm1 111 vpxorq %zmm12, %zmm11, %zmm1 117 vmovaps %zmm1, %zmm0 128 vmovups %zmm1, 1216(%rsp) 213 vmovups 1216(%rsp), %zmm1 274 vandpd __dAbsMask(%rax), %zmm6, %zmm1 313 vpandnq %zmm1, %zmm1, %zmm2{%k1} 320 vxorpd %zmm13, %zmm12, %zmm1 327 vmovaps %zmm1, %zmm0 338 vmovups %zmm1, 1216(%rsp) [all …]
|
A D | svml_d_exp8_core_avx512.S | 58 vpsrlq $32, %zmm0, %zmm1 62 vpmovqd %zmm1, %ymm2 119 vmovaps %zmm1, %zmm0 130 vmovups %zmm1, 1216(%rsp) 215 vmovups 1216(%rsp), %zmm1 270 vpsrlq $32, %zmm0, %zmm1 279 vpmovqd %zmm1, %ymm2 319 vpsllq $42, %zmm8, %zmm1 322 vpaddq %zmm1, %zmm10, %zmm1 328 vmovaps %zmm1, %zmm0 [all …]
|
A D | svml_s_expf16_core_avx512.S | 103 vmulps %zmm9, %zmm8, %zmm1 109 vmovaps %zmm1, %zmm0 120 vmovups %zmm1, 1216(%rsp) 205 vmovups 1216(%rsp), %zmm1 262 vmovups __sShifter(%rax), %zmm1 267 vfmadd213ps %zmm1, %zmm0, %zmm4 270 vsubps %zmm1, %zmm4, %zmm8 296 vmulps %zmm10, %zmm9, %zmm1 311 vmovaps %zmm1, %zmm0 322 vmovups %zmm1, 1216(%rsp) [all …]
|
A D | svml_s_powf16_core_avx512.S | 93 vmovaps %zmm1, %zmm9 111 vcvtps2pd %ymm9, %zmm1 179 vmulpd %zmm1, %zmm13, %zmm10 209 vsubpd %zmm15, %zmm1, %zmm1 217 vmulpd __dbC1(%rdx), %zmm1, %zmm1 228 vfmadd213pd %zmm4, %zmm1, %zmm4 239 vmovaps %zmm1, %zmm0 251 vmovups %zmm1, 1280(%rsp) 336 vmovups 1280(%rsp), %zmm1 366 vextractf32x8 $1, %zmm1, %ymm14 [all …]
|
A D | svml_s_sincosf16_core_avx512.S | 67 vpandd %zmm0, %zmm2, %zmm1 74 vmovaps %zmm1, %zmm6 75 vmovaps %zmm1, %zmm8 98 vpbroadcastd %edx, %zmm1{%k1}{z} 100 vptestmd %zmm1, %zmm1, %k0 309 vxorps %zmm1, %zmm7, %zmm8 328 vxorps %zmm1, %zmm15, %zmm1 329 vmulps %zmm1, %zmm1, %zmm13 346 vfmadd213ps %zmm1, %zmm1, %zmm3 505 vmovups %zmm1, 128(%rsp) [all …]
|
/sysdeps/x86_64/ |
A D | tst-avx512-aux.c | 32 __m512i zmm1 = _mm512_set1_epi32 (1); in tst_avx512_aux() local 39 __m512i ret = avx512_test (zmm0, zmm1, zmm2, zmm3, in tst_avx512_aux()
|
/sysdeps/x86_64/multiarch/ |
A D | memmove-avx512-no-vzeroupper.S | 63 vmovups 0x40(%rsi), %zmm1 71 vmovups %zmm1, 0x40(%rdi) 84 vmovups 0x40(%rsi), %zmm1 88 vmovups %zmm1, 0x40(%rdi) 184 vmovups 0x40(%rsi), %zmm1 200 vmovups %zmm1, 0x40(%rdi) 241 vmovups 0x40(%rsi), %zmm1 258 vmovups %zmm1, 0x40(%rdi) 300 vmovups -0x80(%rcx), %zmm1 317 vmovups %zmm1, -0x80(%r9) [all …]
|
/sysdeps/x86_64/fpu/ |
A D | svml_s_sincosf16_core.S | 40 vmovups %zmm1, 128(%rdi) 171 vmovdqa64 %zmm1, -240(%ebp)
|
A D | svml_d_sincos8_core.S | 40 vmovups %zmm1, 128(%rdi)
|
A D | svml_d_wrapper_impl.h | 230 vmovups %zmm1, 64(%rsp)
|
A D | svml_s_wrapper_impl.h | 275 vmovups %zmm1, 64(%rsp)
|