/sysdeps/x86_64/multiarch/ |
A D | memset-avx512-no-vzeroupper.S | 50 vbroadcastss %xmm0, %zmm2 54 vmovups %zmm2, (%rdi) 67 vmovups %zmm2, (%rdi) 76 vmovups %zmm2, (%rdi) 128 vmovups %zmm2, (%rdi) 149 vmovups %zmm2, (%rax) 154 vmovaps %zmm2, (%rdi) 161 vmovups %zmm2, (%rsi) 171 vmovups %zmm2, (%rax) 176 vmovntdq %zmm2, (%rdi) [all …]
|
A D | memmove-avx512-no-vzeroupper.S | 64 vmovups 0x80(%rsi), %zmm2 72 vmovups %zmm2, 0x80(%rdi) 85 vmovups -0x80(%rcx), %zmm2 89 vmovups %zmm2, -0x80(%r9) 185 vmovups 0x80(%rsi), %zmm2 201 vmovups %zmm2, 0x80(%rdi) 242 vmovups 0x80(%rsi), %zmm2 259 vmovups %zmm2, 0x80(%rdi) 301 vmovups -0xC0(%rcx), %zmm2 318 vmovups %zmm2, -0xC0(%r9) [all …]
|
/sysdeps/x86_64/fpu/multiarch/ |
A D | svml_s_powf16_core_avx512.S | 108 vcvtps2pd %ymm8, %zmm2 195 vaddpd __dbShifter(%rdx), %zmm2, %zmm2 219 vpsrlq $11, %zmm2, %zmm8 379 vpmovqd %zmm2, %ymm11 431 vmovaps %zmm4, %zmm2 446 vmovaps %zmm2, %zmm3 504 vpxord %zmm2, %zmm2, %zmm2 506 vfmadd213pd %zmm2, %zmm26, %zmm2 507 vpaddq %zmm13, %zmm2, %zmm2 508 vcvtpd2ps %zmm2, %ymm4 [all …]
|
A D | svml_d_pow8_core_avx512.S | 144 vsubpd %zmm2, %zmm6, %zmm5 154 vfmsub213pd %zmm6, %zmm9, %zmm2 160 vfmadd213pd %zmm2, %zmm9, %zmm5 175 vsubpd %zmm9, %zmm3, %zmm2 181 vaddpd %zmm2, %zmm5, %zmm1 270 vaddpd %zmm1, %zmm2, %zmm2 560 vaddpd %zmm2, %zmm9, %zmm1 589 vmovups _cev_1(%rax), %zmm2 608 vmovaps %zmm2, %zmm0 620 vmovups %zmm2, 1280(%rsp) [all …]
|
A D | svml_d_log8_core_avx512.S | 49 vpsrlq $20, %zmm0, %zmm2 50 vpsrlq $32, %zmm2, %zmm3 51 vpxord %zmm2, %zmm2, %zmm2 111 vaddpd %zmm2, %zmm11, %zmm1 259 vmovups _Two10(%rax), %zmm2 274 vrcp14pd %zmm2, %zmm5 287 vfmsub213pd %zmm11, %zmm0, %zmm2 300 vmulpd %zmm2, %zmm2, %zmm14 310 vfmadd213pd %zmm2, %zmm14, %zmm4 311 vaddpd %zmm5, %zmm4, %zmm2 [all …]
|
A D | svml_d_acos8_core_avx512.S | 74 vmovups sqrt_coeff_2+__svml_dacos_data_internal(%rip), %zmm2 111 vfmadd231pd {rn-sae}, %zmm0, %zmm15, %zmm2 114 vfmadd213pd {rn-sae}, %zmm1, %zmm0, %zmm2 117 vfmadd213pd {rn-sae}, %zmm13, %zmm0, %zmm2 121 vfnmadd213pd {rn-sae}, %zmm7, %zmm14, %zmm2 125 vblendmpd %zmm2, %zmm5, %zmm2{%k4} 139 vxorpd %zmm4, %zmm2, %zmm3
|
A D | svml_d_sincos8_core_avx512.S | 74 vpsllq $63, %zmm5, %zmm2 159 vpxorq %zmm2, %zmm13, %zmm0 162 vpxorq %zmm5, %zmm14, %zmm2 169 vmovups %zmm2, (%rsi) 181 vmovups %zmm2, 1280(%rsp) 269 vmovups 1280(%rsp), %zmm2 322 vmovups __dPI3_FMA(%rax), %zmm2 374 vfnmadd213pd %zmm0, %zmm2, %zmm3 380 vmovaps %zmm4, %zmm2 429 vxorpd %zmm2, %zmm1, %zmm1 [all …]
|
A D | svml_d_cos8_core_avx512.S | 77 vpbroadcastq %rcx, %zmm2{%k1}{z} 79 vptestmq %zmm2, %zmm2, %k0 261 vpternlogd $0xff, %zmm2, %zmm2, %zmm2 313 vpandnq %zmm1, %zmm1, %zmm2{%k1} 314 vcmppd $3, %zmm2, %zmm2, %k0
|
A D | svml_s_cosf16_core_avx512.S | 64 vaddps __sHalfPI(%rdx), %zmm0, %zmm2 72 vfmadd132ps __sInvPI(%rdx), %zmm3, %zmm2 76 vsubps %zmm3, %zmm2, %zmm4 86 vpslld $31, %zmm2, %zmm8 280 vaddps __sHalfPI(%rax), %zmm0, %zmm2 290 vfmadd132ps __sInvPI(%rax), %zmm3, %zmm2 297 vpslld $31, %zmm2, %zmm8 300 vsubps %zmm3, %zmm2, %zmm4
|
A D | svml_s_expf16_core_avx512.S | 78 vpbroadcastd %ecx, %zmm2{%k1}{z} 84 vptestmd %zmm2, %zmm2, %k0 299 vpandd __iAbsMask(%rax), %zmm0, %zmm2 300 vpcmpd $2, __iDomainRange(%rax), %zmm2, %k1 301 vpandnd %zmm2, %zmm2, %zmm3{%k1}
|
A D | svml_s_sincosf16_core_avx512.S | 61 vmovaps %zmm0, %zmm2 67 vpandd %zmm0, %zmm2, %zmm1 70 vpandnd %zmm2, %zmm0, %zmm0 145 vmovups %zmm2, 1152(%rsp) 289 vandps %zmm3, %zmm4, %zmm2 293 vfmadd213ps %zmm6, %zmm2, %zmm5 305 vmovaps %zmm2, %zmm11 320 vmovaps %zmm2, %zmm13 348 vpandnd %zmm2, %zmm2, %zmm14{%k1} 507 vmovups %zmm2, 192(%rdi) [all …]
|
A D | svml_s_logf16_core_avx512.S | 49 vpsubd _iBrkValue(%rax), %zmm0, %zmm2 51 vpandd _iOffExpoMask(%rax), %zmm2, %zmm3 54 vpsrad $23, %zmm2, %zmm4 242 vpsubd %zmm4, %zmm0, %zmm2 246 vpsrad $23, %zmm2, %zmm5 247 vpandd _iOffExpoMask(%rax), %zmm2, %zmm3
|
A D | svml_d_sin8_core_avx512.S | 55 vmovups __dPI1_FMA(%rax), %zmm2 75 vfnmadd231pd %zmm4, %zmm2, %zmm3 259 vmovups __dInvPI(%rax), %zmm2 274 vfmadd213pd %zmm1, %zmm13, %zmm2 278 vpsllq $63, %zmm2, %zmm6 281 vsubpd %zmm1, %zmm2, %zmm5
|
A D | svml_s_sinf16_core_avx512.S | 64 vmovups __sPI1_FMA(%rax), %zmm2 96 vfnmadd231ps %zmm5, %zmm2, %zmm3 279 vmovups __sRShifter(%rax), %zmm2 296 vfmadd213ps %zmm2, %zmm13, %zmm1 306 vsubps %zmm2, %zmm1, %zmm6
|
A D | svml_s_acosf16_core_avx512.S | 71 vandps %zmm4, %zmm5, %zmm2 112 vxorps %zmm2, %zmm0, %zmm1
|
A D | svml_d_exp8_core_avx512.S | 82 vpandd __iAbsMask(%rax), %zmm2, %zmm2{%k2} 87 vpcmpgtd __iDomainRange(%rax), %zmm2, %k1{%k2}
|
/sysdeps/x86_64/ |
A D | tst-avx512-aux.c | 33 __m512i zmm2 = _mm512_set1_epi32 (2); in tst_avx512_aux() local 39 __m512i ret = avx512_test (zmm0, zmm1, zmm2, zmm3, in tst_avx512_aux()
|
/sysdeps/x86_64/fpu/ |
A D | svml_s_sincosf16_core.S | 41 vmovups %zmm2, 192(%rdi) 172 vmovdqa64 %zmm2, -304(%ebp)
|
A D | svml_d_sincos8_core.S | 41 vmovups %zmm2, 192(%rdi)
|