llvm
diff --git a/‎llvm/lib/Target/AMDGPU/SIInstructions.td
Lines changed: 24 additions & 1 deletion b/‎llvm/lib/Target/AMDGPU/SIInstructions.td
Lines changed: 24 additions & 1 deletion
diff --git a/‎llvm/test/CodeGen/AMDGPU/GlobalISel/mul.ll
Lines changed: 1 addition & 1 deletion b/‎llvm/test/CodeGen/AMDGPU/GlobalISel/mul.ll
Lines changed: 1 addition & 1 deletion
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.1024bit.ll
Lines changed: 5636 additions & 6265 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.1024bit.ll
Lines changed: 5636 additions & 6265 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.128bit.ll
Lines changed: 546 additions & 602 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.128bit.ll
Lines changed: 546 additions & 602 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.256bit.ll
Lines changed: 620 additions & 700 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.256bit.ll
Lines changed: 620 additions & 700 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.320bit.ll
Lines changed: 1352 additions & 1534 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.320bit.ll
Lines changed: 1352 additions & 1534 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.32bit.ll
Lines changed: 108 additions & 132 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.32bit.ll
Lines changed: 108 additions & 132 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.512bit.ll
Lines changed: 2537 additions & 2877 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.512bit.ll
Lines changed: 2537 additions & 2877 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.64bit.ll
Lines changed: 287 additions & 350 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.64bit.ll
Lines changed: 287 additions & 350 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.96bit.ll
Lines changed: 283 additions & 311 deletions b/‎llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.96bit.ll
Lines changed: 283 additions & 311 deletions
@@ -3078,6 +3078,8 @@ def : GCNPat<
 }
 }  // AddedComplexity = 1
 
+foreach p = [NotHasTrue16BitInsts, UseFakeTrue16Insts] in
+let True16Predicate = p in {
 def : GCNPat<
   (i32 (DivergentUnaryFrag<zext> i16:$src)),
   (V_AND_B32_e64 (S_MOV_B32 (i32 0xffff)), $src)
@@ -3092,7 +3094,28 @@ def : GCNPat<
 
 def : GCNPat<
   (i32 (zext (i16 (bitconvert fp16_zeros_high_16bits:$src)))),
-  (COPY VSrc_b16:$src)>;
+  (COPY VSrc_b16:$src)
+>;
+}
+
+let True16Predicate = UseRealTrue16Insts in {
+def : GCNPat<
+  (i32 (DivergentUnaryFrag<zext> i16:$src)),
+  (REG_SEQUENCE VGPR_32, VGPR_16:$src, lo16, (V_MOV_B16_t16_e64 0, (i16 0), 0), hi16)
+>;
+
+def : GCNPat<
+  (i64 (DivergentUnaryFrag<zext> i16:$src)),
+  (REG_SEQUENCE VReg_64,
+    (INSERT_SUBREG (i32 (V_MOV_B32_e32 (i32 0))), VGPR_16:$src, lo16), sub0,
+    (S_MOV_B32 (i32 0)), sub1)
+>;
+
+def : GCNPat<
+  (i32 (zext (i16 (bitconvert fp16_zeros_high_16bits:$src)))),
+  (REG_SEQUENCE VGPR_32, VGPR_16:$src, lo16, (V_MOV_B16_t16_e64 0, (i16 0), 0), hi16)
+>;
+}
 
 def : GCNPat <
   (i32 (trunc i64:$a)),
 
@@ -164,7 +164,7 @@ define zeroext i16 @v_mul_i16_zeroext(i16 zeroext %num, i16 zeroext %den) {
 ; GFX11-TRUE16:       ; %bb.0:
 ; GFX11-TRUE16-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
 ; GFX11-TRUE16-NEXT:    v_mul_lo_u16 v0.l, v0.l, v1.l
-; GFX11-TRUE16-NEXT:    v_and_b32_e32 v0, 0xffff, v0
+; GFX11-TRUE16-NEXT:    v_mov_b16_e32 v0.h, 0
 ; GFX11-TRUE16-NEXT:    s_setpc_b64 s[30:31]
 ;
 ; GFX11-FAKE16-LABEL: v_mul_i16_zeroext:
Original file line number	Diff line number	Diff line change
`@@ -164,7 +164,7 @@ define zeroext i16 @v_mul_i16_zeroext(i16 zeroext %num, i16 zeroext %den) {`
`164`	`164`	`; GFX11-TRUE16: ; %bb.0:`
`165`	`165`	`; GFX11-TRUE16-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)`
`166`	`166`	`; GFX11-TRUE16-NEXT: v_mul_lo_u16 v0.l, v0.l, v1.l`
`167`		`-; GFX11-TRUE16-NEXT: v_and_b32_e32 v0, 0xffff, v0`
	`167`	`+; GFX11-TRUE16-NEXT: v_mov_b16_e32 v0.h, 0`
`168`	`168`	`; GFX11-TRUE16-NEXT: s_setpc_b64 s[30:31]`
`169`	`169`	`;`
`170`	`170`	`; GFX11-FAKE16-LABEL: v_mul_i16_zeroext:`