mirror of
https://git.naxdy.org/Mirror/Ryujinx.git
synced 2025-01-09 20:29:11 +00:00
Merge branch 'master' into CoOp
This commit is contained in:
commit
5c74a13d06
21 changed files with 866 additions and 106 deletions
|
@ -360,6 +360,8 @@ namespace ChocolArm64
|
||||||
SetA64("0x001110<<1xxxxx010100xxxxxxxxxx", AInstEmit.Sabal_V, typeof(AOpCodeSimdReg));
|
SetA64("0x001110<<1xxxxx010100xxxxxxxxxx", AInstEmit.Sabal_V, typeof(AOpCodeSimdReg));
|
||||||
SetA64("0x001110<<1xxxxx011101xxxxxxxxxx", AInstEmit.Sabd_V, typeof(AOpCodeSimdReg));
|
SetA64("0x001110<<1xxxxx011101xxxxxxxxxx", AInstEmit.Sabd_V, typeof(AOpCodeSimdReg));
|
||||||
SetA64("0x001110<<1xxxxx011100xxxxxxxxxx", AInstEmit.Sabdl_V, typeof(AOpCodeSimdReg));
|
SetA64("0x001110<<1xxxxx011100xxxxxxxxxx", AInstEmit.Sabdl_V, typeof(AOpCodeSimdReg));
|
||||||
|
SetA64("0x001110<<100000011010xxxxxxxxxx", AInstEmit.Sadalp_V, typeof(AOpCodeSimd));
|
||||||
|
SetA64("0x001110<<100000001010xxxxxxxxxx", AInstEmit.Saddlp_V, typeof(AOpCodeSimd));
|
||||||
SetA64("0x001110<<1xxxxx000100xxxxxxxxxx", AInstEmit.Saddw_V, typeof(AOpCodeSimdReg));
|
SetA64("0x001110<<1xxxxx000100xxxxxxxxxx", AInstEmit.Saddw_V, typeof(AOpCodeSimdReg));
|
||||||
SetA64("x0011110xx100010000000xxxxxxxxxx", AInstEmit.Scvtf_Gp, typeof(AOpCodeSimdCvt));
|
SetA64("x0011110xx100010000000xxxxxxxxxx", AInstEmit.Scvtf_Gp, typeof(AOpCodeSimdCvt));
|
||||||
SetA64("010111100x100001110110xxxxxxxxxx", AInstEmit.Scvtf_S, typeof(AOpCodeSimd));
|
SetA64("010111100x100001110110xxxxxxxxxx", AInstEmit.Scvtf_S, typeof(AOpCodeSimd));
|
||||||
|
@ -429,7 +431,9 @@ namespace ChocolArm64
|
||||||
SetA64("0x101110<<1xxxxx010100xxxxxxxxxx", AInstEmit.Uabal_V, typeof(AOpCodeSimdReg));
|
SetA64("0x101110<<1xxxxx010100xxxxxxxxxx", AInstEmit.Uabal_V, typeof(AOpCodeSimdReg));
|
||||||
SetA64("0x101110<<1xxxxx011101xxxxxxxxxx", AInstEmit.Uabd_V, typeof(AOpCodeSimdReg));
|
SetA64("0x101110<<1xxxxx011101xxxxxxxxxx", AInstEmit.Uabd_V, typeof(AOpCodeSimdReg));
|
||||||
SetA64("0x101110<<1xxxxx011100xxxxxxxxxx", AInstEmit.Uabdl_V, typeof(AOpCodeSimdReg));
|
SetA64("0x101110<<1xxxxx011100xxxxxxxxxx", AInstEmit.Uabdl_V, typeof(AOpCodeSimdReg));
|
||||||
|
SetA64("0x101110<<100000011010xxxxxxxxxx", AInstEmit.Uadalp_V, typeof(AOpCodeSimd));
|
||||||
SetA64("0x101110<<1xxxxx000000xxxxxxxxxx", AInstEmit.Uaddl_V, typeof(AOpCodeSimdReg));
|
SetA64("0x101110<<1xxxxx000000xxxxxxxxxx", AInstEmit.Uaddl_V, typeof(AOpCodeSimdReg));
|
||||||
|
SetA64("0x101110<<100000001010xxxxxxxxxx", AInstEmit.Uaddlp_V, typeof(AOpCodeSimd));
|
||||||
SetA64("001011100x110000001110xxxxxxxxxx", AInstEmit.Uaddlv_V, typeof(AOpCodeSimd));
|
SetA64("001011100x110000001110xxxxxxxxxx", AInstEmit.Uaddlv_V, typeof(AOpCodeSimd));
|
||||||
SetA64("01101110<<110000001110xxxxxxxxxx", AInstEmit.Uaddlv_V, typeof(AOpCodeSimd));
|
SetA64("01101110<<110000001110xxxxxxxxxx", AInstEmit.Uaddlv_V, typeof(AOpCodeSimd));
|
||||||
SetA64("0x101110<<1xxxxx000100xxxxxxxxxx", AInstEmit.Uaddw_V, typeof(AOpCodeSimdReg));
|
SetA64("0x101110<<1xxxxx000100xxxxxxxxxx", AInstEmit.Uaddw_V, typeof(AOpCodeSimdReg));
|
||||||
|
|
|
@ -158,6 +158,41 @@ namespace ChocolArm64.Instruction
|
||||||
Context.MarkLabel(LblTrue);
|
Context.MarkLabel(LblTrue);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
private static void EmitAddLongPairwise(AILEmitterCtx Context, bool Signed, bool Accumulate)
|
||||||
|
{
|
||||||
|
AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
|
||||||
|
|
||||||
|
int Words = Op.GetBitsCount() >> 4;
|
||||||
|
int Pairs = Words >> Op.Size;
|
||||||
|
|
||||||
|
for (int Index = 0; Index < Pairs; Index++)
|
||||||
|
{
|
||||||
|
int Idx = Index << 1;
|
||||||
|
|
||||||
|
EmitVectorExtract(Context, Op.Rn, Idx, Op.Size, Signed);
|
||||||
|
EmitVectorExtract(Context, Op.Rn, Idx + 1, Op.Size, Signed);
|
||||||
|
|
||||||
|
Context.Emit(OpCodes.Add);
|
||||||
|
|
||||||
|
if (Accumulate)
|
||||||
|
{
|
||||||
|
EmitVectorExtract(Context, Op.Rd, Index, Op.Size + 1, Signed);
|
||||||
|
|
||||||
|
Context.Emit(OpCodes.Add);
|
||||||
|
}
|
||||||
|
|
||||||
|
EmitVectorInsertTmp(Context, Index, Op.Size + 1);
|
||||||
|
}
|
||||||
|
|
||||||
|
Context.EmitLdvectmp();
|
||||||
|
Context.EmitStvec(Op.Rd);
|
||||||
|
|
||||||
|
if (Op.RegisterSize == ARegisterSize.SIMD64)
|
||||||
|
{
|
||||||
|
EmitVectorZeroUpper(Context, Op.Rd);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
private static void EmitDoublingMultiplyHighHalf(AILEmitterCtx Context, bool Round)
|
private static void EmitDoublingMultiplyHighHalf(AILEmitterCtx Context, bool Round)
|
||||||
{
|
{
|
||||||
AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
|
AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
|
||||||
|
@ -992,6 +1027,16 @@ namespace ChocolArm64.Instruction
|
||||||
});
|
});
|
||||||
}
|
}
|
||||||
|
|
||||||
|
public static void Sadalp_V(AILEmitterCtx Context)
|
||||||
|
{
|
||||||
|
EmitAddLongPairwise(Context, Signed: true, Accumulate: true);
|
||||||
|
}
|
||||||
|
|
||||||
|
public static void Saddlp_V(AILEmitterCtx Context)
|
||||||
|
{
|
||||||
|
EmitAddLongPairwise(Context, Signed: true, Accumulate: false);
|
||||||
|
}
|
||||||
|
|
||||||
public static void Saddw_V(AILEmitterCtx Context)
|
public static void Saddw_V(AILEmitterCtx Context)
|
||||||
{
|
{
|
||||||
EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
|
EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
|
||||||
|
@ -1213,11 +1258,21 @@ namespace ChocolArm64.Instruction
|
||||||
});
|
});
|
||||||
}
|
}
|
||||||
|
|
||||||
|
public static void Uadalp_V(AILEmitterCtx Context)
|
||||||
|
{
|
||||||
|
EmitAddLongPairwise(Context, Signed: false, Accumulate: true);
|
||||||
|
}
|
||||||
|
|
||||||
public static void Uaddl_V(AILEmitterCtx Context)
|
public static void Uaddl_V(AILEmitterCtx Context)
|
||||||
{
|
{
|
||||||
EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
|
EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
|
||||||
}
|
}
|
||||||
|
|
||||||
|
public static void Uaddlp_V(AILEmitterCtx Context)
|
||||||
|
{
|
||||||
|
EmitAddLongPairwise(Context, Signed: false, Accumulate: false);
|
||||||
|
}
|
||||||
|
|
||||||
public static void Uaddlv_V(AILEmitterCtx Context)
|
public static void Uaddlv_V(AILEmitterCtx Context)
|
||||||
{
|
{
|
||||||
AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
|
AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
|
||||||
|
|
|
@ -1,3 +1,4 @@
|
||||||
|
using System;
|
||||||
using System.Collections.Generic;
|
using System.Collections.Generic;
|
||||||
|
|
||||||
namespace Ryujinx.Graphics.Gal.Shader
|
namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
@ -19,7 +20,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
public const int PositionOutAttrLocation = 15;
|
public const int PositionOutAttrLocation = 15;
|
||||||
|
|
||||||
private const int AttrStartIndex = 8;
|
private const int AttrStartIndex = 8;
|
||||||
private const int TexStartIndex = 8;
|
private const int TexStartIndex = 8;
|
||||||
|
|
||||||
public const string PositionOutAttrName = "position";
|
public const string PositionOutAttrName = "position";
|
||||||
|
|
||||||
|
@ -46,6 +47,8 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
private string StagePrefix;
|
private string StagePrefix;
|
||||||
|
|
||||||
|
private Dictionary<ShaderIrOp, ShaderDeclInfo> m_CbTextures;
|
||||||
|
|
||||||
private Dictionary<int, ShaderDeclInfo> m_Textures;
|
private Dictionary<int, ShaderDeclInfo> m_Textures;
|
||||||
private Dictionary<int, ShaderDeclInfo> m_Uniforms;
|
private Dictionary<int, ShaderDeclInfo> m_Uniforms;
|
||||||
|
|
||||||
|
@ -56,6 +59,8 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
private Dictionary<int, ShaderDeclInfo> m_Gprs;
|
private Dictionary<int, ShaderDeclInfo> m_Gprs;
|
||||||
private Dictionary<int, ShaderDeclInfo> m_Preds;
|
private Dictionary<int, ShaderDeclInfo> m_Preds;
|
||||||
|
|
||||||
|
public IReadOnlyDictionary<ShaderIrOp, ShaderDeclInfo> CbTextures => m_CbTextures;
|
||||||
|
|
||||||
public IReadOnlyDictionary<int, ShaderDeclInfo> Textures => m_Textures;
|
public IReadOnlyDictionary<int, ShaderDeclInfo> Textures => m_Textures;
|
||||||
public IReadOnlyDictionary<int, ShaderDeclInfo> Uniforms => m_Uniforms;
|
public IReadOnlyDictionary<int, ShaderDeclInfo> Uniforms => m_Uniforms;
|
||||||
|
|
||||||
|
@ -72,8 +77,10 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
{
|
{
|
||||||
this.ShaderType = ShaderType;
|
this.ShaderType = ShaderType;
|
||||||
|
|
||||||
m_Uniforms = new Dictionary<int, ShaderDeclInfo>();
|
m_CbTextures = new Dictionary<ShaderIrOp, ShaderDeclInfo>();
|
||||||
|
|
||||||
m_Textures = new Dictionary<int, ShaderDeclInfo>();
|
m_Textures = new Dictionary<int, ShaderDeclInfo>();
|
||||||
|
m_Uniforms = new Dictionary<int, ShaderDeclInfo>();
|
||||||
|
|
||||||
m_Attributes = new Dictionary<int, ShaderDeclInfo>();
|
m_Attributes = new Dictionary<int, ShaderDeclInfo>();
|
||||||
m_InAttributes = new Dictionary<int, ShaderDeclInfo>();
|
m_InAttributes = new Dictionary<int, ShaderDeclInfo>();
|
||||||
|
@ -89,14 +96,16 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
if (ShaderType == GalShaderType.Fragment)
|
if (ShaderType == GalShaderType.Fragment)
|
||||||
{
|
{
|
||||||
m_Gprs.Add(0, new ShaderDeclInfo(FragmentOutputName, 0, 0, 4));
|
m_Gprs.Add(0, new ShaderDeclInfo(FragmentOutputName, 0, false, 0, 4));
|
||||||
}
|
}
|
||||||
|
|
||||||
foreach (ShaderIrBlock Block in Blocks)
|
foreach (ShaderIrBlock Block in Blocks)
|
||||||
{
|
{
|
||||||
foreach (ShaderIrNode Node in Block.GetNodes())
|
ShaderIrNode[] Nodes = Block.GetNodes();
|
||||||
|
|
||||||
|
foreach (ShaderIrNode Node in Nodes)
|
||||||
{
|
{
|
||||||
Traverse(null, Node);
|
Traverse(Nodes, null, Node);
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
@ -152,31 +161,31 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
private void Traverse(ShaderIrNode Parent, ShaderIrNode Node)
|
private void Traverse(ShaderIrNode[] Nodes, ShaderIrNode Parent, ShaderIrNode Node)
|
||||||
{
|
{
|
||||||
switch (Node)
|
switch (Node)
|
||||||
{
|
{
|
||||||
case ShaderIrAsg Asg:
|
case ShaderIrAsg Asg:
|
||||||
{
|
{
|
||||||
Traverse(Asg, Asg.Dst);
|
Traverse(Nodes, Asg, Asg.Dst);
|
||||||
Traverse(Asg, Asg.Src);
|
Traverse(Nodes, Asg, Asg.Src);
|
||||||
|
|
||||||
break;
|
break;
|
||||||
}
|
}
|
||||||
|
|
||||||
case ShaderIrCond Cond:
|
case ShaderIrCond Cond:
|
||||||
{
|
{
|
||||||
Traverse(Cond, Cond.Pred);
|
Traverse(Nodes, Cond, Cond.Pred);
|
||||||
Traverse(Cond, Cond.Child);
|
Traverse(Nodes, Cond, Cond.Child);
|
||||||
|
|
||||||
break;
|
break;
|
||||||
}
|
}
|
||||||
|
|
||||||
case ShaderIrOp Op:
|
case ShaderIrOp Op:
|
||||||
{
|
{
|
||||||
Traverse(Op, Op.OperandA);
|
Traverse(Nodes, Op, Op.OperandA);
|
||||||
Traverse(Op, Op.OperandB);
|
Traverse(Nodes, Op, Op.OperandB);
|
||||||
Traverse(Op, Op.OperandC);
|
Traverse(Nodes, Op, Op.OperandC);
|
||||||
|
|
||||||
if (Op.Inst == ShaderIrInst.Texq ||
|
if (Op.Inst == ShaderIrInst.Texq ||
|
||||||
Op.Inst == ShaderIrInst.Texs ||
|
Op.Inst == ShaderIrInst.Texs ||
|
||||||
|
@ -190,6 +199,38 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
m_Textures.TryAdd(Handle, new ShaderDeclInfo(Name, Handle));
|
m_Textures.TryAdd(Handle, new ShaderDeclInfo(Name, Handle));
|
||||||
}
|
}
|
||||||
|
else if (Op.Inst == ShaderIrInst.Texb)
|
||||||
|
{
|
||||||
|
ShaderIrNode HandleSrc = null;
|
||||||
|
|
||||||
|
int Index = Array.IndexOf(Nodes, Parent) - 1;
|
||||||
|
|
||||||
|
for (; Index >= 0; Index--)
|
||||||
|
{
|
||||||
|
ShaderIrNode Curr = Nodes[Index];
|
||||||
|
|
||||||
|
if (Curr is ShaderIrAsg Asg && Asg.Dst is ShaderIrOperGpr Gpr)
|
||||||
|
{
|
||||||
|
if (Gpr.Index == ((ShaderIrOperGpr)Op.OperandC).Index)
|
||||||
|
{
|
||||||
|
HandleSrc = Asg.Src;
|
||||||
|
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
if (HandleSrc != null && HandleSrc is ShaderIrOperCbuf Cbuf)
|
||||||
|
{
|
||||||
|
string Name = StagePrefix + TextureName + "_cb" + Cbuf.Index + "_" + Cbuf.Pos;
|
||||||
|
|
||||||
|
m_CbTextures.Add(Op, new ShaderDeclInfo(Name, Cbuf.Pos, true, Cbuf.Index));
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
throw new NotImplementedException("Shader TEX.B instruction is not fully supported!");
|
||||||
|
}
|
||||||
|
}
|
||||||
break;
|
break;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@ -199,7 +240,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
{
|
{
|
||||||
string Name = StagePrefix + UniformName + Cbuf.Index;
|
string Name = StagePrefix + UniformName + Cbuf.Index;
|
||||||
|
|
||||||
ShaderDeclInfo DeclInfo = new ShaderDeclInfo(Name, Cbuf.Pos, Cbuf.Index);
|
ShaderDeclInfo DeclInfo = new ShaderDeclInfo(Name, Cbuf.Pos, true, Cbuf.Index);
|
||||||
|
|
||||||
m_Uniforms.Add(Cbuf.Index, DeclInfo);
|
m_Uniforms.Add(Cbuf.Index, DeclInfo);
|
||||||
}
|
}
|
||||||
|
@ -252,12 +293,13 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
if (!m_Attributes.ContainsKey(Index))
|
if (!m_Attributes.ContainsKey(Index))
|
||||||
{
|
{
|
||||||
DeclInfo = new ShaderDeclInfo(AttrName + GlslIndex, GlslIndex, 0, 4);
|
DeclInfo = new ShaderDeclInfo(AttrName + GlslIndex, GlslIndex, false, 0, 4);
|
||||||
|
|
||||||
m_Attributes.Add(Index, DeclInfo);
|
m_Attributes.Add(Index, DeclInfo);
|
||||||
}
|
}
|
||||||
|
|
||||||
Traverse(Abuf, Abuf.Vertex);
|
Traverse(Nodes, Abuf, Abuf.Vertex);
|
||||||
|
|
||||||
break;
|
break;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
|
@ -98,6 +98,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
{ ShaderIrInst.Or, GetOrExpr },
|
{ ShaderIrInst.Or, GetOrExpr },
|
||||||
{ ShaderIrInst.Stof, GetStofExpr },
|
{ ShaderIrInst.Stof, GetStofExpr },
|
||||||
{ ShaderIrInst.Sub, GetSubExpr },
|
{ ShaderIrInst.Sub, GetSubExpr },
|
||||||
|
{ ShaderIrInst.Texb, GetTexbExpr },
|
||||||
{ ShaderIrInst.Texq, GetTexqExpr },
|
{ ShaderIrInst.Texq, GetTexqExpr },
|
||||||
{ ShaderIrInst.Texs, GetTexsExpr },
|
{ ShaderIrInst.Texs, GetTexsExpr },
|
||||||
{ ShaderIrInst.Trunc, GetTruncExpr },
|
{ ShaderIrInst.Trunc, GetTruncExpr },
|
||||||
|
@ -174,10 +175,12 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
string GlslCode = SB.ToString();
|
string GlslCode = SB.ToString();
|
||||||
|
|
||||||
return new GlslProgram(
|
List<ShaderDeclInfo> TextureInfo = new List<ShaderDeclInfo>();
|
||||||
GlslCode,
|
|
||||||
Decl.Textures.Values,
|
TextureInfo.AddRange(Decl.Textures.Values);
|
||||||
Decl.Uniforms.Values);
|
TextureInfo.AddRange(IterateCbTextures());
|
||||||
|
|
||||||
|
return new GlslProgram(GlslCode, TextureInfo, Decl.Uniforms.Values);
|
||||||
}
|
}
|
||||||
|
|
||||||
private void PrintDeclHeader()
|
private void PrintDeclHeader()
|
||||||
|
@ -213,9 +216,27 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
private void PrintDeclTextures()
|
private void PrintDeclTextures()
|
||||||
{
|
{
|
||||||
|
foreach (ShaderDeclInfo DeclInfo in IterateCbTextures())
|
||||||
|
{
|
||||||
|
SB.AppendLine("uniform sampler2D " + DeclInfo.Name + ";");
|
||||||
|
}
|
||||||
|
|
||||||
PrintDecls(Decl.Textures, "uniform sampler2D");
|
PrintDecls(Decl.Textures, "uniform sampler2D");
|
||||||
}
|
}
|
||||||
|
|
||||||
|
private IEnumerable<ShaderDeclInfo> IterateCbTextures()
|
||||||
|
{
|
||||||
|
HashSet<string> Names = new HashSet<string>();
|
||||||
|
|
||||||
|
foreach (ShaderDeclInfo DeclInfo in Decl.CbTextures.Values.OrderBy(DeclKeySelector))
|
||||||
|
{
|
||||||
|
if (Names.Add(DeclInfo.Name))
|
||||||
|
{
|
||||||
|
yield return DeclInfo;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
private void PrintDeclUniforms()
|
private void PrintDeclUniforms()
|
||||||
{
|
{
|
||||||
if (Decl.ShaderType == GalShaderType.Vertex)
|
if (Decl.ShaderType == GalShaderType.Vertex)
|
||||||
|
@ -994,6 +1015,22 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
private string GetSubExpr(ShaderIrOp Op) => GetBinaryExpr(Op, "-");
|
private string GetSubExpr(ShaderIrOp Op) => GetBinaryExpr(Op, "-");
|
||||||
|
|
||||||
|
private string GetTexbExpr(ShaderIrOp Op)
|
||||||
|
{
|
||||||
|
ShaderIrMetaTex Meta = (ShaderIrMetaTex)Op.MetaData;
|
||||||
|
|
||||||
|
if (!Decl.CbTextures.TryGetValue(Op, out ShaderDeclInfo DeclInfo))
|
||||||
|
{
|
||||||
|
throw new InvalidOperationException();
|
||||||
|
}
|
||||||
|
|
||||||
|
string Coords = GetTexSamplerCoords(Op);
|
||||||
|
|
||||||
|
string Ch = "rgba".Substring(Meta.Elem, 1);
|
||||||
|
|
||||||
|
return "texture(" + DeclInfo.Name + ", " + Coords + ")." + Ch;
|
||||||
|
}
|
||||||
|
|
||||||
private string GetTexqExpr(ShaderIrOp Op)
|
private string GetTexqExpr(ShaderIrOp Op)
|
||||||
{
|
{
|
||||||
ShaderIrMetaTexq Meta = (ShaderIrMetaTexq)Op.MetaData;
|
ShaderIrMetaTexq Meta = (ShaderIrMetaTexq)Op.MetaData;
|
||||||
|
|
|
@ -23,12 +23,12 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
public static void Fadd_C(ShaderIrBlock Block, long OpCode)
|
public static void Fadd_C(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitAluBinaryF(Block, OpCode, ShaderOper.CR, ShaderIrInst.Fadd);
|
EmitFadd(Block, OpCode, ShaderOper.CR);
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Fadd_I(ShaderIrBlock Block, long OpCode)
|
public static void Fadd_I(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitAluBinaryF(Block, OpCode, ShaderOper.Immf, ShaderIrInst.Fadd);
|
EmitFadd(Block, OpCode, ShaderOper.Immf);
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Fadd_I32(ShaderIrBlock Block, long OpCode)
|
public static void Fadd_I32(ShaderIrBlock Block, long OpCode)
|
||||||
|
@ -51,7 +51,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
public static void Fadd_R(ShaderIrBlock Block, long OpCode)
|
public static void Fadd_R(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitAluBinaryF(Block, OpCode, ShaderOper.RR, ShaderIrInst.Fadd);
|
EmitFadd(Block, OpCode, ShaderOper.RR);
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Ffma_CR(ShaderIrBlock Block, long OpCode)
|
public static void Ffma_CR(ShaderIrBlock Block, long OpCode)
|
||||||
|
@ -101,17 +101,17 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
public static void Fmul_C(ShaderIrBlock Block, long OpCode)
|
public static void Fmul_C(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitAluBinaryF(Block, OpCode, ShaderOper.CR, ShaderIrInst.Fmul);
|
EmitFmul(Block, OpCode, ShaderOper.CR);
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Fmul_I(ShaderIrBlock Block, long OpCode)
|
public static void Fmul_I(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitAluBinaryF(Block, OpCode, ShaderOper.Immf, ShaderIrInst.Fmul);
|
EmitFmul(Block, OpCode, ShaderOper.Immf);
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Fmul_R(ShaderIrBlock Block, long OpCode)
|
public static void Fmul_R(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitAluBinaryF(Block, OpCode, ShaderOper.RR, ShaderIrInst.Fmul);
|
EmitFmul(Block, OpCode, ShaderOper.RR);
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Fset_C(ShaderIrBlock Block, long OpCode)
|
public static void Fset_C(ShaderIrBlock Block, long OpCode)
|
||||||
|
@ -519,40 +519,6 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
Block.AddNode(GetPredNode(new ShaderIrAsg(GetOperGpr0(OpCode), Op), OpCode));
|
Block.AddNode(GetPredNode(new ShaderIrAsg(GetOperGpr0(OpCode), Op), OpCode));
|
||||||
}
|
}
|
||||||
|
|
||||||
private static void EmitAluBinaryF(
|
|
||||||
ShaderIrBlock Block,
|
|
||||||
long OpCode,
|
|
||||||
ShaderOper Oper,
|
|
||||||
ShaderIrInst Inst)
|
|
||||||
{
|
|
||||||
bool NegB = ((OpCode >> 45) & 1) != 0;
|
|
||||||
bool AbsA = ((OpCode >> 46) & 1) != 0;
|
|
||||||
bool NegA = ((OpCode >> 48) & 1) != 0;
|
|
||||||
bool AbsB = ((OpCode >> 49) & 1) != 0;
|
|
||||||
|
|
||||||
ShaderIrNode OperA = GetOperGpr8(OpCode), OperB;
|
|
||||||
|
|
||||||
if (Inst == ShaderIrInst.Fadd)
|
|
||||||
{
|
|
||||||
OperA = GetAluFabsFneg(OperA, AbsA, NegA);
|
|
||||||
}
|
|
||||||
|
|
||||||
switch (Oper)
|
|
||||||
{
|
|
||||||
case ShaderOper.CR: OperB = GetOperCbuf34 (OpCode); break;
|
|
||||||
case ShaderOper.Immf: OperB = GetOperImmf19_20(OpCode); break;
|
|
||||||
case ShaderOper.RR: OperB = GetOperGpr20 (OpCode); break;
|
|
||||||
|
|
||||||
default: throw new ArgumentException(nameof(Oper));
|
|
||||||
}
|
|
||||||
|
|
||||||
OperB = GetAluFabsFneg(OperB, AbsB, NegB);
|
|
||||||
|
|
||||||
ShaderIrNode Op = new ShaderIrOp(Inst, OperA, OperB);
|
|
||||||
|
|
||||||
Block.AddNode(GetPredNode(new ShaderIrAsg(GetOperGpr0(OpCode), Op), OpCode));
|
|
||||||
}
|
|
||||||
|
|
||||||
private static void EmitBfe(ShaderIrBlock Block, long OpCode, ShaderOper Oper)
|
private static void EmitBfe(ShaderIrBlock Block, long OpCode, ShaderOper Oper)
|
||||||
{
|
{
|
||||||
//TODO: Handle the case where position + length
|
//TODO: Handle the case where position + length
|
||||||
|
@ -609,6 +575,55 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
Block.AddNode(GetPredNode(new ShaderIrAsg(GetOperGpr0(OpCode), Op), OpCode));
|
Block.AddNode(GetPredNode(new ShaderIrAsg(GetOperGpr0(OpCode), Op), OpCode));
|
||||||
}
|
}
|
||||||
|
|
||||||
|
private static void EmitFadd(ShaderIrBlock Block, long OpCode, ShaderOper Oper)
|
||||||
|
{
|
||||||
|
bool NegB = ((OpCode >> 45) & 1) != 0;
|
||||||
|
bool AbsA = ((OpCode >> 46) & 1) != 0;
|
||||||
|
bool NegA = ((OpCode >> 48) & 1) != 0;
|
||||||
|
bool AbsB = ((OpCode >> 49) & 1) != 0;
|
||||||
|
|
||||||
|
ShaderIrNode OperA = GetOperGpr8(OpCode), OperB;
|
||||||
|
|
||||||
|
OperA = GetAluFabsFneg(OperA, AbsA, NegA);
|
||||||
|
|
||||||
|
switch (Oper)
|
||||||
|
{
|
||||||
|
case ShaderOper.CR: OperB = GetOperCbuf34 (OpCode); break;
|
||||||
|
case ShaderOper.Immf: OperB = GetOperImmf19_20(OpCode); break;
|
||||||
|
case ShaderOper.RR: OperB = GetOperGpr20 (OpCode); break;
|
||||||
|
|
||||||
|
default: throw new ArgumentException(nameof(Oper));
|
||||||
|
}
|
||||||
|
|
||||||
|
OperB = GetAluFabsFneg(OperB, AbsB, NegB);
|
||||||
|
|
||||||
|
ShaderIrNode Op = new ShaderIrOp(ShaderIrInst.Fadd, OperA, OperB);
|
||||||
|
|
||||||
|
Block.AddNode(GetPredNode(new ShaderIrAsg(GetOperGpr0(OpCode), Op), OpCode));
|
||||||
|
}
|
||||||
|
|
||||||
|
private static void EmitFmul(ShaderIrBlock Block, long OpCode, ShaderOper Oper)
|
||||||
|
{
|
||||||
|
bool NegB = ((OpCode >> 48) & 1) != 0;
|
||||||
|
|
||||||
|
ShaderIrNode OperA = GetOperGpr8(OpCode), OperB;
|
||||||
|
|
||||||
|
switch (Oper)
|
||||||
|
{
|
||||||
|
case ShaderOper.CR: OperB = GetOperCbuf34 (OpCode); break;
|
||||||
|
case ShaderOper.Immf: OperB = GetOperImmf19_20(OpCode); break;
|
||||||
|
case ShaderOper.RR: OperB = GetOperGpr20 (OpCode); break;
|
||||||
|
|
||||||
|
default: throw new ArgumentException(nameof(Oper));
|
||||||
|
}
|
||||||
|
|
||||||
|
OperB = GetAluFneg(OperB, NegB);
|
||||||
|
|
||||||
|
ShaderIrNode Op = new ShaderIrOp(ShaderIrInst.Fmul, OperA, OperB);
|
||||||
|
|
||||||
|
Block.AddNode(GetPredNode(new ShaderIrAsg(GetOperGpr0(OpCode), Op), OpCode));
|
||||||
|
}
|
||||||
|
|
||||||
private static void EmitFfma(ShaderIrBlock Block, long OpCode, ShaderOper Oper)
|
private static void EmitFfma(ShaderIrBlock Block, long OpCode, ShaderOper Oper)
|
||||||
{
|
{
|
||||||
bool NegB = ((OpCode >> 48) & 1) != 0;
|
bool NegB = ((OpCode >> 48) & 1) != 0;
|
||||||
|
|
|
@ -26,8 +26,8 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
private static int[,] MaskLut = new int[,]
|
private static int[,] MaskLut = new int[,]
|
||||||
{
|
{
|
||||||
{ ____, ____, ____, ____, ____, ____, ____, ____ },
|
{ ____, ____, ____, ____, ____, ____, ____, ____ },
|
||||||
{ R___, _G__, __B_, ___A, RG__, ____, ____, ____ },
|
|
||||||
{ R___, _G__, __B_, ___A, RG__, R__A, _G_A, __BA },
|
{ R___, _G__, __B_, ___A, RG__, R__A, _G_A, __BA },
|
||||||
|
{ R___, _G__, __B_, ___A, RG__, ____, ____, ____ },
|
||||||
{ RGB_, RG_A, R_BA, _GBA, RGBA, ____, ____, ____ }
|
{ RGB_, RG_A, R_BA, _GBA, RGBA, ____, ____, ____ }
|
||||||
};
|
};
|
||||||
|
|
||||||
|
@ -121,6 +121,16 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Tex(ShaderIrBlock Block, long OpCode)
|
public static void Tex(ShaderIrBlock Block, long OpCode)
|
||||||
|
{
|
||||||
|
EmitTex(Block, OpCode, GprHandle: false);
|
||||||
|
}
|
||||||
|
|
||||||
|
public static void Tex_B(ShaderIrBlock Block, long OpCode)
|
||||||
|
{
|
||||||
|
EmitTex(Block, OpCode, GprHandle: true);
|
||||||
|
}
|
||||||
|
|
||||||
|
private static void EmitTex(ShaderIrBlock Block, long OpCode, bool GprHandle)
|
||||||
{
|
{
|
||||||
//TODO: Support other formats.
|
//TODO: Support other formats.
|
||||||
ShaderIrOperGpr[] Coords = new ShaderIrOperGpr[2];
|
ShaderIrOperGpr[] Coords = new ShaderIrOperGpr[2];
|
||||||
|
@ -139,7 +149,11 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
int ChMask = (int)(OpCode >> 31) & 0xf;
|
int ChMask = (int)(OpCode >> 31) & 0xf;
|
||||||
|
|
||||||
ShaderIrNode OperC = GetOperImm13_36(OpCode);
|
ShaderIrNode OperC = GprHandle
|
||||||
|
? (ShaderIrNode)GetOperGpr20 (OpCode)
|
||||||
|
: (ShaderIrNode)GetOperImm13_36(OpCode);
|
||||||
|
|
||||||
|
ShaderIrInst Inst = GprHandle ? ShaderIrInst.Texb : ShaderIrInst.Texs;
|
||||||
|
|
||||||
for (int Ch = 0; Ch < 4; Ch++)
|
for (int Ch = 0; Ch < 4; Ch++)
|
||||||
{
|
{
|
||||||
|
@ -147,7 +161,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
ShaderIrMetaTex Meta = new ShaderIrMetaTex(Ch);
|
ShaderIrMetaTex Meta = new ShaderIrMetaTex(Ch);
|
||||||
|
|
||||||
ShaderIrOp Op = new ShaderIrOp(ShaderIrInst.Texs, Coords[0], Coords[1], OperC, Meta);
|
ShaderIrOp Op = new ShaderIrOp(Inst, Coords[0], Coords[1], OperC, Meta);
|
||||||
|
|
||||||
Block.AddNode(GetPredNode(new ShaderIrAsg(Dst, Op), OpCode));
|
Block.AddNode(GetPredNode(new ShaderIrAsg(Dst, Op), OpCode));
|
||||||
}
|
}
|
||||||
|
@ -178,15 +192,15 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
public static void Texs(ShaderIrBlock Block, long OpCode)
|
public static void Texs(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitTex(Block, OpCode, ShaderIrInst.Texs);
|
EmitTexs(Block, OpCode, ShaderIrInst.Texs);
|
||||||
}
|
}
|
||||||
|
|
||||||
public static void Tlds(ShaderIrBlock Block, long OpCode)
|
public static void Tlds(ShaderIrBlock Block, long OpCode)
|
||||||
{
|
{
|
||||||
EmitTex(Block, OpCode, ShaderIrInst.Txlf);
|
EmitTexs(Block, OpCode, ShaderIrInst.Txlf);
|
||||||
}
|
}
|
||||||
|
|
||||||
private static void EmitTex(ShaderIrBlock Block, long OpCode, ShaderIrInst Inst)
|
private static void EmitTexs(ShaderIrBlock Block, long OpCode, ShaderIrInst Inst)
|
||||||
{
|
{
|
||||||
//TODO: Support other formats.
|
//TODO: Support other formats.
|
||||||
ShaderIrNode OperA = GetOperGpr8 (OpCode);
|
ShaderIrNode OperA = GetOperGpr8 (OpCode);
|
||||||
|
@ -195,9 +209,16 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
int LutIndex;
|
int LutIndex;
|
||||||
|
|
||||||
LutIndex = GetOperGpr0(OpCode).Index != ShaderIrOperGpr.ZRIndex ? 1 : 0;
|
LutIndex = GetOperGpr0 (OpCode).Index != ShaderIrOperGpr.ZRIndex ? 1 : 0;
|
||||||
LutIndex |= GetOperGpr28(OpCode).Index != ShaderIrOperGpr.ZRIndex ? 2 : 0;
|
LutIndex |= GetOperGpr28(OpCode).Index != ShaderIrOperGpr.ZRIndex ? 2 : 0;
|
||||||
|
|
||||||
|
if (LutIndex == 0)
|
||||||
|
{
|
||||||
|
//Both registers are RZ, color is not written anywhere.
|
||||||
|
//So, the intruction is basically a no-op.
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
int ChMask = MaskLut[LutIndex, (OpCode >> 50) & 7];
|
int ChMask = MaskLut[LutIndex, (OpCode >> 50) & 7];
|
||||||
|
|
||||||
for (int Ch = 0; Ch < 4; Ch++)
|
for (int Ch = 0; Ch < 4; Ch++)
|
||||||
|
@ -213,6 +234,26 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
int RegInc = 0;
|
int RegInc = 0;
|
||||||
|
|
||||||
|
ShaderIrOperGpr GetDst()
|
||||||
|
{
|
||||||
|
ShaderIrOperGpr Dst;
|
||||||
|
|
||||||
|
switch (LutIndex)
|
||||||
|
{
|
||||||
|
case 1: Dst = GetOperGpr0 (OpCode); break;
|
||||||
|
case 2: Dst = GetOperGpr28(OpCode); break;
|
||||||
|
case 3: Dst = (RegInc >> 1) != 0
|
||||||
|
? GetOperGpr28(OpCode)
|
||||||
|
: GetOperGpr0 (OpCode); break;
|
||||||
|
|
||||||
|
default: throw new InvalidOperationException();
|
||||||
|
}
|
||||||
|
|
||||||
|
Dst.Index += RegInc++ & 1;
|
||||||
|
|
||||||
|
return Dst;
|
||||||
|
}
|
||||||
|
|
||||||
for (int Ch = 0; Ch < 4; Ch++)
|
for (int Ch = 0; Ch < 4; Ch++)
|
||||||
{
|
{
|
||||||
if (!IsChannelUsed(ChMask, Ch))
|
if (!IsChannelUsed(ChMask, Ch))
|
||||||
|
@ -222,18 +263,12 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
|
|
||||||
ShaderIrOperGpr Src = new ShaderIrOperGpr(TempRegStart + Ch);
|
ShaderIrOperGpr Src = new ShaderIrOperGpr(TempRegStart + Ch);
|
||||||
|
|
||||||
ShaderIrOperGpr Dst = (RegInc >> 1) != 0
|
ShaderIrOperGpr Dst = GetDst();
|
||||||
? GetOperGpr28(OpCode)
|
|
||||||
: GetOperGpr0 (OpCode);
|
|
||||||
|
|
||||||
Dst.Index += RegInc++ & 1;
|
if (Dst.Index != ShaderIrOperGpr.ZRIndex)
|
||||||
|
|
||||||
if (Dst.Index >= ShaderIrOperGpr.ZRIndex)
|
|
||||||
{
|
{
|
||||||
continue;
|
Block.AddNode(GetPredNode(new ShaderIrAsg(Dst, Src), OpCode));
|
||||||
}
|
}
|
||||||
|
|
||||||
Block.AddNode(GetPredNode(new ShaderIrAsg(Dst, Src), OpCode));
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
|
@ -47,6 +47,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
Ftos,
|
Ftos,
|
||||||
Ftou,
|
Ftou,
|
||||||
Ipa,
|
Ipa,
|
||||||
|
Texb,
|
||||||
Texs,
|
Texs,
|
||||||
Trunc,
|
Trunc,
|
||||||
F_End,
|
F_End,
|
||||||
|
@ -83,7 +84,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
Bra,
|
Bra,
|
||||||
Exit,
|
Exit,
|
||||||
Kil,
|
Kil,
|
||||||
|
|
||||||
Emit,
|
Emit,
|
||||||
Cut
|
Cut
|
||||||
}
|
}
|
||||||
|
|
|
@ -114,6 +114,7 @@ namespace Ryujinx.Graphics.Gal.Shader
|
||||||
Set("0101110000101x", ShaderDecode.Shr_R);
|
Set("0101110000101x", ShaderDecode.Shr_R);
|
||||||
Set("1110111111110x", ShaderDecode.St_A);
|
Set("1110111111110x", ShaderDecode.St_A);
|
||||||
Set("110000xxxx111x", ShaderDecode.Tex);
|
Set("110000xxxx111x", ShaderDecode.Tex);
|
||||||
|
Set("1101111010111x", ShaderDecode.Tex_B);
|
||||||
Set("1101111101001x", ShaderDecode.Texq);
|
Set("1101111101001x", ShaderDecode.Texq);
|
||||||
Set("1101100xxxxxxx", ShaderDecode.Texs);
|
Set("1101100xxxxxxx", ShaderDecode.Texs);
|
||||||
Set("1101101xxxxxxx", ShaderDecode.Tlds);
|
Set("1101101xxxxxxx", ShaderDecode.Tlds);
|
||||||
|
|
|
@ -4,14 +4,21 @@ namespace Ryujinx.Graphics.Gal
|
||||||
{
|
{
|
||||||
public string Name { get; private set; }
|
public string Name { get; private set; }
|
||||||
|
|
||||||
public int Index { get; private set; }
|
public int Index { get; private set; }
|
||||||
public int Cbuf { get; private set; }
|
public bool IsCb { get; private set; }
|
||||||
public int Size { get; private set; }
|
public int Cbuf { get; private set; }
|
||||||
|
public int Size { get; private set; }
|
||||||
|
|
||||||
public ShaderDeclInfo(string Name, int Index, int Cbuf = 0, int Size = 1)
|
public ShaderDeclInfo(
|
||||||
|
string Name,
|
||||||
|
int Index,
|
||||||
|
bool IsCb = false,
|
||||||
|
int Cbuf = 0,
|
||||||
|
int Size = 1)
|
||||||
{
|
{
|
||||||
this.Name = Name;
|
this.Name = Name;
|
||||||
this.Index = Index;
|
this.Index = Index;
|
||||||
|
this.IsCb = IsCb;
|
||||||
this.Cbuf = Cbuf;
|
this.Cbuf = Cbuf;
|
||||||
this.Size = Size;
|
this.Size = Size;
|
||||||
}
|
}
|
||||||
|
|
|
@ -309,7 +309,7 @@ namespace Ryujinx.HLE.Gpu.Engines
|
||||||
private void SetStencil(GalPipelineState State)
|
private void SetStencil(GalPipelineState State)
|
||||||
{
|
{
|
||||||
State.StencilTestEnabled = (ReadRegister(NvGpuEngine3dReg.StencilEnable) & 1) != 0;
|
State.StencilTestEnabled = (ReadRegister(NvGpuEngine3dReg.StencilEnable) & 1) != 0;
|
||||||
|
|
||||||
if (State.StencilTestEnabled)
|
if (State.StencilTestEnabled)
|
||||||
{
|
{
|
||||||
State.StencilBackFuncFunc = (GalComparisonOp)ReadRegister(NvGpuEngine3dReg.StencilBackFuncFunc);
|
State.StencilBackFuncFunc = (GalComparisonOp)ReadRegister(NvGpuEngine3dReg.StencilBackFuncFunc);
|
||||||
|
@ -364,17 +364,26 @@ namespace Ryujinx.HLE.Gpu.Engines
|
||||||
|
|
||||||
int TextureCbIndex = ReadRegister(NvGpuEngine3dReg.TextureCbIndex);
|
int TextureCbIndex = ReadRegister(NvGpuEngine3dReg.TextureCbIndex);
|
||||||
|
|
||||||
//Note: On the emulator renderer, Texture Unit 0 is
|
int TexIndex = 0;
|
||||||
//reserved for drawing the frame buffer.
|
|
||||||
int TexIndex = 1;
|
|
||||||
|
|
||||||
for (int Index = 0; Index < Keys.Length; Index++)
|
for (int Index = 0; Index < Keys.Length; Index++)
|
||||||
{
|
{
|
||||||
foreach (ShaderDeclInfo DeclInfo in Gpu.Renderer.Shader.GetTextureUsage(Keys[Index]))
|
foreach (ShaderDeclInfo DeclInfo in Gpu.Renderer.Shader.GetTextureUsage(Keys[Index]))
|
||||||
{
|
{
|
||||||
long Position = ConstBuffers[Index][TextureCbIndex].Position;
|
long Position;
|
||||||
|
|
||||||
UploadTexture(Vmm, Position, TexIndex, DeclInfo.Index);
|
if (DeclInfo.IsCb)
|
||||||
|
{
|
||||||
|
Position = ConstBuffers[Index][DeclInfo.Cbuf].Position;
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
Position = ConstBuffers[Index][TextureCbIndex].Position;
|
||||||
|
}
|
||||||
|
|
||||||
|
int TextureHandle = Vmm.ReadInt32(Position + DeclInfo.Index * 4);
|
||||||
|
|
||||||
|
UploadTexture(Vmm, TexIndex, TextureHandle);
|
||||||
|
|
||||||
Gpu.Renderer.Shader.EnsureTextureBinding(DeclInfo.Name, TexIndex);
|
Gpu.Renderer.Shader.EnsureTextureBinding(DeclInfo.Name, TexIndex);
|
||||||
|
|
||||||
|
@ -383,12 +392,8 @@ namespace Ryujinx.HLE.Gpu.Engines
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
private void UploadTexture(NvGpuVmm Vmm, long BasePosition, int TexIndex, int HndIndex)
|
private void UploadTexture(NvGpuVmm Vmm, int TexIndex, int TextureHandle)
|
||||||
{
|
{
|
||||||
long Position = BasePosition + HndIndex * 4;
|
|
||||||
|
|
||||||
int TextureHandle = Vmm.ReadInt32(Position);
|
|
||||||
|
|
||||||
if (TextureHandle == 0)
|
if (TextureHandle == 0)
|
||||||
{
|
{
|
||||||
//TODO: Is this correct?
|
//TODO: Is this correct?
|
||||||
|
@ -601,6 +606,10 @@ namespace Ryujinx.HLE.Gpu.Engines
|
||||||
|
|
||||||
Gpu.Renderer.Rasterizer.DrawArrays(VertexFirst, VertexCount, PrimType);
|
Gpu.Renderer.Rasterizer.DrawArrays(VertexFirst, VertexCount, PrimType);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
//Is the GPU really clearing those registers after draw?
|
||||||
|
WriteRegister(NvGpuEngine3dReg.IndexBatchFirst, 0);
|
||||||
|
WriteRegister(NvGpuEngine3dReg.IndexBatchCount, 0);
|
||||||
}
|
}
|
||||||
|
|
||||||
private void QueryControl(NvGpuVmm Vmm, NvGpuPBEntry PBEntry)
|
private void QueryControl(NvGpuVmm Vmm, NvGpuPBEntry PBEntry)
|
||||||
|
|
|
@ -233,4 +233,4 @@ namespace Ryujinx.HLE.OsHle
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
8
Ryujinx.HLE/OsHle/Profile.cs
Normal file
8
Ryujinx.HLE/OsHle/Profile.cs
Normal file
|
@ -0,0 +1,8 @@
|
||||||
|
namespace Ryujinx.HLE.OsHle
|
||||||
|
{
|
||||||
|
public struct Profile
|
||||||
|
{
|
||||||
|
public string Username;
|
||||||
|
public string UserId;
|
||||||
|
}
|
||||||
|
}
|
|
@ -1,6 +1,9 @@
|
||||||
|
using ChocolArm64.Memory;
|
||||||
using Ryujinx.HLE.Logging;
|
using Ryujinx.HLE.Logging;
|
||||||
using Ryujinx.HLE.OsHle.Ipc;
|
using Ryujinx.HLE.OsHle.Ipc;
|
||||||
|
using Ryujinx.HLE.OsHle.Utilities;
|
||||||
using System.Collections.Generic;
|
using System.Collections.Generic;
|
||||||
|
using System.Text;
|
||||||
|
|
||||||
namespace Ryujinx.HLE.OsHle.Services.Acc
|
namespace Ryujinx.HLE.OsHle.Services.Acc
|
||||||
{
|
{
|
||||||
|
@ -14,21 +17,37 @@ namespace Ryujinx.HLE.OsHle.Services.Acc
|
||||||
{
|
{
|
||||||
m_Commands = new Dictionary<int, ServiceProcessRequest>()
|
m_Commands = new Dictionary<int, ServiceProcessRequest>()
|
||||||
{
|
{
|
||||||
|
{ 0, Get },
|
||||||
{ 1, GetBase }
|
{ 1, GetBase }
|
||||||
};
|
};
|
||||||
}
|
}
|
||||||
|
|
||||||
public long GetBase(ServiceCtx Context)
|
public long Get(ServiceCtx Context)
|
||||||
{
|
{
|
||||||
Context.Ns.Log.PrintStub(LogClass.ServiceAcc, "Stubbed.");
|
Context.Ns.Log.PrintStub(LogClass.ServiceAcc, "Stubbed.");
|
||||||
|
|
||||||
Context.ResponseData.Write(0L);
|
long Position = Context.Request.ReceiveBuff[0].Position;
|
||||||
Context.ResponseData.Write(0L);
|
|
||||||
Context.ResponseData.Write(0L);
|
AMemoryHelper.FillWithZeros(Context.Memory, Position, 0x80);
|
||||||
Context.ResponseData.Write(0L);
|
|
||||||
Context.ResponseData.Write(0L);
|
Context.Memory.WriteInt32(Position, 0);
|
||||||
Context.ResponseData.Write(0L);
|
Context.Memory.WriteInt32(Position + 4, 1);
|
||||||
Context.ResponseData.Write(0L);
|
Context.Memory.WriteByte(Position + 8, 1);
|
||||||
|
|
||||||
|
return GetBase(Context);
|
||||||
|
}
|
||||||
|
|
||||||
|
public long GetBase(ServiceCtx Context)
|
||||||
|
{
|
||||||
|
ProfileBase ProfileBase = new ProfileBase(Context.Ns.Settings.User);
|
||||||
|
|
||||||
|
Context.ResponseData.Write(ProfileBase.UserId.ToBytes());
|
||||||
|
Context.ResponseData.Write(ProfileBase.Timestamp);
|
||||||
|
|
||||||
|
int ByteCount = Encoding.UTF8.GetByteCount(ProfileBase.Username);
|
||||||
|
byte[] Username = StringUtils.GetFixedLengthBytes(ProfileBase.Username, 0x20, Encoding.UTF8);
|
||||||
|
|
||||||
|
Context.ResponseData.Write(Username);
|
||||||
|
|
||||||
return 0;
|
return 0;
|
||||||
}
|
}
|
||||||
|
|
52
Ryujinx.HLE/OsHle/Services/Acc/ProfileBase.cs
Normal file
52
Ryujinx.HLE/OsHle/Services/Acc/ProfileBase.cs
Normal file
|
@ -0,0 +1,52 @@
|
||||||
|
using Ryujinx.HLE.OsHle.Utilities;
|
||||||
|
using System;
|
||||||
|
using System.Linq;
|
||||||
|
|
||||||
|
namespace Ryujinx.HLE.OsHle.Services.Acc
|
||||||
|
{
|
||||||
|
struct ProfileBase
|
||||||
|
{
|
||||||
|
public UserId UserId;
|
||||||
|
public long Timestamp;
|
||||||
|
public string Username;
|
||||||
|
|
||||||
|
public ProfileBase(Profile User)
|
||||||
|
{
|
||||||
|
UserId = new UserId(User.UserId);
|
||||||
|
Username = User.Username;
|
||||||
|
Timestamp = ((DateTimeOffset)DateTime.Today).ToUnixTimeSeconds();
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
struct UserId
|
||||||
|
{
|
||||||
|
private readonly ulong LowBytes;
|
||||||
|
private readonly ulong HighBytes;
|
||||||
|
|
||||||
|
public UserId(string UserIdHex)
|
||||||
|
{
|
||||||
|
if (UserIdHex == null || UserIdHex.Length != 32 || !UserIdHex.All("0123456789abcdefABCDEF".Contains))
|
||||||
|
{
|
||||||
|
throw new ArgumentException("UserId is not a valid Hex string", "UserIdHex");
|
||||||
|
}
|
||||||
|
|
||||||
|
byte[] HexBytes = StringUtils.HexToBytes(UserIdHex);
|
||||||
|
|
||||||
|
LowBytes = BitConverter.ToUInt64(HexBytes, 8);
|
||||||
|
|
||||||
|
Array.Resize(ref HexBytes, 8);
|
||||||
|
|
||||||
|
HighBytes = BitConverter.ToUInt64(HexBytes, 0);
|
||||||
|
}
|
||||||
|
|
||||||
|
public byte[] ToBytes()
|
||||||
|
{
|
||||||
|
return BitConverter.GetBytes(HighBytes).Concat(BitConverter.GetBytes(LowBytes)).ToArray();
|
||||||
|
}
|
||||||
|
|
||||||
|
public override string ToString()
|
||||||
|
{
|
||||||
|
return BitConverter.ToString(ToBytes()).ToLower().Replace("-", string.Empty);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
|
@ -1,14 +1,18 @@
|
||||||
using Ryujinx.HLE.Input;
|
using Ryujinx.HLE.Input;
|
||||||
using Ryujinx.HLE.Logging;
|
using Ryujinx.HLE.Logging;
|
||||||
using Ryujinx.HLE.OsHle.Ipc;
|
using Ryujinx.HLE.OsHle.Ipc;
|
||||||
|
using Ryujinx.HLE.OsHle.Handles;
|
||||||
|
using System;
|
||||||
using System.Collections.Generic;
|
using System.Collections.Generic;
|
||||||
|
|
||||||
namespace Ryujinx.HLE.OsHle.Services.Hid
|
namespace Ryujinx.HLE.OsHle.Services.Hid
|
||||||
{
|
{
|
||||||
class IHidServer : IpcService
|
class IHidServer : IpcService, IDisposable
|
||||||
{
|
{
|
||||||
private Dictionary<int, ServiceProcessRequest> m_Commands;
|
private Dictionary<int, ServiceProcessRequest> m_Commands;
|
||||||
|
|
||||||
|
private KEvent NpadStyleSetUpdateEvent;
|
||||||
|
|
||||||
public override IReadOnlyDictionary<int, ServiceProcessRequest> Commands => m_Commands;
|
public override IReadOnlyDictionary<int, ServiceProcessRequest> Commands => m_Commands;
|
||||||
|
|
||||||
public IHidServer()
|
public IHidServer()
|
||||||
|
@ -26,6 +30,7 @@ namespace Ryujinx.HLE.OsHle.Services.Hid
|
||||||
{ 101, GetSupportedNpadStyleSet },
|
{ 101, GetSupportedNpadStyleSet },
|
||||||
{ 102, SetSupportedNpadIdType },
|
{ 102, SetSupportedNpadIdType },
|
||||||
{ 103, ActivateNpad },
|
{ 103, ActivateNpad },
|
||||||
|
{ 106, AcquireNpadStyleSetUpdateEventHandle },
|
||||||
{ 108, GetPlayerLedPattern },
|
{ 108, GetPlayerLedPattern },
|
||||||
{ 120, SetNpadJoyHoldType },
|
{ 120, SetNpadJoyHoldType },
|
||||||
{ 121, GetNpadJoyHoldType },
|
{ 121, GetNpadJoyHoldType },
|
||||||
|
@ -39,6 +44,8 @@ namespace Ryujinx.HLE.OsHle.Services.Hid
|
||||||
{ 203, CreateActiveVibrationDeviceList },
|
{ 203, CreateActiveVibrationDeviceList },
|
||||||
{ 206, SendVibrationValues }
|
{ 206, SendVibrationValues }
|
||||||
};
|
};
|
||||||
|
|
||||||
|
NpadStyleSetUpdateEvent = new KEvent();
|
||||||
}
|
}
|
||||||
|
|
||||||
public long CreateAppletResource(ServiceCtx Context)
|
public long CreateAppletResource(ServiceCtx Context)
|
||||||
|
@ -104,6 +111,15 @@ namespace Ryujinx.HLE.OsHle.Services.Hid
|
||||||
return 0;
|
return 0;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
public long AcquireNpadStyleSetUpdateEventHandle(ServiceCtx Context)
|
||||||
|
{
|
||||||
|
int Handle = Context.Process.HandleTable.OpenHandle(NpadStyleSetUpdateEvent);
|
||||||
|
|
||||||
|
Context.Response.HandleDesc = IpcHandleDesc.MakeCopy(Handle);
|
||||||
|
|
||||||
|
return 0;
|
||||||
|
}
|
||||||
|
|
||||||
public long GetSupportedNpadStyleSet(ServiceCtx Context)
|
public long GetSupportedNpadStyleSet(ServiceCtx Context)
|
||||||
{
|
{
|
||||||
Context.ResponseData.Write(0);
|
Context.ResponseData.Write(0);
|
||||||
|
@ -266,5 +282,18 @@ namespace Ryujinx.HLE.OsHle.Services.Hid
|
||||||
|
|
||||||
return 0;
|
return 0;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
public void Dispose()
|
||||||
|
{
|
||||||
|
Dispose(true);
|
||||||
|
}
|
||||||
|
|
||||||
|
protected virtual void Dispose(bool Disposing)
|
||||||
|
{
|
||||||
|
if (Disposing)
|
||||||
|
{
|
||||||
|
NpadStyleSetUpdateEvent.Dispose();
|
||||||
|
}
|
||||||
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
52
Ryujinx.HLE/OsHle/Utilities/StringUtils.cs
Normal file
52
Ryujinx.HLE/OsHle/Utilities/StringUtils.cs
Normal file
|
@ -0,0 +1,52 @@
|
||||||
|
using System;
|
||||||
|
using System.Globalization;
|
||||||
|
using System.Linq;
|
||||||
|
using System.Text;
|
||||||
|
|
||||||
|
namespace Ryujinx.HLE.OsHle.Utilities
|
||||||
|
{
|
||||||
|
static class StringUtils
|
||||||
|
{
|
||||||
|
public static byte[] GetFixedLengthBytes(string InputString, int Size, Encoding Encoding)
|
||||||
|
{
|
||||||
|
InputString = InputString + "\0";
|
||||||
|
|
||||||
|
int ByteCount = Encoding.GetByteCount(InputString);
|
||||||
|
|
||||||
|
byte[] Output = new byte[Size];
|
||||||
|
|
||||||
|
if (ByteCount < Size)
|
||||||
|
{
|
||||||
|
Encoding.GetBytes(InputString, 0, InputString.Length, Output, Size - ByteCount);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
int NullSize = Encoding.GetByteCount("\0");
|
||||||
|
|
||||||
|
Output = Encoding.GetBytes(InputString);
|
||||||
|
|
||||||
|
Array.Resize(ref Output, Size - NullSize);
|
||||||
|
|
||||||
|
Output = Output.Concat(Encoding.GetBytes("\0")).ToArray();
|
||||||
|
}
|
||||||
|
|
||||||
|
return Output;
|
||||||
|
}
|
||||||
|
|
||||||
|
public static byte[] HexToBytes(string HexString)
|
||||||
|
{
|
||||||
|
//Ignore last charactor if HexLength % 2 != 0
|
||||||
|
int BytesInHex = HexString.Length / 2;
|
||||||
|
|
||||||
|
byte[] Output = new byte[BytesInHex];
|
||||||
|
|
||||||
|
for (int Index = 0; Index < BytesInHex; Index++)
|
||||||
|
{
|
||||||
|
Output[Index] = byte.Parse(HexString.Substring(Index * 2, 2),
|
||||||
|
NumberStyles.HexNumber);
|
||||||
|
}
|
||||||
|
|
||||||
|
return Output;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
|
@ -1,7 +1,11 @@
|
||||||
|
using System.Collections.Generic;
|
||||||
|
using Ryujinx.HLE.OsHle;
|
||||||
|
|
||||||
namespace Ryujinx.HLE.Settings
|
namespace Ryujinx.HLE.Settings
|
||||||
{
|
{
|
||||||
public class SystemSettings
|
public class SystemSettings
|
||||||
{
|
{
|
||||||
public ColorSet ThemeColor;
|
public Profile User { get; set; }
|
||||||
|
public ColorSet ThemeColor { get; set; }
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
|
@ -67,6 +67,12 @@ namespace Ryujinx.HLE
|
||||||
|
|
||||||
Os.FontSharedMem.MemoryMapped += Font.ShMemMap;
|
Os.FontSharedMem.MemoryMapped += Font.ShMemMap;
|
||||||
Os.FontSharedMem.MemoryUnmapped += Font.ShMemUnmap;
|
Os.FontSharedMem.MemoryUnmapped += Font.ShMemUnmap;
|
||||||
|
|
||||||
|
Settings.User = new Profile()
|
||||||
|
{
|
||||||
|
Username = "Ryujinx",
|
||||||
|
UserId = "000123456789abcdef09876543210000"
|
||||||
|
};
|
||||||
}
|
}
|
||||||
|
|
||||||
public void LoadCart(string ExeFsDir, string RomFsFile = null)
|
public void LoadCart(string ExeFsDir, string RomFsFile = null)
|
||||||
|
@ -109,4 +115,4 @@ namespace Ryujinx.HLE
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
|
@ -1137,6 +1137,114 @@ namespace Ryujinx.Tests.Cpu
|
||||||
});
|
});
|
||||||
}
|
}
|
||||||
|
|
||||||
|
[Test, Description("SADALP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Sadalp_V_8B4H_4H2S_2S1D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <8B4H, 4H2S, 2S1D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x0E206800; // SADALP V0.4H, V0.8B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0(A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.V(1, new Bits(A));
|
||||||
|
SimdFp.Sadalp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
|
[Test, Description("SADALP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Sadalp_V_16B8H_8H4S_4S2D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <16B8H, 8H4S, 4S2D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x4E206800; // SADALP V0.8H, V0.16B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0E1(A, A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.Vpart(1, 0, new Bits(A)); AArch64.Vpart(1, 1, new Bits(A));
|
||||||
|
SimdFp.Sadalp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
|
[Test, Description("SADDLP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Saddlp_V_8B4H_4H2S_2S1D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <8B4H, 4H2S, 2S1D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x0E202800; // SADDLP V0.4H, V0.8B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0(A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.V(1, new Bits(A));
|
||||||
|
SimdFp.Saddlp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
|
[Test, Description("SADDLP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Saddlp_V_16B8H_8H4S_4S2D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <16B8H, 8H4S, 4S2D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x4E202800; // SADDLP V0.8H, V0.16B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0E1(A, A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.Vpart(1, 0, new Bits(A)); AArch64.Vpart(1, 1, new Bits(A));
|
||||||
|
SimdFp.Saddlp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
[Test, Description("SQABS <V><d>, <V><n>")]
|
[Test, Description("SQABS <V><d>, <V><n>")]
|
||||||
public void Sqabs_S_B_H_S_D([Values(0u)] uint Rd,
|
public void Sqabs_S_B_H_S_D([Values(0u)] uint Rd,
|
||||||
[Values(1u, 0u)] uint Rn,
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
@ -1602,6 +1710,114 @@ namespace Ryujinx.Tests.Cpu
|
||||||
Assert.That(ThreadState.Fpsr, Is.EqualTo((int)Shared.FPSR.ToUInt32()));
|
Assert.That(ThreadState.Fpsr, Is.EqualTo((int)Shared.FPSR.ToUInt32()));
|
||||||
}
|
}
|
||||||
|
|
||||||
|
[Test, Description("UADALP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Uadalp_V_8B4H_4H2S_2S1D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <8B4H, 4H2S, 2S1D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x2E206800; // UADALP V0.4H, V0.8B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0(A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.V(1, new Bits(A));
|
||||||
|
SimdFp.Uadalp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
|
[Test, Description("UADALP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Uadalp_V_16B8H_8H4S_4S2D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <16B8H, 8H4S, 4S2D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x6E206800; // UADALP V0.8H, V0.16B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0E1(A, A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.Vpart(1, 0, new Bits(A)); AArch64.Vpart(1, 1, new Bits(A));
|
||||||
|
SimdFp.Uadalp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
|
[Test, Description("UADDLP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Uaddlp_V_8B4H_4H2S_2S1D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <8B4H, 4H2S, 2S1D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x2E202800; // UADDLP V0.4H, V0.8B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0(A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.V(1, new Bits(A));
|
||||||
|
SimdFp.Uaddlp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
|
[Test, Description("UADDLP <Vd>.<Ta>, <Vn>.<Tb>")]
|
||||||
|
public void Uaddlp_V_16B8H_8H4S_4S2D([Values(0u)] uint Rd,
|
||||||
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong Z,
|
||||||
|
[ValueSource("_8B4H2S_")] [Random(RndCnt)] ulong A,
|
||||||
|
[Values(0b00u, 0b01u, 0b10u)] uint size) // <16B8H, 8H4S, 4S2D>
|
||||||
|
{
|
||||||
|
uint Opcode = 0x6E202800; // UADDLP V0.8H, V0.16B
|
||||||
|
Opcode |= ((Rn & 31) << 5) | ((Rd & 31) << 0);
|
||||||
|
Opcode |= ((size & 3) << 22);
|
||||||
|
Bits Op = new Bits(Opcode);
|
||||||
|
|
||||||
|
Vector128<float> V0 = MakeVectorE0E1(Z, Z);
|
||||||
|
Vector128<float> V1 = MakeVectorE0E1(A, A);
|
||||||
|
AThreadState ThreadState = SingleOpcode(Opcode, V0: V0, V1: V1);
|
||||||
|
|
||||||
|
AArch64.Vpart(0, 0, new Bits(Z)); AArch64.Vpart(0, 1, new Bits(Z));
|
||||||
|
AArch64.Vpart(1, 0, new Bits(A)); AArch64.Vpart(1, 1, new Bits(A));
|
||||||
|
SimdFp.Uaddlp_V(Op[30], Op[23, 22], Op[9, 5], Op[4, 0]);
|
||||||
|
|
||||||
|
Assert.Multiple(() =>
|
||||||
|
{
|
||||||
|
Assert.That(GetVectorE0(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 0).ToUInt64()));
|
||||||
|
Assert.That(GetVectorE1(ThreadState.V0), Is.EqualTo(AArch64.Vpart(64, 0, 1).ToUInt64()));
|
||||||
|
});
|
||||||
|
}
|
||||||
|
|
||||||
[Test, Description("UQXTN <Vb><d>, <Va><n>")]
|
[Test, Description("UQXTN <Vb><d>, <Va><n>")]
|
||||||
public void Uqxtn_S_HB_SH_DS([Values(0u)] uint Rd,
|
public void Uqxtn_S_HB_SH_DS([Values(0u)] uint Rd,
|
||||||
[Values(1u, 0u)] uint Rn,
|
[Values(1u, 0u)] uint Rn,
|
||||||
|
|
|
@ -3060,6 +3060,90 @@ namespace Ryujinx.Tests.Cpu.Tester
|
||||||
V(d, result);
|
V(d, result);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
// sadalp_advsimd.html
|
||||||
|
public static void Sadalp_V(bool Q, Bits size, Bits Rn, Bits Rd)
|
||||||
|
{
|
||||||
|
const bool U = false;
|
||||||
|
const bool op = true;
|
||||||
|
|
||||||
|
/* Decode Vector */
|
||||||
|
int d = (int)UInt(Rd);
|
||||||
|
int n = (int)UInt(Rn);
|
||||||
|
|
||||||
|
/* if size == '11' then ReservedValue(); */
|
||||||
|
|
||||||
|
int esize = 8 << (int)UInt(size);
|
||||||
|
int datasize = (Q ? 128 : 64);
|
||||||
|
int elements = datasize / (2 * esize);
|
||||||
|
|
||||||
|
bool acc = (op == true);
|
||||||
|
bool unsigned = (U == true);
|
||||||
|
|
||||||
|
/* Operation */
|
||||||
|
/* CheckFPAdvSIMDEnabled64(); */
|
||||||
|
|
||||||
|
Bits operand = V(datasize, n);
|
||||||
|
Bits sum;
|
||||||
|
BigInteger op1;
|
||||||
|
BigInteger op2;
|
||||||
|
|
||||||
|
Bits result = (acc ? V(datasize, d) : Zeros(datasize));
|
||||||
|
|
||||||
|
for (int e = 0; e <= elements - 1; e++)
|
||||||
|
{
|
||||||
|
op1 = Int(Elem(operand, 2 * e + 0, esize), unsigned);
|
||||||
|
op2 = Int(Elem(operand, 2 * e + 1, esize), unsigned);
|
||||||
|
|
||||||
|
sum = (op1 + op2).SubBigInteger(2 * esize - 1, 0);
|
||||||
|
|
||||||
|
Elem(result, e, 2 * esize, Elem(result, e, 2 * esize) + sum);
|
||||||
|
}
|
||||||
|
|
||||||
|
V(d, result);
|
||||||
|
}
|
||||||
|
|
||||||
|
// saddlp_advsimd.html
|
||||||
|
public static void Saddlp_V(bool Q, Bits size, Bits Rn, Bits Rd)
|
||||||
|
{
|
||||||
|
const bool U = false;
|
||||||
|
const bool op = false;
|
||||||
|
|
||||||
|
/* Decode Vector */
|
||||||
|
int d = (int)UInt(Rd);
|
||||||
|
int n = (int)UInt(Rn);
|
||||||
|
|
||||||
|
/* if size == '11' then ReservedValue(); */
|
||||||
|
|
||||||
|
int esize = 8 << (int)UInt(size);
|
||||||
|
int datasize = (Q ? 128 : 64);
|
||||||
|
int elements = datasize / (2 * esize);
|
||||||
|
|
||||||
|
bool acc = (op == true);
|
||||||
|
bool unsigned = (U == true);
|
||||||
|
|
||||||
|
/* Operation */
|
||||||
|
/* CheckFPAdvSIMDEnabled64(); */
|
||||||
|
|
||||||
|
Bits operand = V(datasize, n);
|
||||||
|
Bits sum;
|
||||||
|
BigInteger op1;
|
||||||
|
BigInteger op2;
|
||||||
|
|
||||||
|
Bits result = (acc ? V(datasize, d) : Zeros(datasize));
|
||||||
|
|
||||||
|
for (int e = 0; e <= elements - 1; e++)
|
||||||
|
{
|
||||||
|
op1 = Int(Elem(operand, 2 * e + 0, esize), unsigned);
|
||||||
|
op2 = Int(Elem(operand, 2 * e + 1, esize), unsigned);
|
||||||
|
|
||||||
|
sum = (op1 + op2).SubBigInteger(2 * esize - 1, 0);
|
||||||
|
|
||||||
|
Elem(result, e, 2 * esize, Elem(result, e, 2 * esize) + sum);
|
||||||
|
}
|
||||||
|
|
||||||
|
V(d, result);
|
||||||
|
}
|
||||||
|
|
||||||
// sqabs_advsimd.html#SQABS_asisdmisc_R
|
// sqabs_advsimd.html#SQABS_asisdmisc_R
|
||||||
public static void Sqabs_S(Bits size, Bits Rn, Bits Rd)
|
public static void Sqabs_S(Bits size, Bits Rn, Bits Rd)
|
||||||
{
|
{
|
||||||
|
@ -3522,6 +3606,90 @@ namespace Ryujinx.Tests.Cpu.Tester
|
||||||
V(d, result);
|
V(d, result);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
// uadalp_advsimd.html
|
||||||
|
public static void Uadalp_V(bool Q, Bits size, Bits Rn, Bits Rd)
|
||||||
|
{
|
||||||
|
const bool U = true;
|
||||||
|
const bool op = true;
|
||||||
|
|
||||||
|
/* Decode Vector */
|
||||||
|
int d = (int)UInt(Rd);
|
||||||
|
int n = (int)UInt(Rn);
|
||||||
|
|
||||||
|
/* if size == '11' then ReservedValue(); */
|
||||||
|
|
||||||
|
int esize = 8 << (int)UInt(size);
|
||||||
|
int datasize = (Q ? 128 : 64);
|
||||||
|
int elements = datasize / (2 * esize);
|
||||||
|
|
||||||
|
bool acc = (op == true);
|
||||||
|
bool unsigned = (U == true);
|
||||||
|
|
||||||
|
/* Operation */
|
||||||
|
/* CheckFPAdvSIMDEnabled64(); */
|
||||||
|
|
||||||
|
Bits operand = V(datasize, n);
|
||||||
|
Bits sum;
|
||||||
|
BigInteger op1;
|
||||||
|
BigInteger op2;
|
||||||
|
|
||||||
|
Bits result = (acc ? V(datasize, d) : Zeros(datasize));
|
||||||
|
|
||||||
|
for (int e = 0; e <= elements - 1; e++)
|
||||||
|
{
|
||||||
|
op1 = Int(Elem(operand, 2 * e + 0, esize), unsigned);
|
||||||
|
op2 = Int(Elem(operand, 2 * e + 1, esize), unsigned);
|
||||||
|
|
||||||
|
sum = (op1 + op2).SubBigInteger(2 * esize - 1, 0);
|
||||||
|
|
||||||
|
Elem(result, e, 2 * esize, Elem(result, e, 2 * esize) + sum);
|
||||||
|
}
|
||||||
|
|
||||||
|
V(d, result);
|
||||||
|
}
|
||||||
|
|
||||||
|
// uaddlp_advsimd.html
|
||||||
|
public static void Uaddlp_V(bool Q, Bits size, Bits Rn, Bits Rd)
|
||||||
|
{
|
||||||
|
const bool U = true;
|
||||||
|
const bool op = false;
|
||||||
|
|
||||||
|
/* Decode Vector */
|
||||||
|
int d = (int)UInt(Rd);
|
||||||
|
int n = (int)UInt(Rn);
|
||||||
|
|
||||||
|
/* if size == '11' then ReservedValue(); */
|
||||||
|
|
||||||
|
int esize = 8 << (int)UInt(size);
|
||||||
|
int datasize = (Q ? 128 : 64);
|
||||||
|
int elements = datasize / (2 * esize);
|
||||||
|
|
||||||
|
bool acc = (op == true);
|
||||||
|
bool unsigned = (U == true);
|
||||||
|
|
||||||
|
/* Operation */
|
||||||
|
/* CheckFPAdvSIMDEnabled64(); */
|
||||||
|
|
||||||
|
Bits operand = V(datasize, n);
|
||||||
|
Bits sum;
|
||||||
|
BigInteger op1;
|
||||||
|
BigInteger op2;
|
||||||
|
|
||||||
|
Bits result = (acc ? V(datasize, d) : Zeros(datasize));
|
||||||
|
|
||||||
|
for (int e = 0; e <= elements - 1; e++)
|
||||||
|
{
|
||||||
|
op1 = Int(Elem(operand, 2 * e + 0, esize), unsigned);
|
||||||
|
op2 = Int(Elem(operand, 2 * e + 1, esize), unsigned);
|
||||||
|
|
||||||
|
sum = (op1 + op2).SubBigInteger(2 * esize - 1, 0);
|
||||||
|
|
||||||
|
Elem(result, e, 2 * esize, Elem(result, e, 2 * esize) + sum);
|
||||||
|
}
|
||||||
|
|
||||||
|
V(d, result);
|
||||||
|
}
|
||||||
|
|
||||||
// uqxtn_advsimd.html#UQXTN_asisdmisc_N
|
// uqxtn_advsimd.html#UQXTN_asisdmisc_N
|
||||||
public static void Uqxtn_S(Bits size, Bits Rn, Bits Rd)
|
public static void Uqxtn_S(Bits size, Bits Rn, Bits Rd)
|
||||||
{
|
{
|
||||||
|
|
|
@ -1,4 +1,4 @@
|
||||||
using Ryujinx.UI.Input;
|
using Ryujinx.UI.Input;
|
||||||
using Ryujinx.HLE.Logging;
|
using Ryujinx.HLE.Logging;
|
||||||
using Ryujinx.HLE.Input;
|
using Ryujinx.HLE.Input;
|
||||||
using System;
|
using System;
|
||||||
|
@ -223,4 +223,4 @@ namespace Ryujinx
|
||||||
return Values.TryGetValue(Name, out string Value) ? Value : null;
|
return Values.TryGetValue(Name, out string Value) ? Value : null;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
Loading…
Reference in a new issue