[PATCH 6.10 269/273] drm/amdgpu/vcn: identify unified queue in sw init

27 Aug 2024

6.10-stable review patch.  If anyone has any objections, please let me know.
------------------
From: Boyuan Zhang boyuan.zhang@amd.com
commit ecfa23c8df7ef3ea2a429dfe039341bf792e95b4 upstream.
Determine whether VCN using unified queue in sw_init, instead of calling
functions later on.
v2: fix coding style
Signed-off-by: Boyuan Zhang boyuan.zhang@amd.com
Acked-by: Alex Deucher alexander.deucher@amd.com
Reviewed-by: Ruijing Dong ruijing.dong@amd.com
Signed-off-by: Alex Deucher alexander.deucher@amd.com
Cc: Mario Limonciello mario.limonciello@amd.com
Signed-off-by: Greg Kroah-Hartman gregkh@linuxfoundation.org
---
 drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c |   39 ++++++++++++--------------------
 drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h |    1 
 2 files changed, 16 insertions(+), 24 deletions(-)

--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c
@@ -151,6 +151,10 @@ int amdgpu_vcn_sw_init(struct amdgpu_dev
    	}
    }
+	/* from vcn4 and above, only unified queue is used */
+	adev->vcn.using_unified_queue =
+		amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(4, 0, 0);
+
    hdr = (const struct common_firmware_header *)adev->vcn.fw[0]->data;
    adev->vcn.fw_version = le32_to_cpu(hdr->ucode_version);
@@ -279,18 +283,6 @@ int amdgpu_vcn_sw_fini(struct amdgpu_dev
    return 0;
 }
-/* from vcn4 and above, only unified queue is used */
-static bool amdgpu_vcn_using_unified_queue(struct amdgpu_ring *ring)
-{
-	struct amdgpu_device *adev = ring->adev;
-	bool ret = false;
-
-	if (amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(4, 0, 0))
-		ret = true;
-
-	return ret;
-}
-
 bool amdgpu_vcn_is_disabled_vcn(struct amdgpu_device *adev, enum vcn_ring_type type, uint32_t vcn_instance)
 {
    bool ret = false;
@@ -728,12 +720,11 @@ static int amdgpu_vcn_dec_sw_send_msg(st
    struct amdgpu_job *job;
    struct amdgpu_ib *ib;
    uint64_t addr = AMDGPU_GPU_PAGE_ALIGN(ib_msg->gpu_addr);
-	bool sq = amdgpu_vcn_using_unified_queue(ring);
    uint32_t *ib_checksum;
    uint32_t ib_pack_in_dw;
    int i, r;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	ib_size_dw += 8;
r = amdgpu_job_alloc_with_ib(ring->adev, NULL, NULL,
@@ -746,7 +737,7 @@ static int amdgpu_vcn_dec_sw_send_msg(st
    ib->length_dw = 0;
/* single queue headers */
-	if (sq) {
+	if (adev->vcn.using_unified_queue) {
    	ib_pack_in_dw = sizeof(struct amdgpu_vcn_decode_buffer) / sizeof(uint32_t)
    					+ 4 + 2; /* engine info + decoding ib in dw */
    	ib_checksum = amdgpu_vcn_unified_ring_ib_header(ib, ib_pack_in_dw, false);
@@ -765,7 +756,7 @@ static int amdgpu_vcn_dec_sw_send_msg(st
    for (i = ib->length_dw; i < ib_size_dw; ++i)
    	ib->ptr[i] = 0x0;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	amdgpu_vcn_unified_ring_ib_checksum(&ib_checksum, ib_pack_in_dw);
r = amdgpu_job_submit_direct(job, ring, &f);
@@ -855,15 +846,15 @@ static int amdgpu_vcn_enc_get_create_msg
    				 struct dma_fence **fence)
 {
    unsigned int ib_size_dw = 16;
+	struct amdgpu_device *adev = ring->adev;
    struct amdgpu_job *job;
    struct amdgpu_ib *ib;
    struct dma_fence *f = NULL;
    uint32_t *ib_checksum = NULL;
    uint64_t addr;
-	bool sq = amdgpu_vcn_using_unified_queue(ring);
    int i, r;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	ib_size_dw += 8;
r = amdgpu_job_alloc_with_ib(ring->adev, NULL, NULL,
@@ -877,7 +868,7 @@ static int amdgpu_vcn_enc_get_create_msg
ib->length_dw = 0;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	ib_checksum = amdgpu_vcn_unified_ring_ib_header(ib, 0x11, true);
ib->ptr[ib->length_dw++] = 0x00000018;
@@ -899,7 +890,7 @@ static int amdgpu_vcn_enc_get_create_msg
    for (i = ib->length_dw; i < ib_size_dw; ++i)
    	ib->ptr[i] = 0x0;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	amdgpu_vcn_unified_ring_ib_checksum(&ib_checksum, 0x11);
r = amdgpu_job_submit_direct(job, ring, &f);
@@ -922,15 +913,15 @@ static int amdgpu_vcn_enc_get_destroy_ms
    				  struct dma_fence **fence)
 {
    unsigned int ib_size_dw = 16;
+	struct amdgpu_device *adev = ring->adev;
    struct amdgpu_job *job;
    struct amdgpu_ib *ib;
    struct dma_fence *f = NULL;
    uint32_t *ib_checksum = NULL;
    uint64_t addr;
-	bool sq = amdgpu_vcn_using_unified_queue(ring);
    int i, r;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	ib_size_dw += 8;
r = amdgpu_job_alloc_with_ib(ring->adev, NULL, NULL,
@@ -944,7 +935,7 @@ static int amdgpu_vcn_enc_get_destroy_ms
ib->length_dw = 0;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	ib_checksum = amdgpu_vcn_unified_ring_ib_header(ib, 0x11, true);
ib->ptr[ib->length_dw++] = 0x00000018;
@@ -966,7 +957,7 @@ static int amdgpu_vcn_enc_get_destroy_ms
    for (i = ib->length_dw; i < ib_size_dw; ++i)
    	ib->ptr[i] = 0x0;
-	if (sq)
+	if (adev->vcn.using_unified_queue)
    	amdgpu_vcn_unified_ring_ib_checksum(&ib_checksum, 0x11);
r = amdgpu_job_submit_direct(job, ring, &f);
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h
@@ -329,6 +329,7 @@ struct amdgpu_vcn {
uint16_t inst_mask;
    uint8_t	num_inst_per_aid;
+	bool using_unified_queue;
 };
struct amdgpu_fw_shared_rb_ptrs_struct {

    

2026

2025

2024

2023

2022

2021

2020

2019

2018

2017

[PATCH 6.10 269/273] drm/amdgpu/vcn: identify unified queue in sw init