AMD pressiona para otimizar shaders em jogos com nova patente de chiplet GPU

AMD publicou recentemente uma patente para distribuir a carga de renderização em vários chipsets de GPU. Uma cena de jogo é dividida em blocos individuais e distribuída para chiplets para otimizar o uso de shaders nos jogos. O agrupamento de chiplet de dois níveis é usado para isso.

AMD publica uma patente para a aplicação de chipsets de GPU para criar uma melhor utilização da tecnologia de shader

A nova patente publicada pela AMD abre mais informações sobre o que a empresa planeja fazer com a tecnologia de GPU e CPU de próximo nível nos próximos anos. No final de junho, foi revelado que cinquenta e quatro pedidos de patente seriam submetidos para publicação. Não se sabe qual das mais de cinquenta patentes publicadas será usada nos planos da AMD. As aplicações discutidas nas patentes detalham as abordagens da empresa nos anos seguintes.

Um aplicativo percebido pelo membro da comunidade @ETI1120 no site Base de computadornúmero da patente US20220207827, analisa dados críticos de imagem em dois estágios para passar com eficiência cargas de renderização de uma GPU para vários chiplets. A CPU inicialmente aplicou isso ao Escritório de Patentes dos EUA no final do ano passado.

Quando os dados de imagem em uma GPU são rasterizados por meios padrão, a unidade de sombreamento, também conhecida como ALU, executa a mesma tarefa e atribui um nome de cor aos pixels individuais. Por sua vez, os polígonos texturizados encontrados no pixel específico em uma cena de jogo específica são mapeados diretamente para o pixel. Por fim, a tarefa formulada manterá princípios atípicos e somente será diferenciada por outras texturas localizadas em diferentes pixels. Este método é chamado SIMD, ou Instrução Única – Dados Múltiplos.

Para a maioria dos jogos de hoje, o sombreamento não é a única tarefa que uma GPU lida. Mas, em vez disso, vários elementos de pós-processamento são incluídos após o sombreamento inicial. As ações que a GPU adicionaria, por exemplo, seriam anti-aliasing, sombreamento e oclusões do ambiente do jogo. No entanto, o ray tracing acontece junto com o sombreamento, criando um novo método de computação.

Ao falar sobre a GPU que impulsiona os gráficos nos jogos de hoje, a carga criada pelo computador aumenta exponencialmente em milhares de unidades de computação.

Em jogos em GPUs, essa carga de computação é dimensionada para vários milhares de unidades de computação de uma maneira um tanto ideal. Isso difere dos processadores em que os aplicativos devem ser escritos especificamente para adicionar mais núcleos. O agendador de CPU cria essa ação, dividindo o trabalho da GPU em tarefas mais digeríveis processadas pelas unidades de computação, também chamadas de binning. A imagem do jogo é processada e depois dividida em blocos separados contendo um determinado número de pixels. O bloco é computado por uma subunidade de processador gráfico, onde é então sincronizado e criado. Após essa ação, os pixels esperando para serem computados são incluídos em um bloco até que a subunidade da placa gráfica seja finalmente utilizada. O poder de computação dos shaders, a largura de banda da memória e os tamanhos de cache são todos levados em consideração.

A AMD explica na patente que dividir e unir requer uma conexão de dados abrangente e completa entre todos os elementos da GPU, o que representa um problema. Os links de dados que não estão na matriz têm um alto nível de latência, o que retarda o processo.

As CPUs fizeram essa transição para chiplets sem esforço devido à capacidade de despachar a tarefa em vários núcleos, tornando-a acessível aos chiplets. As GPUs não oferecem a mesma flexibilidade, colocando seu agendador comparável a um processador dual-core introdutório.

A AMD reconhece a necessidade e tenta resolver esses problemas alterando o pipeline de rasterização e as tarefas de roteamento entre vários chipsets de GPU, semelhantes às CPUs. Isso requer tecnologia avançada de clustering, que a empresa está introduzindo como “clustering de duas camadas”, também conhecido como “clustering híbrido”.

No hyperclustering, a divisão é processada em dois estágios separados, em vez de ser processada diretamente em blocos pixel a pixel. O primeiro passo é calcular a equação, pegando um ambiente 3D e criando uma imagem 2D a partir do original. O estágio é chamado de sombreamento de vértice e é concluído antes da rasterização, e o processo é mínimo no primeiro chiplet da GPU. Depois de concluído, a cena do jogo começa a se montar, desenvolvendo-se em contêineres espessos e renderizando em um único chip GPU. Em seguida, as tarefas de rotina, como rasterização e pós-processamento, podem começar.

Não se sabe quando a AMD pretende começar a usar esse novo processo ou se ele será aprovado. No entanto, isso nos dá um vislumbre do futuro do processamento de GPU mais eficiente.

fontes de notícias: Base de computador, patentes grátis online