Solucionar problemas da CLI agente do AKS (Serviço de Kubernetes do Azure) (versão prévia)

Este artigo fornece diretrizes sobre como solucionar problemas comuns com a CLI agente do AKS (Serviço de Kubernetes do Azure).

Etapas de solução de problemas comuns

Se você tiver problemas ao usar a CLI agente do AKS, tente as seguintes etapas de solução de problemas:

  • Se você observar que as solicitações estão tentando novamente /chat/completions nas respostas, você pode ter sua velocidade limitada pelos limites de tokens por minuto (TPM) do LLM. Aumente o limite do TPM ou solicite mais cota.
  • Se as saídas variarem, isso pode ser devido à variabilidade da resposta do LLM ou às conexões de servidor intermitentes do Protocolo de Contexto de Modelo (MCP).
  • Verifique se o nome da implantação é o mesmo que o nome do modelo nas implantações do Azure OpenAI.
  • Se a aks-agent instalação estiver falhando, tente desinstalar a CLI do Azure e reinstalar a versão mais recente.

Erro: o daemon do Docker não está em execução

Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?
  1. Se você receber um erro indicando que o daemon do Docker não está em execução, inicie o serviço docker usando as etapas apropriadas para seu sistema operacional:

    • macOS/Windows:

      • Inicie o Docker Desktop a partir de seus aplicativos.
      • Aguarde até o Docker começar.
    • Linux:

      • Inicie o serviço do Docker usando os seguintes comandos:

        sudo systemctl start docker
        sudo systemctl enable docker  # Enable Docker to start on boot
        
  2. Verifique se o Docker está em execução usando o seguinte comando:

    docker info
    

Erro: permissão do Docker negada

Got permission denied while trying to connect to the Docker daemon socket

Para resolver problemas de permissão do Docker, verifique se o usuário tem as permissões necessárias para acessar o daemon do Docker usando as etapas para seu sistema operacional:

  • macOS/Windows:

    • Reinicie o Docker Desktop para garantir que ele tenha as permissões necessárias.
  • Linux:

    • Adicione o usuário ao grupo do Docker para permitir acesso não raiz ao Docker usando os seguintes comandos:
    sudo usermod -aG docker $USER
    newgrp docker  # Apply group changes immediately
    

Erro: falhas ao puxar imagem do Docker

Error response from daemon: pull access denied for aks-agent, repository does not exist or may require 'docker login'

Para resolver falhas de pull de imagem do Docker, tente as seguintes etapas:

  • Verifique se você tem conectividade com a Internet.
  • Verifique se os firewalls corporativos estão bloqueando o acesso ao Registro do Docker.
  • Tente inicializar o agente novamente com az aks agent-init.

Problemas de credenciais do Azure

Erro: falha na autenticação do Azure

Para resolver problemas de autenticação do Azure, verifique se a CLI do Azure está autenticada corretamente e tem acesso aos recursos necessários usando as seguintes etapas:

  1. Verifique se suas credenciais do Azure estão configuradas corretamente usando o az account show comando.

    az account show
    
  2. Se necessário, entre novamente usando o az login comando.

    az login
    

Problemas de conta de serviço e RBAC

Erro: conta de serviço não encontrada

Error: service account "aks-mcp" not found in namespace "default"

Para resolver problemas de conta de serviço, verifique se a conta de serviço do Kubernetes foi criada e configurada corretamente usando as seguintes etapas:

  1. Verifique se a conta de serviço existe usando o seguinte comando:

    kubectl get serviceaccount aks-mcp --namespace $NAMESPACE
    
  2. Se a conta de serviço não for encontrada, crie uma usando as etapas em Criar uma conta de serviço e configure a identidade da carga de trabalho para a CLI agente do AKS (Serviço de Kubernetes do Azure) (versão prévia)

Erro: Permissão negada

Error: forbidden: User "system:serviceaccount:<namespace>:aks-mcp" cannot get resource "pods" in API group "" in the namespace "<namespace>"

Para resolver erros de permissão negados, verifique se a conta de serviço do Kubernetes tem as permissões RBAC necessárias usando as seguintes etapas:

  1. Verifique se as permissões RBAC estão configuradas corretamente usando os seguintes comandos:

    kubectl get role aks-mcp-role --namespace $NAMESPACE
    kubectl get rolebinding aks-mcp-rolebinding --namespace $NAMESPACE
    
  2. Verifique se o RoleBinding associa a conta de serviço correta à Função usando o seguinte comando:

    kubectl describe rolebinding aks-mcp-rolebinding --namespace $NAMESPACE
    

Problemas de identidade de tarefas

Erro: identidade da carga de trabalho não habilitada

Error: workload identity is not enabled on this cluster

Se você receber um erro indicando que a identidade da carga de trabalho não está habilitada, verifique se o cluster do AKS tem a identidade da carga de trabalho habilitada usando as seguintes etapas:

  1. Verifique se a identidade da carga de trabalho está habilitada no cluster do AKS usando o az aks show comando.

    az aks show --resource-group $RESOURCE_GROUP --name $CLUSTER_NAME --query "securityProfile.workloadIdentity.enabled"
    
  2. Se a identidade da carga de trabalho não estiver habilitada, siga as etapas em Criar uma conta de serviço e configure a identidade da carga de trabalho para a CLI agente do AKS (Serviço de Kubernetes do Azure) (versão prévia) para habilitar a identidade da carga de trabalho em seu cluster.

Erro: Anotação ausente

Error: service account does not have workload identity annotation

Para resolver erros de anotação ausentes, verifique se a conta de serviço do Kubernetes tem a anotação de identidade de carga de trabalho correta usando as seguintes etapas:

  1. Verifique se a anotação existe na conta de serviço usando o seguinte comando:

    kubectl describe serviceaccount aks-mcp --namespace $NAMESPACE
    
  2. Se a anotação estiver ausente, adicione-a usando o comando a seguir. Certifique-se de substituir $CLIENT_ID pela ID real do cliente da credencial de identidade federada.

    kubectl annotate serviceaccount aks-mcp --namespace $NAMESPACE azure.workload.identity/client-id="$CLIENT_ID" --overwrite
    

Erro: Atraso na propagação de credenciais federadas

Se você receber erros relacionados à credencial de identidade federada não encontrada ou falhas de autenticação, isso poderá ocorrer devido a atrasos de propagação após a criação da credencial de identidade federada no Azure. Para resolver esse problema, siga as etapas a seguir:

  1. Aguarde alguns minutos para que a credencial de identidade federada se propague pelos serviços do Azure.
  2. Verifique se a credencial de identidade federada existe usando o az identity federated-credential list comando.
az identity federated-credential list --identity-name $IDENTITY_NAME --resource-group $RESOURCE_GROUP

Problemas de inicialização

Erro: Extensão não encontrada

ERROR: The command 'aks agent' is invalid or not supported. Use 'az aks --help' to see available commands

Para resolver erros de extensão não encontrados, verifique se a aks-agent extensão está instalada e carregada corretamente usando as seguintes etapas:

  1. Instale a extensão aks-agent usando o comando az extension add.

    az extension add --name aks-agent --debug
    
  2. Verifique a instalação bem-sucedida usando o az extension list comando.

    az extension list
    

    Sua saída deve incluir uma entrada para aks-agent.