Grok Build na prática: como instalar e usar
Guia prático do Grok Build CLI da xAI: instalação, autenticação, modos de uso, subagentes paralelos e os limites reais que você vai encontrar no beta.

Esse artigo é pra quem já decidiu experimentar o Grok Build e quer colocar o CLI pra rodar no terminal hoje. Não vou debater se você deveria usar Grok Build ou Claude Code — se ainda estiver nessa dúvida, o comparativo direto entre os dois cobre benchmarks e custo-benefício com números reais. Aqui o foco é técnico: instalação, autenticação, primeiro uso e os limites reais do beta.
Pré-requisitos: SuperGrok ou API key
Antes de instalar, você precisa de um dos dois caminhos.
Opção A: SuperGrok. Assinatura de US$30/mês (ou US$300/ano) no X, que inclui acesso ao beta do CLI por autenticação via browser. Sem precisar gerar chave nenhuma.
Opção B: API key da xAI. Cria uma conta em console.x.ai, cadastra cartão de crédito, e gera uma chave no painel API Keys. Custo por uso: US$0,20 por milhão de tokens de entrada e US$0,50 por milhão de tokens de saída com o grok-code-fast-1. Começa com US$25 em crédito promocional.
Sem uma das duas, o CLI não autentica. Não tem free tier.
Instalação passo a passo
macOS e Linux:
curl -fsSL https://x.ai/cli/install.sh | bash
Windows (PowerShell):
irm https://x.ai/cli/install.ps1 | iex
O suporte nativo ao Windows chegou no final de maio de 2026. Funciona, mas ainda tem arestas. Se você usa Windows, WSL2 tende a ser mais estável que o PowerShell nativo por enquanto.
Confirme a instalação:
grok --version
Não existe pacote oficial no npm. Tem pacotes de terceiros com nome parecido, mas não são o CLI oficial da xAI.
Configurando autenticação
Com API key, exporta a variável de ambiente:
export XAI_API_KEY="xai-sua-chave-aqui"
Coloca essa linha no .zshrc ou .bashrc pra não precisar repetir a cada sessão. O CLI lê automaticamente.
Com SuperGrok, é mais direto: só roda grok na primeira vez, o browser abre pra autenticação OAuth e fica salvo localmente. Pra checar se o setup está correto:
grok inspect
Esse comando mostra o contexto carregado: configurações do projeto, instruções, plugins e servidores MCP conectados. Útil pra confirmar que o CLI está lendo o projeto certo antes da primeira tarefa.
Primeiro uso: um exemplo real
Navega até um projeto e sobe o CLI interativo:
grok
Interface TUI completa, com mouse e teclado. Prompts diretos funcionam bem pra começar:
Explique a estrutura desse repositório.
@src/Controllers/ProdutoController.cs Que endpoints esse arquivo expõe?
Mas olha: recomendo começar no Plan Mode, não no modo padrão. A razão é simples: um agente com 70.8% no SWE-Bench ainda vai errar em partes não-triviais do código, e você quer ver o diff proposto antes de aceitar qualquer alteração no disco. Explico os modos a seguir.
Os três modos de uso
O Grok Build tem três modos que controlam o nível de autonomia do agente:
Code (padrão): lê arquivos, edita código e executa comandos sem pedir confirmação. Bom pra tarefas rotineiras em projetos que você conhece bem.
Plan: gera um plano detalhado e mostra o diff completo das mudanças antes de aplicar qualquer coisa. Você aprova antes de qualquer alteração no disco.
Ask: somente leitura. Responde perguntas e analisa código, mas não modifica nada.
Pra alternar entre eles:
Shift+Tab # cicla entre modos na sessão ativa
/mode plan # Plan Mode
/mode ask # Ask Mode
/mode code # volta ao padrão
Ou já sobe com o modo definido:
grok --mode plan -p "Refatora os métodos duplicados em src/Services/"
Na documentação oficial da xAI você encontra a referência completa de modos e comandos disponíveis.
Se o que te motivou a testar o Grok Build foi curiosidade sobre agentes de IA, o curso de Claude Code cobre esse universo com mais profundidade.
Do terminal ao workflow real: aprenda a usar o agente que lidera o benchmark.
Ver cursosSubagentes paralelos: como funciona
A arquitetura de múltiplos agentes é automática. Você não configura nada explicitamente. Pra tarefas complexas, um agente coordenador analisa o problema, divide em subtarefas e despacha até 8 subagentes em paralelo, cada um rodando em um worktree isolado do git para não criar conflito no branch principal.
Na prática, você vai notar isso principalmente em refatorações multiarquivo ou em tarefas com etapas independentes. Pra tasks simples, trabalha sequencialmente mesmo.
Comandos opcionais pra controlar modelo e roteamento:
grok --model grok-3 # força modelo específico
grok --routing fast # menor latência
grok --routing smart # melhor modelo disponível pro tipo de tarefa
Arena Mode: anunciado, mas ainda não chegou
O Arena Mode é a feature mais citada do Grok Build: vários agentes gerando soluções concorrentes ao mesmo tempo, pontuadas automaticamente, com a melhor entregue sem você precisar comparar manualmente. Foi confirmado no código-fonte em fevereiro de 2026 e anunciado no lançamento do beta em maio.
Só que em junho de 2026, Arena Mode ainda não está disponível. A expectativa é Q3 2026, sem data oficial.
Se você instalou esperando essa funcionalidade, ela não tá lá ainda. O que existe hoje é a arquitetura de subagentes paralelos para processamento interno, diferente do Arena Mode, que seria uma camada de avaliação visível pro usuário.
Limitações que você vai encontrar
Sendo direto sobre o que o beta ainda não resolve bem:
Alucinações de API: o Grok Build às vezes inventa endpoints ou métodos que não existem na stdlib da sua linguagem. Código gerado precisa ser validado, especialmente em partes menos comuns da stack.
Windows ainda instável: instalador PowerShell foi adicionado em maio de 2026, mas macOS e Linux são as plataformas com mais testes e mais estáveis.
Rate limiting durante o beta: houve problemas com quotas sendo consumidas mais rápido que o esperado por bug de cache, corrigido pela xAI no final de maio. O comando /cost mostra seu consumo atual se você bater algum limite.
Quando vale usar e quando pular
Faz sentido experimentar se a arquitetura local-first for relevante pra você: o código-fonte não é transmitido pra servidores externos durante a execução, o que importa pra projetos com restrições de compliance ou código proprietário sensível. E se você prefere pagar por token em vez de assinatura mensal, a opção de API key existe.
Mas se você precisa de confiabilidade alta em tarefas multiarquivo complexas, a diferença de 17 pontos percentuais no SWE-Bench entre Grok Build e Claude Code não é cosmética: ela aparece em refatorações e debugging real.
Pra entender como o Claude Code se comporta por dentro, vale ver o guia completo sobre o que ele é e como funciona. E pra qualquer agente que você escolher, as estratégias pra usar tokens de forma mais econômica se aplicam: agente de código consome contexto rápido, e hábitos de uso fazem diferença no custo do fim do mês.