Tese de Mercado

O Gap Protótipo-Produção: Onde o Dinheiro de Verdade Está

Todo mundo consegue construir um demo agora. Quase ninguém consegue entregar em produção. Código co-autorado por IA produz 1,7x mais issues graves e 2,74x mais vulnerabilidades de segurança. O gap entre protótipo e produção é onde studios premium capturam valor desproporcional.

Basalt Research

Basalt Ventures

29 de março de 2026 · 9 min de leitura

A Tese do Taste e a Era do Vibe Coding

No início de 2025, o presidente da Y Combinator Garry Tan articulou o que muitos no Vale do Silício estavam sentindo mas não haviam nomeado: num mundo onde IA consegue gerar código, taste se torna o recurso escasso. A capacidade de discernir o que deve ser construído — não apenas o que pode ser construído — separa empresas que importam de empresas que não importam.

Meses depois, “vibe coding” foi eleita Palavra do Ano de 2025. O termo, cunhado por Andrej Karpathy, descrevia um novo modo de desenvolvimento de software onde o programador descreve a intenção em linguagem natural e uma IA gera a implementação. Sem mais memorização de sintaxe. Sem mais luta com boilerplate. Apenas descreva o que quer e assista materializar.

A combinação dessas duas ideias — taste como input escasso, IA como gerador abundante — criou uma explosão de protótipos. Hackathons que costumavam produzir MVPs rudimentares começaram a produzir aplicações de aparência polida. Founders não-técnicos conseguiam demonstrar produtos funcionais em reuniões com investidores. Times internos de inovação conseguiam mostrar software funcionando para executivos em dias após receber um briefing.

Os protótipos pareciam incríveis. A história de produção era uma questão completamente diferente.

Os Dados Por Trás do Gap

Qualidade de Código: 1,7x Mais Issues Graves

A CodeRabbit, plataforma de code review, analisou 470 pull requests comparando código co-autorado por IA contra código puramente escrito por humanos. Os resultados foram claros:

Código co-autorado por IA produziu 1,7x mais issues graves identificados durante code review
Vulnerabilidades de segurança foram 2,74x maiores em código gerado por IA
Os problemas não eram superficiais — incluíam anti-patterns arquiteturais, tratamento de erros ausente, suposições incorretas sobre gerenciamento de estado e falhas de segurança que não seriam detectadas sem revisão especializada

O padrão faz sentido quando você entende para o que a geração de código por IA otimiza. Modelos são treinados para produzir código que funciona para o requisito declarado — o happy path. Eles não raciocinam sobre o que acontece quando a conexão com o banco de dados cai no meio de uma transação, quando um usuário submete input malformado, quando uma race condition ocorre sob carga, ou quando um atacante sonda vulnerabilidades de injeção. Essas são as preocupações que separam código de produção de código de protótipo, e requerem julgamento que modelos atuais não possuem.

Aproveitabilidade para Produção: ~30%

A Whitespectre, consultoria de desenvolvimento de produto, conduziu uma análise interna de código gerado por IA em dezenas de projetos de clientes. Sua conclusão: apenas aproximadamente 30% do código gerado por IA é aproveitável para produção. Os 70% restantes requerem retrabalho tão significativo — reestruturação, hardening, reescrita para manutenibilidade — que frequentemente seria mais rápido escrever do zero com IA como assistente do que tentar consertar o que a IA produziu independentemente.

Isso não significa que IA é inútil para desenvolvimento em produção. Significa que IA é um poderoso acelerador para engenheiros experientes que podem guiar a geração, avaliar o output e corrigir o curso em tempo real. É um péssimo substituto para esses engenheiros.

Taxa de Falha de Pilotos: 85%

Através de indústrias, 85% dos pilotos de IA falham em chegar a produção. Os motivos são consistentes: complexidade de integração subestimada, frameworks de governança ausentes, problemas de qualidade de dados, propriedade incerta dos outputs de IA, e o gap fundamental entre “funciona num ambiente de demo” e “funciona de forma confiável em escala com dados reais, usuários reais e consequências reais.”

Essa estatística é frequentemente citada como evidência de que IA não funciona. Na verdade, é evidência de que a última milha da implementação de IA — a engenharia de produção, a governança, a integração, a prontidão operacional — é dramaticamente mais difícil que a primeira milha de prototipagem.

O Paradoxo GenAI

A divisão de consultoria da IBM revelou um dado que cristaliza o momento atual: 86% dos compradores de consultoria estão ativamente buscando serviços de IA, mas 80% reportam nenhum impacto significativo nos negócios de seus investimentos em IA até agora.

Este é o Paradoxo GenAI. Adoção é quase universal. Impacto é quase zero.

O paradoxo existe porque a maioria das organizações está presa na fase de protótipo. Construíram demos. Impressionaram executivos. Geraram entusiasmo interno. Mas não cruzaram o abismo para produção — onde IA precisa se integrar com sistemas existentes, cumprir regulações, tratar edge cases, manter confiabilidade sob carga e produzir resultados de negócio mensuráveis.

A própria OpenAI entrou no mercado de consultoria, cobrando um mínimo de US$10 milhões por engajamentos de implementação customizada. O fato de que a empresa que constrói os modelos acredita que consultoria de implementação é um serviço de US$10M+ diz tudo sobre o tamanho do gap entre capacidade e produção.

O Gap de Expectativa do Protótipo

Uma dinâmica sutil mas poderosa está em jogo. Como IA consegue produzir protótipos impressionantes rapidamente, clientes e stakeholders agora esperam que a distância do protótipo à produção seja correspondentemente curta. “Vocês construíram esse demo em dois dias — por que não pode estar em produção mês que vem?”

A resposta é que o protótipo representa aproximadamente 5-10% do trabalho total necessário para deploy em produção. Os 90-95% restantes são:

Tratamento de erros e edge cases: O que acontece quando inputs são inesperados, serviços estão indisponíveis ou dados são inconsistentes?
Hardening de segurança: Autenticação, autorização, validação de input, criptografia, logging de auditoria, remediação de vulnerabilidades
Observabilidade: Logging, monitoramento, alertas, tracing, profiling de performance
Integridade de dados: Validação de schema, estratégias de migração, backup e recuperação, garantias de consistência
Compliance: Requisitos regulatórios, residência de dados, controles de privacidade, trilhas de auditoria
Integração: Conectar com sistemas existentes, lidar com versionamento de API, gerenciar sincronização de dados
Escalabilidade: Testes de carga, otimização de performance, estratégias de cache, provisionamento de infraestrutura
Prontidão operacional: Pipelines de deploy, procedimentos de rollback, resposta a incidentes, documentação

Nada disso é visível num demo. Tudo isso é essencial para produção. E quase nada pode ser gerado de forma confiável por IA sem orientação humana especializada.

Onde Studios Premium Vivem

O gap protótipo-produção cria uma oportunidade de mercado específica para studios e consultorias que conseguem fazer a ponte. A McKinsey identificou seis diferenciais premium que separam construtores commodity de IA de práticas que comandam margens sustentáveis:

1. Customização Profunda

IA em produção não é one-size-fits-all. Cada organização tem estruturas de dados únicas, requisitos de compliance, paisagens de integração e restrições operacionais. Studios premium customizam no nível arquitetural — não apenas no nível do prompt.

2. Parcerias Estratégicas

Em vez de competir com provedores de modelos de IA, studios premium constroem parcerias que lhes dão acesso antecipado a capacidades, canais de suporte dedicados e influência sobre roadmaps. Essas parcerias criam assimetria de informação que se traduz em melhores resultados para clientes.

3. Vendas Consultivas

Construtores commodity vendem horas ou features. Studios premium vendem diagnóstico — entender o problema real do cliente antes de propor uma solução. Essa abordagem consultiva frequentemente revela que o requisito declarado pelo cliente é um sintoma, não a doença.

4. Expertise de Domínio

IA é uma capacidade horizontal. Implementação em produção é vertical. Um deploy de IA para serviços financeiros tem requisitos fundamentalmente diferentes de um deploy para saúde ou manufatura. Expertise de domínio — entender o cenário regulatório, as estruturas de dados, os padrões operacionais de uma indústria específica — é a diferença entre um demo e um sistema que sobrevive a uma auditoria.

5. Foco em Entrega

Studios premium são obcecados com resultados, não outputs. A métrica não é “escrevemos 10.000 linhas de código” ou “implantamos 15 modelos de IA.” A métrica é “o processo do cliente agora é 40% mais rápido, com 99,9% de confiabilidade e compliance regulatório completo.” Esse foco em entrega requer estruturas de responsabilidade que construtores commodity não têm.

6. Precificação por Resultado

O diferencial mais poderoso é precificação alinhada com resultados. Em vez de cobrar horas ou por feature, studios premium precificam baseados no resultado de negócio alcançado. Isso alinha incentivos completamente: o studio só ganha quando o cliente ganha. Também filtra studios que têm confiança suficiente em sua capacidade de entrega para apostar receita em resultados.

A Vantagem que Compõe

O gap protótipo-produção não é estático. Está se alargando. À medida que ferramentas de IA facilitam a prototipagem, mais protótipos são construídos. À medida que mais protótipos são construídos, mais organizações descobrem o gap para produção. À medida que o gap se torna mais visível, a demanda por expertise de produção aumenta.

Isso cria uma vantagem composta para studios que investem em capacidade de produção. Cada projeto concluído constrói conhecimento institucional sobre o que quebra em produção, que padrões funcionam em escala e que frameworks de governança satisfazem reguladores. Esse conhecimento compõe — tornando cada projeto subsequente mais rápido, mais confiável e mais valioso.

Construtores commodity competem em velocidade-de-protótipo. Studios premium competem em certeza-de-produção. Num mundo onde protótipos são abundantes e deploys em produção são escassos, certeza comanda um prêmio.

O Mercado que Emerge

A estrutura de mercado que está se formando é assim:

Camada inferior: Protótipos e MVPs gerados por IA. Custo marginal quase zero. Oferta abundante. Corrida ao fundo na precificação. Útil para validação, não para produção.

Camada intermediária: Shops de desenvolvimento tradicionais usando IA para aceleração. Mais rápidos que o período pré-IA, mas ainda vendendo horas e features. Pressão de margem de cima (studios premium) e de baixo (protótipos gerados por IA).

Camada superior: Studios premium e consultorias que garantem resultados em produção. Precificação baseada em impacto nos negócios. Expertise de domínio profunda. Governança e compliance como capacidades centrais. Margens em expansão à medida que o gap se alarga.

O dinheiro de verdade não está em gerar código. Está no julgamento, arquitetura, governança e disciplina operacional necessários para transformar código gerado em sistemas de produção que funcionam de forma confiável, cumprem regulações e entregam valor de negócio mensurável.

O gap protótipo-produção não é um problema temporário que IA melhor resolverá. É uma característica estrutural do deploy de sistemas complexos. IA melhor fará protótipos melhores — o que elevará expectativas — o que fará o gap de produção parecer ainda maior.

Os studios que entendem isso construirão as práticas mais duráveis da era da IA. Os que perseguem velocidade de protótipo se encontrarão numa corrida impossível de vencer contra ferramentas de IA cada vez mais capazes — e cada vez mais gratuitas.

Construindo algo que precisa funcionar em produção? Fale com a Basalt.

Candidate-se para construir conosco

SaaS Não Morreu — Mas Precificação por Assento Sim

A narrativa do 'apocalipse SaaS' erra o ponto. SaaS como modelo de entrega está prosperando. O que está morrendo é o modelo de precificação por assento — porque agentes de IA não precisam de assentos, não clicam em UIs e não respondem a prompts de upgrade.

Tese de Mercado

A Empresa Antifrágil: Como Construir Ventures que Ganham com a Disrupção

A maioria das empresas é frágil — quebra quando disruptada. Empresas robustas sobrevivem. Empresas antifrágeis ficam mais fortes. Veja como construir ventures que ganham com cada onda de disrupção de IA em vez de serem destruídos por ela.

Tese de Mercado

A Internet Agêntica: Quando Máquinas Se Tornam Seus Clientes

O tráfego automatizado agora supera o tráfego humano na web. À medida que agentes de IA passam de recuperar informações para executar intenções, toda a arquitetura da internet — e os modelos de negócio construídos sobre ela — precisam ser repensados.