Com os gastos com IA empresarial atingindo US$ 37 bilhões e os aplicativos de consumo processando bilhões de solicitações diárias, uma nova geração de startups de infraestrutura está silenciosamente impulsionando o boom.
Saiba a respeito em texto de Eftal Yurtseven, da eachlab.
O mercado de infraestrutura de IA está passando por um crescimento sem precedentes.
O mercado de infraestrutura de IA está passando por um crescimento sem precedentes.
Os gastos com IA corporativa atingiram US$ 37 bilhões em 2025, um aumento de 3,2 vezes em relação ao ano anterior, enquanto os aplicativos de IA para consumidores agora processam mais de 4 bilhões de solicitações diárias, de acordo com a análise mais recente da Andreessen Horowitz dos 100 principais aplicativos de IA para consumidores.
Por trás de cada aplicativo de IA viral existe uma camada crítica que raramente ganha destaque: a infraestrutura de inferência que executa esses modelos em produção. Aqui estão cinco empresas que, discretamente, impulsionam os produtos de IA que mais crescem no mundo.
A Cerebrium conquistou um nicho especializado em infraestrutura de IA de voz e vídeo em tempo real. Enquanto a maioria das plataformas otimiza o rendimento, a Cerebrium se concentra na latência, alcançando tempos de inicialização a frio de apenas 2 segundos e latência de rede inferior a 50 milissegundos.
Por trás de cada aplicativo de IA viral existe uma camada crítica que raramente ganha destaque: a infraestrutura de inferência que executa esses modelos em produção. Aqui estão cinco empresas que, discretamente, impulsionam os produtos de IA que mais crescem no mundo.
Cerebrium: a espinha dorsal da IA em tempo real
A Cerebrium conquistou um nicho especializado em infraestrutura de IA de voz e vídeo em tempo real. Enquanto a maioria das plataformas otimiza o rendimento, a Cerebrium se concentra na latência, alcançando tempos de inicialização a frio de apenas 2 segundos e latência de rede inferior a 50 milissegundos.
A plataforma alimenta cargas de trabalho de produção para Tavus (avatares de vídeo com IA), Deepgram (conversão de voz em texto) e Vapi (assistentes de voz).
Fundada por Michael Louis e Jonathan Irwin, sua execução de contêiner personalizada oferece 40% de economia de computação em comparação com as soluções anteriores.
Beam: GPUs sem servidor e sem espera
A Beam criou seu próprio runtime de contêiner chamado beta9, projetado para iniciar contêineres com suporte a GPU em menos de um segundo.
Adicione um decorador à sua função Python, especifique sua GPU e implante com um único comando.
Centenas de equipes executam cargas de trabalho de produção no Beam, incluindo Coca-Cola e Geospy.
A abordagem de código aberto criou uma próspera comunidade de desenvolvedores que contribui com melhorias e compartilha padrões de implantação.
each::labs: A aposta contrária na IA para consumidores
Enquanto a maioria das empresas de infraestrutura de IA busca contratos corporativos, a each::labs fez uma aposta deliberada na direção oposta: desenvolvedores de IA para consumidores.
“Fizemos uma escolha profundamente contrária”, escreveu o CEO Eftal Yurtseven.
each::labs: A aposta contrária na IA para consumidores
Enquanto a maioria das empresas de infraestrutura de IA busca contratos corporativos, a each::labs fez uma aposta deliberada na direção oposta: desenvolvedores de IA para consumidores.
“Fizemos uma escolha profundamente contrária”, escreveu o CEO Eftal Yurtseven.
“Todos nos diziam para seguir o dinheiro. O caminho seguro. Buscar contratos corporativos.”
A empresa sediada em São Francisco fornece infraestrutura de mídia generativa de ponta a ponta, incluindo modelos visuais, modelos de áudio, modelos de texto e um sistema de fluxo de trabalho do tipo arrastar e soltar.
Os resultados: crescimento de 13 vezes na receita em 12 meses e retenção líquida de receita de 260%.
A empresa sediada em São Francisco fornece infraestrutura de mídia generativa de ponta a ponta, incluindo modelos visuais, modelos de áudio, modelos de texto e um sistema de fluxo de trabalho do tipo arrastar e soltar.
Os resultados: crescimento de 13 vezes na receita em 12 meses e retenção líquida de receita de 260%.
Talvez o mais notável seja que 5% dos 100 principais aplicativos de IA para consumidores da Andreessen Horowitz agora são executados na infraestrutura da each::labs.
“Construímos uma infraestrutura com opiniões”, explica Yurtseven. “Tomamos centenas de decisões para que nossos clientes não precisassem fazer isso.”
“Construímos uma infraestrutura com opiniões”, explica Yurtseven. “Tomamos centenas de decisões para que nossos clientes não precisassem fazer isso.”
A empresa alcançou esse crescimento sem nenhum vendedor. Todos os clientes vieram por indicação. Fundada por Eftal Yurtseven, Ferhat Budak e Canberk Sinangil, sua obsessão pela experiência do desenvolvedor criou o que um cliente descreveu como “uma infraestrutura que não atrapalha”.
Modal: Tornando as GPUs semelhantes a funções
A Modal criou a maneira mais fácil para desenvolvedores executarem cargas de trabalho de IA.
A infraestrutura de IA deve ser tão simples quanto escrever uma função Python, sem Dockerfiles, sem YAML e sem gerenciamento de infraestrutura.
Milhares de clientes executam cargas de trabalho na plataforma. Fundada por Erik Bernhardsson (anteriormente na Spotify) e Akshat Bubna, a execução personalizada da Modal permite inicializações a frio em menos de um segundo, algo que os concorrentes têm dificuldade em igualar.
BentoML: o código aberto chega às empresas
A BentoML seguiu um caminho diferente: primeiro o código aberto. A estrutura para empacotar e implantar modelos de ML foi adotada por milhares de desenvolvedores, o que agora se traduz na adoção pelas empresas.
BentoML: o código aberto chega às empresas
A BentoML seguiu um caminho diferente: primeiro o código aberto. A estrutura para empacotar e implantar modelos de ML foi adotada por milhares de desenvolvedores, o que agora se traduz na adoção pelas empresas.
Fundada em 2018 por Chaoyu Yang, a empresa construiu uma comunidade leal de desenvolvedores que contribuem para o projeto de código aberto, enquanto os clientes empresariais pagam por serviços gerenciados.
A camada de infraestrutura que importa
Essas cinco empresas representam uma mudança mais ampla.
A camada de infraestrutura que importa
Essas cinco empresas representam uma mudança mais ampla.
À medida que os recursos dos modelos se tornaram commodities, o campo de batalha mudou para a infraestrutura.
Os vencedores não serão determinados por quem tem os maiores modelos, mas por quem pode executá-los de forma mais rápida, barata e confiável.
A Cerebrium possui voz e vídeo em tempo real.
A Beam oferece a experiência de GPU sem servidor mais rápida.
A each::labs fornece a pilha integrada para mídia generativa.
A Modal faz com que a infraestrutura pareça funções Python.
A BentoML oferece às empresas o controle de que precisam.
O mercado de infraestrutura de IA deve atingir US$ 96,6 bilhões até 2027.
O mercado de infraestrutura de IA deve atingir US$ 96,6 bilhões até 2027.
As empresas que estão construindo as picaretas e pás para a corrida do ouro da IA podem, em última análise, capturar mais valor do que os próprios garimpeiros.
