A OpenAI abriu as portas para colocar aplicativos diretamente dentro do ChatGPT: agora dá para pedir músicas ao Spotify ou aprender um tema com o Coursera sem sair da conversa — basta mencionar o app compatível 🎯.
O movimento fica ainda maior porque a OpenAI vai aceitar propostas de apps para avaliar e disponibilizar direto no ChatGPT, sinal de que a ferramenta caminha para virar um ecossistema próprio, com potencial para rivalizar com o Android da Google e o iOS da Apple 🚀.
“Queremos que o ChatGPT seja uma boa forma de as pessoas progredirem, sejam mais produtivas, inovadoras, que aprendam mais rapidamente, que façam melhor o que quer que queiram fazer nas suas vidas”. “[As apps dentro do ChatGPT] vão permitir uma nova geração de apps que são interativas, adaptativas e personalizadas com as quais podes conversar”.
As palavras são de Sam Altman, cofundador e CEO, durante a apresentação.
A keynote do Dev Day aconteceu hoje em São Francisco, com 1.500 pessoas na plateia. A gravação está no YouTube.
Crescimento em números 📈
- 2023: 2 milhões de desenvolvedores e 300 milhões de tokens por minuto.
- 2025: 4 milhões de desenvolvedores e 6 bilhões de tokens por minuto.
Talvez a OpenAI continue sendo a única empresa a escalar tão rápido em tão pouco tempo em base de usuários.
Principais novidades
- Apps em ChatGPT (Apps SDK em preview): já dá para conversar com @Zillow sobre imóveis ou pedir um pitch deck ao @Canva, tudo dentro do ChatGPT. Quem já tem servidores MCP pode expor seus agentes e aproveitar a escala de distribuição da OpenAI. Soa como um modelo de negócios à la App Store 😉.
- AgentKit: automatize fluxos de trabalho em experiência low-code/no-code. Há guardrails e nós HITL (human-in-the-loop) embutidos. Lembra N8N e o Microsoft Power Automate + Copilot (com Aprovações no Power Automate).
- Codex: um assistente real de codificação para quem empreende ou tem uma ideia e quer tirar do papel.
- Modelos e APIs: GPT5-Pro na API; Sora 2 para geração de vídeo; e Realtime-mini-gpt para áudio.
A demo que roubou a cena: sem escrever código, o time conectou uma câmera Sony na sala usando uma camada de API antiga que o Codex encontrou, pareou um controle do Xbox para comandar a câmera ao vivo e fez a máquina tirar uma foto — tudo por uma interface de áudio em tempo real. De tirar o fôlego 🎥🎮.
No geral, boas notícias para a indústria. Direcionalmente parecido com outras frentes, mas a OpenAI parece ter mais chance de executar com velocidade de startup.
Para PMs em IA, acompanhar essas tendências ajuda — e um bom resumo cai bem quando falta tempo. Como você está integrando seus apps corporativos com IA?
Anúncios de produto
- Apps in ChatGPT: converse com apps direto no ChatGPT e crie-os com o Apps SDK (preview).
- AgentKit: toolkit para agentes prontos para produção.
- Sora 2 na API: gere vídeo no seu app com o modelo mais recente.
- Codex: novos recursos como integração com Slack, Codex SDK e controles enterprise — agora em disponibilidade geral.
- GPT-5 Pro na API: o modelo mais inteligente da API para tarefas que exigem precisão.
- gpt-realtime-mini: modelo de voz menor, 70% mais barato que o grande.
- gpt-image-1-mini: geração de imagens com um modelo 80% mais barato que o maior.
Ainda absorvendo tudo, mas tem muita coisa boa (Apps SDK, AgentKit, Sora 2 na API) 🧩.
PRINCIPAIS NOVIDADES
1) Aplicativos dentro do ChatGPT (Apps SDK)
Lançado em preview, o Apps SDK permite criar apps conversacionais, interativos, adaptativos e personalizados, com stack completa: conectar dados, acionar ações e renderizar UI interativa. É baseado no padrão aberto MCP (Media Control Protocol) e pode alcançar centenas de milhões de usuários do ChatGPT.
Como descobrir e monetizar: os apps podem ser chamados pelo nome (“Figma, transforme este rascunho em um diagrama”) ou sugeridos automaticamente quando fizer sentido (por exemplo, sugerir Spotify para criar uma playlist). Monetização virá depois, incluindo o novo Protocolo Agentic Commerce para checkout instantâneo dentro do ChatGPT.
Experiências dinâmicas: demos mostraram experiências ricas em vídeo (Coursera) e visuais (Canva, Zillow), com o app expondo contexto de volta ao modelo — como filtrar resultados em um mapa interativo.
2) Construção de agentes ficou mais simples (AgentKit)
Chega para reduzir a dor de orquestração e avaliação que impede agentes de irem à produção. Disponível para todos a partir de hoje.
- Agent Builder: canvas visual para desenhar etapas, testar fluxos e publicar, baseado na Responses API, com ferramentas, intervenção humana, guardrails e nós lógicos.
- ChatKit: interface de chat simples e incorporável para levar experiências de chat ao app do desenvolvedor, mantendo marca e fluxos próprios.
- Evals for Agents: métricas e avaliação com rastreamento passo a passo, datasets para nós individuais, otimização automática de prompts e testes em modelos externos.
- Connector Registry: conecte agentes com segurança a ferramentas internas e sistemas de terceiros em um painel administrativo.
Exemplos: a Albertsons criou um agente que analisa contexto completo (sazonalidade, tendências) de queda de vendas e recomenda ações. A HubSpot turbinou a IA Breeze para responder clientes buscando em bases e políticas. Em demo ao vivo, um agente funcional (“Ask Froge”) foi construído em menos de 8 minutos com o Agent Builder, incluindo guardrails e widgets customizados.
3) Facilidade na escrita de software (Codex)
O Codex saiu do research preview e está em GA, rodando no novo modelo GPT5-CODEX (uma versão do GPT-5 treinada para codificação agêntica). Ele brilha em refatoração, revisão e ajusta dinamicamente o “tempo de pensamento” conforme a complexidade.
Uso em alta: mensagens diárias cresceram 10x desde o início de agosto. Dentro da OpenAI, engenheiros que usam o Codex entregam 70% mais pull requests por semana. Na Cisco, revisões ficaram 50% mais rápidas e prazos caíram de semanas para dias.
Novidades para times: integração com Slack, novo Codex SDK para estender/automatizar no fluxo de trabalho e ferramentas de administração/relatórios (controles de ambiente, monitoramento e painéis).
Demo: do rascunho e da voz ao software rodando, conectando uma câmera Sony FR7 e um controle de Xbox, além de protocolos complexos e sistemas de iluminação — tudo via prompt ou voz, sem escrever código manualmente.
4) Modelos e APIs
GPT-5 Pro: o mais inteligente já lançado pela OpenAI, disponível na API para tarefas que exigem precisão e profundidade (finanças, jurídico, saúde).
Sora 2 em preview na API: controle bem mais fino, seguindo instruções detalhadas e mantendo estado. Agora sincroniza som e imagem, incluindo paisagens sonoras, áudio ambiente e efeitos sincronizados. Suporta diferentes durações, proporções e resoluções. A Mattel já usa para acelerar concepts de anúncios de e-commerce.
GPT-Realtime-Mini: modelo de voz menor, 70% mais barato, com mesma qualidade e expressividade. A OpenAI acredita que a voz tende a virar um dos principais jeitos de conversar com IA 🎤.