1. Introdução — a confusão entre os três termos
Se você é CTO ou Head de Dados em uma empresa brasileira de médio porte, provavelmente tem pelo menos um piloto de IA parado e pelo menos uma reunião marcada para discutir por quê. Parte do problema é conceitual. Os termos DataOps, MLOps e AIOps são usados de forma intercambiável no mercado, e essa confusão tem custo real — empresas investem em ferramentas de MLOps enquanto o problema está em DataOps, contratam especialistas em uma disciplina quando precisam de outra, e tentam resolver problemas operacionais com ciência de dados.
Esta nota estabelece definições técnicas rigorosas baseadas em como essas disciplinas funcionam na prática em Google Cloud. Ao final, você terá clareza sobre cada uma, um framework para entender como elas se relacionam, e nosso argumento técnico para operar especificamente na intersecção.
2. O que é DataOps
DataOps é a disciplina de aplicar princípios de DevOps a pipelines de dados. Em termos operacionais, significa tratar dados com o mesmo rigor que software em produção — versionamento, testes automatizados, CI/CD, observabilidade e governança.
Uma prática madura de DataOps cobre ingestão confiável e versionada com Dataflow, Pub/Sub e Cloud Storage; transformação testada e reproduzível com Dataform sobre BigQuery; qualidade de dados validada automaticamente em cada etapa; lineage rastreável de ponta a ponta com Dataplex; governança e controle de acesso com IAM e DLP; monitoramento proativo com Cloud Monitoring; e catálogo de dados navegável para descoberta interna.
DataOps é a disciplina que faz com que os dados que alimentam decisões e modelos sejam confiáveis, rastreáveis e auditáveis. Sem DataOps, todo o resto é construído sobre areia movediça.
3. O que é MLOps
MLOps é a disciplina de operacionalizar o ciclo de vida de modelos de machine learning — desde o experimento inicial até a operação em produção com retreinamento contínuo.
Os componentes principais incluem versionamento explícito de datasets, código e modelos, garantindo reprodutibilidade total. Vertex AI Model Registry cuida dos modelos; BigQuery snapshots e Dataform cuidam dos datasets. O treinamento acontece em pipelines declarativos com Vertex AI Pipelines, substituindo notebooks pessoais por código que qualquer engenheiro consegue executar com os mesmos resultados. Deploy automatizado com rollback é entregue por Vertex AI Endpoints. Feature stores garantem consistência entre treino e inferência. Monitoramento de performance e drift em produção identifica degradação antes que afete o negócio. Retreinamento acionado por eventos ou agendado fecha o ciclo de vida.
MLOps é disciplina bem estabelecida — existe bibliografia sólida, ferramentas maduras, padrões consolidados. É a mais documentada das três. O ponto crítico que frequentemente passa despercebido: MLOps resolve o ciclo de vida do modelo, mas depende fundamentalmente de DataOps para funcionar. Um modelo em produção com dados ruins é só uma forma mais elaborada de tomar decisões erradas.
4. O que é AIOps
AIOps tem duas definições circulando no mercado, e é importante entender ambas.
Definição tradicional (AI for IT Operations): AIOps como a aplicação de IA para automatizar operações de infraestrutura — detecção de anomalias em sistemas, predição de falhas, correlação de eventos em ambientes complexos. Definição que Gartner popularizou em 2017, focada em monitoramento de infraestrutura.
Definição moderna (Operations for AI): AIOps como a disciplina de operacionalizar sistemas baseados em IA, especialmente modelos de linguagem e agentes, em produção. Definição emergente com o surgimento de agentes de IA e a necessidade de monitorar comportamentos emergentes, consumo de tokens, hallucinations e cadeias de raciocínio.
Adotamos a segunda definição. Ela endereça os problemas reais das empresas hoje — modelos de linguagem que funcionam em desenvolvimento mas custam fortunas em produção, agentes que alucinam em casos extremos, sistemas multi-agente com comportamento imprevisível.
Os componentes de AIOps na definição moderna incluem monitoramento de custo por inferência e token via Cloud Billing; observabilidade de cadeias de raciocínio em agentes via Cloud Logging customizado; detecção de hallucinations e desvios factuais; versionamento de prompts e contextos como código; A/B testing de modelos e configurações em Vertex AI Endpoints; gestão de contexto e memória de agentes; e compliance e auditabilidade de decisões automatizadas.
MLOps foi construído para modelos supervisionados treinados em datasets fechados. AIOps moderno precisa lidar com modelos que geram conteúdo, agentes que tomam decisões e sistemas multi-agente que colaboram. São paradigmas diferentes.
5. Onde as três se sobrepõem
A sobreposição é real e gera confusão por bons motivos.
DataOps ∩ MLOps: feature stores, versionamento de datasets de treino, qualidade de dados para training sets. Intersecção onde morre a maioria dos projetos de ML — porque o time de dados e o time de ML trabalham em silos, e ninguém é dono da qualidade dos dados que alimentam os modelos.
MLOps ∩ AIOps: monitoramento de modelos em produção, detecção de drift, retreinamento automatizado. Ambas disciplinas precisam dessa camada, mas AIOps moderno adiciona observabilidade específica para LLMs e agentes que não existia em MLOps tradicional.
DataOps ∩ AIOps: dados operacionais que alimentam agentes em tempo real, governança de RAG (retrieval augmented generation), lineage de informação que vai para contexto de LLM. Intersecção mais nova, menos documentada, e exatamente onde vemos a maior oportunidade no mercado brasileiro.
6. Por que operamos na intersecção DataOps + AIOps
Três argumentos técnicos sustentam nossa posição.
Primeiro, MLOps puro está bem servido no mercado. Consultorias maduras, ferramentas consolidadas, base de conhecimento grande. Entrar em MLOps puro é competir em mercado maduro com margens comprimidas.
Segundo, DataOps e AIOps são disciplinas onde o mercado brasileiro está 2 a 3 anos atrás dos Estados Unidos. Oportunidade real — empresas precisam agora, poucos players brasileiros posicionados especificamente, demanda cresce com cada projeto de IA generativa que entra em produção.
Terceiro, a intersecção DataOps + AIOps é o que falta para empresas saírem de pilotos e chegarem em produção. Não é falta de modelos bons. Não é falta de cientistas de dados. É falta de operação de dados confiável e operação de IA monitorada.
Operamos na intersecção DataOps + AIOps em Google Cloud porque é onde estão os projetos travados de empresas brasileiras hoje, e porque é a disciplina menos endereçada pelo mercado local. Não é uma aposta — é uma leitura do problema real.
