Uma pessoa com cabelo ruivo comprido trabalhando de frente para um computador em uma mesa.
Ir para seção

O que é AIOps?

Copiar URL

AIOps é inteligência artificial para operações de TI. Ela é tanto uma abordagem para operações de TI quanto um sistema de software integrado que utiliza a ciência de dados para complementar a resolução manual de problemas e sistemas. A AIOps combina big data e inteligência artificial ou machine learning (aprendizado de máquina) para aprimorar ou substituir parcialmente uma ampla gama de tarefas e processos de operações de TI.

Para que a IA da AIOps funcione, ela precisa de dados operacionais. Isso inclui detalhes como uptime, downtime, consumo de processamento, tráfego de rede, logs de aplicações, erros, tentativas de autenticação, alertas de firewall e dados históricos. Geralmente, coletar, organizar e limpar esses dados é mais difícil do que incorporar os algoritmos e modelos de aprendizagem.

Depois de estabelecer os dados, é hora de determinar os objetivos de nível de serviço e indicadores. A integridade operacional que servirá como linha de base do sistema de AIOps deve ser definida com métricas rastreáveis. Muitas plataformas empresariais incluem ou têm conexão com componentes de observação operacional: o Red Hat® OpenShift® inclui o Red Hat OpenShift Observability, o Red Hat Enterprise Linux® utiliza o Red Hat Satellite e o Red Hat Ansible® Automation Platform utiliza o Prometheus e o Grafana.

Uma vez definida a integridade operacional, a IA pode ser aplicada. Hoje, é muito fácil incorporar a IA em projetos. 

Com todas as oportunidades disponíveis, expressões como processamento de linguagem natural (NLP), IA, machine learning (ML) e deep learning (DL) já se tornaram parte do vocabulário cotidiano.

Benefícios

  • Velocidade de resolução: a AIOps reduz o downtime ao detectar e reagir a problemas emergentes, diminuindo assim o tempo médio de resolução (MTTR).
  • Sistemas autorrecuperáveis: uma infraestrutura autorrecuperável pode aprimorar significativamente o desempenho e o uptime. 
  • Big data: a AIOps pode limpar, analisar e utilizar big data.
  • Eficiência e escala: aumente a eficiência da equipe usando insights de modelos de IA para identificar ações e escalar a detecção.
  • Inovação: elimine o trabalho repetitivo e permita que a equipe de TI desenvolva projetos mais estratégicos e de maior valor.
  • Simplificação: a AIOp pode simplificar várias tarefas repetitivas de gerenciamento de serviços de TI.
  • Correlação de dados e tomada de decisões em tempo real: quando inclui um mecanismo de automação, a AIOps pode responder automaticamente com base em dados, limitando a intervenção humana, reduzindo erros e minimizando o ruído.
  • Correlação de dados em escala e previsões: a AIOps é capaz de analisar automaticamente todas as combinações possíveis, com qualidade muito superior à que os humanos conseguem entregar manualmente.

Desafios

  • Conhecimento: a necessidade de um extenso know-how em ciência de dados torna complexo até mesmo o início do processo.
  • Infraestrutura: sem plataformas e recursos padronizados (como os fornecidos pelo Red Hat OpenShift e Ansible Automation Platform), pode ser complicado treinar a AIOps para uma infraestrutura específica.
  • Time to value (TTV): sistemas de AIOps podem ser difíceis de desenvolver, implantar e gerenciar, então leva algum tempo para gerar qualquer retorno sobre o investimento.
  • Dados: o volume, a qualidade e a consistência dos dados produzidos por operações de TI modernas podem ser excessivos e difíceis de controlar, e os resultados da AIOps dependem da qualidade das fontes de dados.
  • Acordo coletivo: estabelecer uma linha de base de integridade do sistema e definir metas operacionais padrão requer o apoio de várias partes, e pode ser difícil de alcançar um consenso.
  • Abrangência: a quantidade de itens a considerar antes mesmo de começar pode ser substancial. Também, o ambiente pode simplesmente ser dinâmico demais para estabelecer uma linha de base.
  • Taxas de falha: projetos de IA têm altas taxas de falha. De acordo com o estudo AI InfrastructureView, da IDC, 31% dos entrevistados implementaram a IA na produção, mas apenas um terço observou benefícios em toda a organização.

Por que diferentes tipos de profissionais usariam AIOps?

  • Engenheiros de confiabilidade de sites (SRE) podem definir as quatro métricas principais em que a IA deve focar: latência, taxa de erro, tráfego e saturação.
  • Desenvolvedores podem usar as análises da AIOps para executar suas próprias análises de causa raiz (RCA) ou permitir que o mecanismo da AIOps execute RCA sem intervenção humana.
  • Empresários podem usar AIOps para monitorar as mesmas métricas usadas por SREs para entender o desempenho das aplicações do ponto de vista do usuário final.
  • Operadores de infraestrutura podem utilizar a AIOps para monitorar ambientes de TI baseados em microsserviços, nuvem híbrida e multicloud com desde algumas máquinas virtuais (VMs) até milhares de clusters, e também para simplificar operações do dia 2.

Esses casos de uso mostram que a AIOps ajuda as equipes a detectar e reagir a potenciais problemas. No entanto, esses sistemas ainda não são capazes de substituir administradores de TI experientes e outros membros da equipe de operações. Assim como a maioria das revoluções em TI, a AIOps apenas permite que máquinas executem nossas tarefas enquanto as monitoramos.

Ou seja, as máquinas não estão substituindo humanos. No entanto, cientistas de dados e engenheiros de DevOps podem aproveitar essa revolução para ampliar suas habilidades.

  • O monitoramento do desempenho de aplicações (APM) se tornará mais importante à medida que as empresas buscam candidatos com experiência voltada para o desempenho.
  • Será cada vez mais importante entender, incorporar e escrever os scripts de IA subjacentes, além de conseguir transformar correlações de eventos e mecanismos de alerta em mecanismos de execução. 
  • Se você já tem conhecimento em IA, comece a experimentar (de forma segura) com IA de rede (SD-WAN, Wi-Fi etc).

O DevOps envolve fazer pequenas melhorias incrementais e constantes ao longo de todo o ciclo de vida da aplicação. Portanto, a limitação do DevOps é o downtime. É aí que a AIOps entra em cena. A AIOps complementa a cultura do DevOps, incorporando a ciência de dados aos processos de desenvolvimento e operações. 

A AIOps não substitui o DevOps: ela é uma evolução do DevOps. Ela é mais uma fase do mesmo ciclo de transformação digital. AIOps e DevOps compartilham as mesmas responsabilidades. A AIOps simplesmente aprimora a inteligência humana com um cérebro mecanizado. 

Embora as fronteiras reais entre o DevOps e a AIOps se misturem bastante, a AIOps se encaixa bem em qualquer ponta dos processos do DevOps:

  • No front-end, a AIOps consegue consumir quantidades enormes de dados da infraestrutura e alertar engenheiros de DevOps sobre problemas subjacentes do ambiente de desenvolvimento integrado (IDE) ou simplesmente corrigi-los. 
  • Na outra extremidade, a AIOps pode solucionar automaticamente problemas de TI redundantes na produção, enquanto aprendem a remediar novos bugs que surgem a cada lançamento. 

Assim como no DevOps, não existe uma única ferramenta, plataforma ou produto de AIOps. As ferramentas usadas para desenvolver os recursos de DevOps e AIOps são tão numerosas e únicas quanto seu stack de TI (hardware e software). Qualquer solução de AIOps que você desenvolver precisa integrar, analisar e reagir a todos os elementos que tornam seus ambientes de desenvolvimento e produção únicos.

A AIOps tem uma forte presença no open source, seja nos projetos de upstream ou nas comunidades. Embora nenhum produto represente uma solução de AIOps completa, existem muitos projetos open source de desenvolvimento, operações, IA e automação que podem ser usados na sua solução de AIOps particular. Além disso, muitos projetos open source que visam oferecer soluções para problemas específicos de AIOps estão em desenvolvimento.

As empresas estão liberando códigos de produtos de IA downstream como projetos upstream:

  • A Meta, o maior conglomerado de redes sociais do mundo, lançou o grande modelo de linguagem Llama 2 como um projeto open source.
  • Na Red Hat, esperamos que o projeto open source Project Thoth gere soluções de nível empresarial robustas, da mesma forma como o Project Wisdom resultou no Ansible Lightspeed  com o IBM watsonx Code Assistant, do Ansible Automation Plaform.
  • Também estamos contribuindo com iniciativas de outras organizações, como o projeto de AIOps do Artificial Intelligence Center of Excellence (AICoE).

Aliada aos recursos de IA dos nossos parceiros, nossa plataforma de automação pode dar à sua empresa uma grande vantagem na criação de uma solução estratégica de AIOps, combinando os recursos de observação da IA com a arquitetura orientada a eventos do nosso mecanismo de automação. 

Use o Event-Driven Ansible para reagir com base nas descobertas da sua IA. Combine nossa plataforma de automação com os mecanismos de IA causal dos nossos parceiros (como os oferecidos pela Dynatrace e outras ferramentas modernas de observabilidade). Use também o Ansible Lightspeed com o IBM watsonx Code Assistant para ajudar desenvolvedores e equipes de operações de todos os níveis de habilidade a escrever códigos sintaticamente corretos com recomendações geradas por IA.

Leia mais

Artigo

Noções básicas do Ansible

O Ansible automatiza processos de TI como provisionamento e gerenciamento de configuração. Conheça as noções básicas do Ansible com esta introdução aos principais conceitos.

Artigo

O que é gerenciamento de processos de negócios?

Gerenciamento de processos de negócios (BPM) é a prática de modelar, analisar e otimizar processos de ponta a ponta para alcançar os objetivos estratégicos.

Artigo

Por que escolher a Red Hat para a automação?

O Red Hat Ansible Automation Platform oferece todas as ferramentas necessárias para compartilhar a automação entre as equipes e implementá-la por toda a empresa.

Leia mais sobre automação

Soluções Red Hat

Os consultores estratégicos da Red Hat fornecem uma visão geral da sua organização, analisam os desafios e ajudam a superá-los com soluções abrangentes e econômicas.

Uma plataforma com suporte completo para implementar a automação em escala, de ponta a ponta.

Conteúdo adicional

Treinamentos Red Hat

Treinamento gratuito

Ansible Essentials: Simplicity in Automation Technical Overview

Treinamento gratuito

Red Hat Ansible Automation for SAP