CRISP-DM (Cross-Industry Standard Process for Data Mining)
- Luiz Henrique de Oliveira Bueno
- 18 de jan.
- 17 min de leitura

Introdução
Eaí, pessoal! Vamos começar com o pé direito esse projeto de mineração de dados da empresa de telecomunicações?
Imagina o seguinte cenário: essa empresa tá enfrentando um grande desafio - a taxa de cancelamento (ou "churn", como a gente diz na área) dos clientes da base fixa tá lá em cima. E isso tá dando dor de cabeça pra todo mundo, desde o pessoal do atendimento até a diretoria.
Então, a gerência resolveu chamar a equipe de ciência de dados pra ver se a gente consegue descobrir o que tá causando esse problema e o que pode ser feito pra resolver. E aí é que entra a minha parte - vou explicar pra vocês, de um jeito bem tranquilo e descontraído, como a gente vai encarar esse desafio.
Primeiro, a gente vai entender bem o negócio da empresa, quais são os objetivos e restrições desse projeto. Afinal, de nada adianta a gente desenvolver um modelo top, se ele não resolver o problema real da empresa, né?
Depois, a gente vai mergulhar fundo nos dados disponíveis - faturas, registros de chamadas, informações dos clientes e tudo mais. Vamos analisar tudo com lupa pra entender o que tá acontecendo por trás desses cancelamentos.
Em seguida, vem a parte de preparar esses dados, deixando tudo certinho e no formato ideal pra usar na modelagem. Isso envolve desde corrigir erros e preencher dados faltantes, até criar novos atributos que possam ajudar a prever o churn.
Aí sim, a gente vai partir pra construção dos modelos preditivos. Vamos testar várias abordagens diferentes, como árvores de decisão e regressão logística, pra ver qual delas consegue prever com mais precisão quais clientes têm maior risco de cancelar o serviço.
E não para por aí, não! Depois de ter o modelo pronto, a gente ainda vai avaliar os resultados, ver se eles atendem aos objetivos da empresa, e planejar como esse modelo vai ser implantado na rotina do negócio.
Então, tá vendo? Não é um processo simples, mas a gente vai fazer tudo passo a passo, com calma e de um jeito bem tranquilo. O importante é ter em mente que o objetivo final é ajudar a empresa a resolver esse problema de churn e melhorar os resultados do negócio.
Então, bora começar? Vamos mergulhar de cabeça nesse projeto e mostrar pra galera como a ciência de dados pode fazer a diferença!
Índice
Capítulo 1 - Entendimento do Negócio
Determinar os Objetivos de Negócio
Avaliar a Situação Atual
Determinar os Objetivos de Mineração de Dados
Produzir o Plano do Projeto
Exemplo Prático
Capítulo 2 - Entendimento dos Dados
Coletar os Dados Iniciais
Descrever os Dados
Explorar os Dados
Verificar a Qualidade dos Dados
Exemplo Prático
Capítulo 3 - Preparação dos Dados
Selecionar os Dados
Limpar os Dados
Construir Novos Atributos
Integrar os Dados
Formatar os Dados
Exemplo Prático
Capítulo 4 - Modelagem
Selecionar a Técnica de Modelagem
Gerar o Design de Teste
Construir o Modelo
Avaliar o Modelo
Exemplo Prático
Capítulo 5 - Avaliação
Avaliar os Resultados
Revisar o Processo
Determinar os Próximos Passos
Exemplo Prático
Capítulo 6 - Implantação
Planejar a Implantação
Planejar o Monitoramento e Manutenção
Produzir o Relatório Final
Revisar o Projeto
Exemplo Prático
Conclusão
Capítulo 1 - Entendimento do Negócio

Essa é a primeira e mais importante fase do CRISP-DM. Aqui, o foco é entender profundamente os objetivos e requisitos do projeto, do ponto de vista do negócio. Vamos detalhar cada uma das principais tarefas dessa fase.
Determinar os Objetivos de Negócio
Imagine que você trabalha em uma empresa de e-commerce que vende diversos produtos online. O principal objetivo de negócio pode ser aumentar as vendas e a fidelização dos clientes atuais. Alguns objetivos secundários podem ser entender melhor o perfil dos clientes, identificar oportunidades de venda cruzada e venda casada, e reduzir a taxa de cancelamento de assinaturas.
É super importante ter esses objetivos de negócio bem claros e definidos. Eles vão guiar todo o projeto de mineração de dados que você vai realizar. Então, converse bastante com os especialistas do negócio para entender quais são as principais metas que eles querem alcançar.
Avaliar a Situação Atual
Nessa tarefa, você vai levantar mais detalhes sobre os recursos disponíveis, restrições, suposições e outros fatores que devem ser considerados.
Por exemplo:
Quais são os dados disponíveis na empresa (registros de vendas, informações dos clientes, estoque, etc.)?
Quem são os especialistas de negócio e de dados que podem ajudar no projeto?
Quais são os requisitos legais e de segurança que precisam ser atendidos?
Quais são os principais riscos e planos de contingência?
Ter esse panorama geral da situação atual é essencial para definir um plano de projeto realista e viável. Você não quer começar um projeto ambicioso sem saber se tem os recursos necessários, certo?
Determinar os Objetivos de Mineração de Dados
Agora, você vai traduzir os objetivos de negócio em termos técnicos de mineração de dados. Por exemplo, ao invés de dizer "aumentar as vendas", você pode definir como objetivo de mineração de dados "prever a probabilidade de um cliente comprar novamente nos próximos 3 meses, com base no histórico de compras, perfil demográfico e interações anteriores".
Aqui, é importante especificar claramente os critérios de sucesso técnicos, como acurácia mínima do modelo, lift em campanhas de marketing, etc. Isso vai te ajudar a saber se o projeto está no caminho certo.
Produzir o Plano do Projeto com base em tudo o que foi levantado, você vai detalhar as etapas a serem executadas no projeto, com duração, recursos necessários, entradas, saídas e dependências. Também é importante analisar os riscos e ter pontos de revisão ao longo do projeto.
Por exemplo, o plano pode prever uma primeira iteração focada em entender o perfil dos clientes, seguida de uma segunda iteração para desenvolver um modelo preditivo de churn, e uma terceira iteração para implementar ações de retenção.
Exemplo Prático: Vamos imaginar um caso real de uma empresa de telecomunicações que queria reduzir a taxa de cancelamento (churn) de clientes da sua base fixa.
Nos objetivos de negócio, ficou definido que o principal objetivo era reduzir a taxa de churn em 20% nos próximos 6 meses. Alguns objetivos secundários eram entender melhor os motivos que levavam os clientes a cancelarem o serviço e identificar oportunidades de ofertas personalizadas para reter esses clientes.
Na avaliação da situação, a empresa identificou que tinha acesso a dados detalhados do histórico de cada cliente, incluindo informações demográficas, plano contratado, histórico de chamadas, reclamações, etc. Havia também uma equipe de analistas de negócio e cientistas de dados disponíveis para o projeto.
Como objetivo de mineração de dados, a empresa definiu o desenvolvimento de um modelo preditivo capaz de identificar clientes com alto risco de cancelamento, com acurácia mínima de 80%. Isso permitiria direcionar ações de retenção de forma mais eficiente.
O plano do projeto previu uma primeira fase de entendimento e preparação dos dados, seguida da construção e avaliação de modelos preditivos, e por fim a implantação do modelo na rotina da empresa, com monitoramento contínuo dos resultados.
Capítulo 2 - Entendimento dos Dados

Depois de definir os objetivos de negócio e o plano geral do projeto, a próxima fase é entender melhor os dados disponíveis. Vamos detalhar cada uma das principais tarefas dessa etapa.
Coletar os Dados Iniciais
Aqui, você vai reunir todos os conjuntos de dados relevantes para o projeto. Isso pode envolver extrair informações de sistemas internos, comprar bases de dados externas ou até mesmo coletar dados com especialistas. É importante documentar detalhes como a origem, método de aquisição e quaisquer problemas encontrados.
No exemplo da empresa de telecomunicações, eles coletaram dados como histórico de faturas, registros de chamadas, reclamações, informações cadastrais dos clientes e até mesmo dados demográficos da região onde cada cliente mora.
Descrever os Dados
Nesta tarefa, você vai examinar as propriedades gerais dos dados coletados, como formato, quantidade de registros e campos, tipos de dados, etc. Isso ajuda a entender melhor a estrutura e características dos dados disponíveis.
Por exemplo, ao descrever os dados da empresa de telecomunicações, você poderia perceber que há muitos campos com valores faltantes, que alguns clientes têm endereços incompletos, e que há uma grande variação no número de chamadas por cliente.
Explorar os Dados
Aqui, você vai usar técnicas de consulta, visualização e relatórios para investigar os dados de forma mais aprofundada. O objetivo é identificar padrões, relacionamentos e insights iniciais que possam direcionar as próximas etapas do projeto.
Voltando ao exemplo, ao explorar os dados, você poderia descobrir que clientes com mais reclamações têm uma taxa de churn muito maior, ou que clientes com planos mais caros tendem a ficar por mais tempo. Esses insights podem ser muito valiosos.
Verificar a Qualidade dos Dados
Por fim, você vai avaliar a qualidade e integridade dos dados, respondendo a perguntas como: Os dados estão completos? Contêm erros? Existem muitos valores faltantes? Essa análise ajuda a identificar problemas que precisam ser tratados na próxima fase de preparação dos dados.
No exemplo da empresa de telecomunicações, você poderia descobrir que há muitos erros de digitação nos endereços dos clientes, ou que alguns registros de chamadas estão faltando informações sobre a duração da ligação.
Exemplo Prático: Vamos continuar com o exemplo da empresa de telecomunicações. Durante a fase de entendimento dos dados, a equipe realizou as seguintes atividades:
Coleta dos Dados Iniciais:
Extraíram os dados de faturas, registros de chamadas e reclamações dos últimos 2 anos a partir dos sistemas internos
Adquiriram uma base de dados demográficos da região com informações sobre renda, idade, tamanho da família, etc. por CEP
Documentaram detalhes como origem, formato e quaisquer problemas encontrados na coleta
Descrição dos Dados:
Identificaram que havia 5 milhões de registros de clientes, com 42 campos diferentes, incluindo informações de contato, plano contratado, histórico de uso e reclamações
Perceberam que havia muitos campos com valores faltantes, especialmente nos endereços e informações demográficas
Exploração dos Dados:
Analisaram a distribuição de variáveis como idade, renda e tempo de permanência dos clientes
Identificaram que clientes com planos mais caros tinham uma taxa de churn 30% menor que clientes com planos mais baratos
Descobriram que clientes com mais de 3 reclamações nos últimos 6 meses tinham 2 vezes mais chances de cancelar o serviço
Verificação da Qualidade:
Detectaram erros de digitação e formatos inconsistentes nos endereços dos clientes
Estimaram que cerca de 15% dos registros tinham pelo menos um campo com valor faltante
Esse entendimento detalhado dos dados foi essencial para planejar as próximas etapas do projeto de maneira eficaz.
Capítulo 3 - Preparação dos Dados

Depois de entender bem os dados disponíveis, a próxima fase é prepará-los para serem usados na modelagem. Essa é geralmente a etapa mais longa e trabalhosa de um projeto de mineração de dados. Vamos detalhar cada uma das principais tarefas dessa fase.
Selecionar os Dados
Aqui, você vai decidir quais dados serão utilizados na análise, com base em critérios como relevância para os objetivos de mineração de dados, qualidade dos dados e restrições técnicas.
Por exemplo, no caso da empresa de telecomunicações, você pode decidir excluir clientes que nunca fizeram uma ligação, já que eles não são relevantes para o objetivo de reduzir o churn. Ou então, pode decidir focar apenas nos clientes com endereço completo, para poder usar informações demográficas na modelagem.
Limpar os Dados
Essa tarefa visa elevar a qualidade dos dados ao nível necessário para as técnicas de análise selecionadas. Isso pode envolver a seleção de subconjuntos "limpos" dos dados, a inserção de valores padrão ou até mesmo técnicas mais avançadas de estimativa de valores faltantes.
Voltando ao exemplo, você poderia corrigir erros de digitação nos endereços, preencher valores faltantes de renda com a média por faixa etária e região, e remover clientes com muitos campos preenchidos de forma inconsistente.
Construir Novos Atributos
Essa tarefa envolve a criação de novos atributos derivados a partir dos dados existentes. Isso pode ser importante para melhorar o poder preditivo dos modelos.
Por exemplo, você poderia criar um atributo "tempo de permanência do cliente" calculado a partir da data de ativação e data atual. Ou então, um atributo "valor médio da fatura" calculado a partir do histórico de faturas.
Integrar os Dados
Aqui, você vai combinar informações de múltiplas tabelas ou fontes de dados para criar novos registros ou valores. Isso é importante quando você tem dados espalhados em diferentes sistemas.
No caso da empresa de telecomunicações, você poderia integrar os dados de faturas, registros de chamadas e reclamações em uma única tabela, de forma a ter todas as informações relevantes sobre cada cliente.
Formatar os Dados
Por fim, você vai fazer ajustes sintáticos nos dados, como mudar a ordem dos atributos ou registros, para atender aos requisitos específicos da ferramenta de modelagem que será utilizada.
Exemplo Prático:Continuando com o exemplo da empresa de telecomunicações, veja como foi a fase de preparação dos dados:
Seleção dos Dados:
Decidiram excluir clientes que nunca fizeram uma ligação, pois não eram relevantes para o objetivo de reduzir o churn
Optaram por focar apenas em clientes com endereço completo, para poder usar informações demográficas na modelagem
Limpeza dos Dados:
Corrigiram erros de digitação e formatos inconsistentes nos endereços
Preencheram valores faltantes de renda, usando a média por faixa etária e região
Removeram clientes com muitos campos preenchidos de forma inconsistente
Construção de Novos Atributos:
Criaram um atributo "tempo de permanência do cliente" calculado a partir da data de ativação
Construíram um atributo "valor médio da fatura" com base no histórico de faturas
Integração dos Dados:
Combinaram os dados de faturas, registros de chamadas e reclamações em uma única tabela
Formatação dos Dados:
Reordenaram os atributos para que o primeiro campo fosse um identificador único do cliente e o último campo fosse a variável alvo (risco de churn)
Após essas etapas de preparação, a equipe obteve um conjunto de dados limpo, integrado e no formato ideal para ser utilizado na modelagem.
Capítulo 4 - Modelagem

Com os dados preparados, a próxima fase é a construção e avaliação de modelos preditivos. Vamos detalhar cada uma das principais tarefas dessa etapa.
Selecionar a Técnica de Modelagem
Aqui, você vai escolher a técnica de modelagem mais adequada para o seu problema, levando em conta fatores como o tipo de problema de mineração de dados, os requisitos da ferramenta selecionada e até mesmo restrições políticas ou de negócio.
Por exemplo, no caso da empresa de telecomunicações, você poderia optar por usar uma árvore de decisão ou regressão logística, já que são técnicas comumente utilizadas para problemas de classificação binária (churn ou não churn).
Gerar o Design de Teste
Antes de construir o modelo, é necessário definir um plano para testá-lo e avaliar sua qualidade. Isso geralmente envolve separar o conjunto de dados em subconjuntos de treinamento, teste e validação.
Por exemplo, você pode usar 70% dos dados para treinar o modelo, 20% para testá-lo e 10% para validá-lo. Dessa forma, você consegue estimar a acurácia do modelo em dados "novos" que ele não viu durante o treinamento.
Construir o Modelo
Nesta tarefa, você vai rodar a ferramenta de modelagem nos dados preparados para criar um ou mais modelos preditivos. Isso envolve ajustar os parâmetros do modelo para obter o melhor desempenho possível.
No exemplo da empresa de telecomunicações, você poderia treinar vários modelos de árvore de decisão com diferentes configurações e métricas de avaliação, como acurácia, precisão, revocação e F1-score.
Avaliar o Modelo
Por fim, você vai interpretar os modelos gerados de acordo com os critérios de sucesso de mineração de dados definidos anteriormente. Isso envolve analisar métricas de desempenho, entender o comportamento do modelo e compará-lo com outros modelos testados.
Voltando ao exemplo, você poderia avaliar que o modelo de árvore de decisão atingiu 82% de acurácia na previsão de churn, o que atende ao critério de sucesso estabelecido. Além disso, você poderia analisar quais são os principais fatores que o modelo usa para prever o risco de churn.
Exemplo Prático
Vamos detalhar como foi a fase de modelagem no exemplo da empresa de telecomunicações:
Seleção da Técnica de Modelagem:
Optaram por usar árvores de decisão e regressão logística, por serem técnicas comumente utilizadas para problemas de classificação binária como churn
Geração do Design de Teste:
Separaram o conjunto de dados em 70% para treinamento, 20% para teste e 10% para validação
Isso permitiria avaliar o desempenho do modelo em dados "novos" que ele não viu durante o treinamento
Construção dos Modelos:
Treinaram diversos modelos de árvore de decisão, ajustando parâmetros como profundidade máxima da árvore e critério de divisão dos nós
Também testaram modelos de regressão logística, ajustando o limiar de classificação entre churn e não churn
Avaliação dos Modelos:
O melhor modelo de árvore de decisão atingiu 82% de acurácia na previsão de churn, atendendo ao critério de sucesso
Analisaram que os principais fatores preditivos eram tempo de permanência do cliente, número de reclamações e plano contratado
Após essa fase de modelagem, a equipe estava pronta para avaliar os resultados do projeto em relação aos objetivos de negócio iniciais.
Capítulo 5 - Avaliação

Nesta fase, o foco é avaliar os resultados dos modelos desenvolvidos e determinar os próximos passos do projeto. Vamos detalhar cada uma das principais tarefas dessa etapa.
Avaliar os Resultados
Aqui, você vai avaliar o grau em que os modelos atendem aos objetivos de negócio definidos inicialmente. Isso envolve comparar os resultados dos modelos com os critérios de sucesso estabelecidos.
Por exemplo, no caso da empresa de telecomunicações, você poderia estimar que o modelo preditivo de churn, se implementado, teria o potencial de reduzir a taxa de churn em 18% nos próximos 6 meses, atingindo praticamente a meta de 20% definida nos objetivos de negócio.
Imagine que você é um especialista em análise de dados nessa empresa. Você teria que explicar de forma clara e objetiva para a liderança como o modelo desenvolvido pode ajudar a atingir os objetivos de negócio. Você precisaria traduzir os resultados técnicos em termos de impacto real para o negócio.
Revisar o Processo
Nesta tarefa, você vai fazer uma revisão mais aprofundada de todo o processo de mineração de dados, para identificar quaisquer fatores importantes que possam ter sido negligenciados.
Isso envolve analisar se todas as etapas foram executadas corretamente, se alguma tarefa foi esquecida ou realizada de forma inadequada, e se há oportunidades de melhoria para projetos futuros.
Imagine que você está conversando com a equipe que participou do projeto. Você precisa entender se eles seguiram corretamente a metodologia CRISP-DM e identificar pontos que podem ser aprimorados na próxima vez.
Determinar os Próximos Passos
Com base na avaliação dos resultados e da revisão do processo, você vai determinar os próximos passos do projeto. Isso pode incluir aprovar o modelo para implantação, realizar mais iterações de modelagem, ou até mesmo iniciar um novo projeto de mineração de dados.
No exemplo da empresa de telecomunicações, a equipe concluiu que o modelo preditivo de churn estava pronto para ser implantado na rotina da empresa. Eles também identificaram a oportunidade de realizar um novo projeto para desenvolver um modelo de propensão a aceitar ofertas de retenção.
Imagine que você é o líder da equipe de ciência de dados. Você precisa decidir quais serão os próximos passos, levando em conta os resultados obtidos e as oportunidades identificadas. Você precisa pensar no melhor caminho para maximizar o impacto do projeto para o negócio.
Exemplo Prático
Vamos detalhar como foi a fase de avaliação no exemplo da empresa de telecomunicações:
Avaliação dos Resultados:
Estimaram que o modelo preditivo de churn teria potencial de reduzir a taxa de churn em 18% nos próximos 6 meses, atingindo praticamente a meta de 20% definida nos objetivos de negócio
Concluíram que o modelo atendia aos critérios de sucesso de mineração de dados, com acurácia de 82%
Revisão do Processo:
Analisaram que todas as etapas do projeto foram executadas corretamente, seguindo o plano inicial
Identificaram oportunidades de melhoria, como realizar mais testes com diferentes técnicas de modelagem e obter mais feedbacks dos especialistas de negócio durante o processo
Determinação dos Próximos Passos:
Decidiram aprovar o modelo preditivo de churn para implantação na rotina da empresa
Planejaram iniciar um novo projeto para desenvolver um modelo de propensão a aceitar ofertas de retenção, visando complementar os esforços de redução de churn.
Capítulo 6 - Implantação

Nesta última fase do CRISP-DM, o foco é planejar e executar a implantação do modelo desenvolvido na rotina do negócio, além de monitorar os resultados a longo prazo. Vamos detalhar cada uma das principais tarefas dessa etapa.
Planejar a Implantação
Aqui, você vai definir como o modelo será integrado aos sistemas e processos da empresa. Isso envolve determinar os requisitos técnicos, as responsabilidades de cada equipe, os procedimentos de implantação e os testes necessários.
Por exemplo, no caso da empresa de telecomunicações, você poderia planejar que o modelo preditivo de churn seria integrado ao sistema de CRM, de forma que sempre que um novo cliente fosse cadastrado, o risco de churn dele fosse calculado e apresentado aos atendentes. Isso permitiria que ações de retenção fossem tomadas de forma proativa.
Planejar o Monitoramento e Manutenção
Essa tarefa visa garantir que o modelo continue a gerar bons resultados ao longo do tempo. Isso envolve definir métricas de monitoramento, estabelecer procedimentos de manutenção e atualização do modelo, e planejar ações corretivas caso haja uma queda no desempenho.
Voltando ao exemplo, você poderia definir que a taxa de churn real dos clientes seria monitorada semanalmente e comparada com as previsões do modelo. Caso houvesse uma divergência significativa, o modelo seria ajustado ou até mesmo retreinado com novos dados.
Produzir o Relatório Final
Nesta tarefa, você vai documentar todo o projeto de mineração de dados, incluindo os objetivos, o processo executado, os resultados obtidos e as lições aprendidas. Esse relatório servirá como referência para futuros projetos e também poderá ser compartilhado com a liderança da empresa.
Imagine que você está escrevendo esse relatório final para a empresa de telecomunicações. Você precisaria explicar de forma clara e concisa como o projeto foi conduzido, quais foram os principais desafios e insights obtidos, e como os resultados do modelo preditivo de churn irão impactar o negócio.
Revisar o Projeto
Por fim, você vai realizar uma análise crítica de todo o projeto, identificando oportunidades de melhoria para projetos futuros. Isso envolve avaliar se os objetivos foram alcançados, se a metodologia CRISP-DM foi seguida corretamente, e se houve algum aprendizado importante que possa ser aplicado em outras iniciativas.
Imagine que você está conversando com a equipe que participou do projeto na empresa de telecomunicações. Você precisa entender quais foram os principais pontos positivos e negativos da experiência, para que possam ser incorporados em futuros projetos de mineração de dados.
Exemplo Prático
Vamos detalhar como foi a fase de implantação no exemplo da empresa de telecomunicações:
Planejamento da Implantação:
Definiram que o modelo preditivo de churn seria integrado ao sistema de CRM da empresa
Sempre que um novo cliente fosse cadastrado, o risco de churn dele seria calculado e apresentado aos atendentes, para que ações de retenção pudessem ser tomadas de forma proativa
Planejamento do Monitoramento e Manutenção:
Estabeleceram que a taxa de churn real dos clientes seria monitorada semanalmente e comparada com as previsões do modelo
Caso houvesse uma divergência significativa, o modelo seria ajustado ou retreinado com novos dados
Produção do Relatório Final:
Documentaram todo o projeto de mineração de dados, incluindo os objetivos, o processo executado, os resultados obtidos e as lições aprendidas
Esse relatório seria compartilhado com a liderança da empresa como referência para futuros projetos
Revisão do Projeto:
Avaliaram que os objetivos de negócio foram alcançados com sucesso, com o modelo preditivo de churn atingindo a meta de redução da taxa de churn
Identificaram oportunidades de melhoria, como envolver os especialistas de negócio de forma mais ativa durante todo o processo.
Ao final dessa fase de implantação, a equipe de ciência de dados da empresa de telecomunicações tinha concluído com sucesso o projeto de mineração de dados, gerando um impacto real para o negócio.
Conclusão
Beleza, vamos fechar com chave de ouro esse projeto de mineração de dados da empresa de telecomunicações!
Depois de passarmos por todas as fases do CRISP-DM - entendimento do negócio, dos dados, preparação, modelagem, avaliação e implantação - a equipe conseguiu desenvolver um modelo preditivo de churn que realmente atendeu aos objetivos da empresa.
Vamos relembrar o que aconteceu:
Lá no início, a gente entendeu que o grande desafio era reduzir a taxa de cancelamento (churn) dos clientes da base fixa. Então a equipe se juntou com os especialistas do negócio pra definir metas claras e entender todos os recursos e restrições do projeto.
Depois, a galera mergulhou fundo nos dados disponíveis - faturas, registros de chamadas, reclamações, informações demográficas e tudo mais. Eles limparam, integraram e prepararam tudo certinho pra poder usar na modelagem.
Na hora de construir os modelos preditivos, testaram várias abordagens diferentes, como árvores de decisão e regressão logística. E o melhor modelo conseguiu prever com 82% de acurácia quais clientes tinham maior risco de cancelar o serviço.
Quando chegou a hora de avaliar os resultados, a equipe ficou super animada! Eles estimaram que, se o modelo fosse implementado, poderia reduzir a taxa de churn em 18% nos próximos 6 meses, quase atingindo a meta de 20% definida lá no início.
Aí veio a parte da implantação, em que eles planejaram integrar o modelo preditivo direto no sistema de CRM da empresa. Assim, sempre que um novo cliente fosse cadastrado, o risco de churn dele seria calculado e os atendentes poderiam agir de forma proativa pra tentar reter esse cliente.
Além disso, eles estabeleceram um plano de monitoramento contínuo, pra ficar de olho se o modelo continuaria entregando bons resultados ao longo do tempo. E pra fechar com chave de ouro, produziram um relatório final detalhando todo o projeto, as lições aprendidas e as próximas oportunidades.
Então, no fim das contas, a equipe conseguiu desenvolver uma solução de mineração de dados que realmente impactou o negócio da empresa de telecomunicações. Eles mostraram como a ciência de dados pode trazer insights valiosos e gerar resultados práticos pra empresa.
Referências Bibliográficas:
"Data Mining: Concepts and Techniques" de Jiawei Han, Micheline Kamber e Jian Pei - Um livro clássico que cobre os principais conceitos e técnicas de mineração de dados.
"An Introduction to Data Mining" de Michael J.A. Berry e Gordon Linoff - Uma ótima introdução prática à mineração de dados e suas aplicações.
"CRISP-DM 1.0: Step-by-step data mining guide" - O documento original que detalha a metodologia CRISP-DM.
Links Úteis:
Site oficial do CRISP-DM: https://crisp-dm.eu/ - Aqui você encontra informações detalhadas sobre a metodologia, incluindo templates e guias.
Tutorial interativo do CRISP-DM: https://www.datascience-pm.com/crisp-dm-tutorial/ - Um ótimo recurso para entender cada etapa do processo de forma prática.
Artigo da IBM sobre a aplicação do CRISP-DM: https://www.ibm.com/cloud/learn/data-mining-techniques - Traz exemplos de como a metodologia pode ser aplicada em diferentes cenários.
Vídeo explicativo do CRISP-DM da Udacity: https://www.youtube.com/watch?v=xRxPcFqhLlE - Uma apresentação em vídeo que resume os principais passos da metodologia.




Comentários