arrow_back

Aplicar o método RFM para segmentar os dados do cliente

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Aplicar o método RFM para segmentar os dados do cliente

Lab 1 hora 30 minutos universal_currency_alt 2 créditos show_chart Introdutório
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses
ícone de "importante" IMPORTANTE:

ícone de notebook/computador Conclua este laboratório prático usando um computador ou notebook.

ícone de verificação Só 5 tentativas são permitidas por laboratório.

ícone de alvo do teste É comum não acertar todas as questões na primeira tentativa e precisar refazer uma tarefa. Isso faz parte do processo de aprendizado.

ícone de cronômetro Depois que o laboratório é iniciado, não é possível pausar o tempo. Depois de 1h30, o laboratório será finalizado, e você vai precisar recomeçar.

ícone de dica Para saber mais, confira as Dicas técnicas do laboratório.

Informações gerais da atividade

Técnicas de transformação de dados são usadas para preparar os dados de forma a tornar mais fácil para os usuários receberem respostas para suas perguntas sobre negócios com agilidade e eficiência. Um exemplo de análise de dados que muitas vezes exige transformação é a segmentação de clientes.

A segmentação é o processo de dividir dados em grupos com base em características em comum, que pode ser feito para diversos fins, como entender o comportamento dos clientes, identificar tendências e segmentar campanhas de marketing.

O método RFM é uma técnica de segmentação de clientes que significa tempo decorrido desde a última visita, frequência e valor monetário. O tempo decorrido desde a última visita se refere ao tempo desde a última compra do cliente. Frequência se refere ao número de compras que o cliente fez. Valor monetário se refere ao valor total de dinheiro que o cliente gastou.

O método RFM é uma abordagem focada em dados para a segmentação de clientes que pode ser usada para identificar os clientes com mais chances de desistir, com maior potencial de fazer um upsell ou uma venda cruzada. Além disso, pode ser usado para segmentar campanhas de marketing com mais eficácia.

Neste laboratório, você vai usar o BigQuery para aplicar o método RFM e segmentar os dados dos clientes para ajudar a equipe de marketing a decidir a melhor forma de concentrar seus esforços.

Cenário

A TheLook eCommerce constatou um crescimento rápido no número de clientes nos últimos anos, mas, apesar desse crescimento, a retenção e a satisfação dos clientes caíram.

Como analista de dados em nuvem na TheLook eCommerce, você recebeu a tarefa de colaborar com Martina, líder da equipe de marketing, para encontrar uma forma de concentrar melhor os esforços do marketing em toda a base de clientes.

Para isso, você decide fazer uma análise de RFM identificando três comportamentos de cada cliente: o tempo decorrido desde a última compra, a frequência de compras e o valor total de dinheiro gasto. O método RFM é uma técnica de segmentação de clientes que vai ajudar você a classificar clientes em quatro grupos, incluindo Clientes de alto valor, Clientes fiéis, Clientes de risco e Clientes persuasíveis.

Essa análise de RFM pode ajudar a equipe de marketing a identificar o comportamento dos clientes e focar os esforços de marketing nesses comportamentos para manter o engajamento. Para realizar a análise de RFM, você vai usar técnicas de transformação para analisar um conjunto de dados, agregar dados, mesclar dados, derivar dados e aplicar um método estatístico aos dados.

Para esta tarefa, primeiro você vai analisar os dados. Segundo, você vai usar a tabela de pedidos para determinar os pedidos mais recentes e a frequência com que os clientes fazem pedidos. Em terceiro lugar, você vai usar uma junção interna para deduzir o valor total pago pelos 10 principais clientes em 2022. Quarto, você vai criar uma expressão de tabela comum (CTE, na sigla em inglês) para consolidar os resultados da consulta. Por fim, você vai aplicar um método estatístico aos cálculos de RFM para a segmentação de clientes.

Configuração

Antes de clicar em "Começar o laboratório"

Leia as instruções a seguir. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Neste laboratório prático, você pode fazer as atividades por conta própria em um ambiente cloud de verdade, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

  • Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.
  • Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Observação: não use seu projeto ou conta do Google Cloud neste laboratório para evitar cobranças extras na sua conta.

Como iniciar seu laboratório e fazer login no console do Google Cloud

  1. Clique no botão Começar o laboratório. No painel Detalhes do laboratório à esquerda, você verá o seguinte:

    • Tempo restante
    • O botão Abrir console do Google Cloud
    • As credenciais temporárias que você vai usar neste laboratório
    • Outras informações, se forem necessárias
    Observação: se for preciso pagar pelo laboratório, um pop-up vai aparecer para você escolher a forma de pagamento.
  2. Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud (ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima). A página de login será aberta em uma nova guia do navegador.

    Dica: é possível organizar as guias em janelas separadas, lado a lado, para alternar facilmente entre elas.

    Observação: se a caixa de diálogo Escolha uma conta aparecer, clique em Usar outra conta.
  3. Se necessário, copie o Nome de usuário do Google Cloud abaixo e cole na caixa de diálogo de login. Clique em Próximo.

{{{user_0.username | "Nome de usuário do Google Cloud"}}}

Você também encontra o Nome de usuário do Google Cloud no painel Detalhes do laboratório.

  1. Copie a Senha do Google Cloud abaixo e cole na caixa de diálogo seguinte. Clique em Próximo.
{{{user_0.password | "Senha do Google Cloud"}}}

Você também encontra a Senha do Google Cloud no painel Detalhes do laboratório.

Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud. Observação: usar sua própria conta do Google Cloud neste laboratório pode gerar cobranças extras.
  1. Nas próximas páginas:
    • Aceite os Termos e Condições
    • Não adicione opções de recuperação nem autenticação de dois fatores nesta conta temporária
    • Não se inscreva em testes gratuitos

Depois de alguns instantes, o console será aberto nesta guia.

Observação: para acessar a lista dos produtos e serviços do Google Cloud, clique no Menu de navegação no canto superior esquerdo. Menu do console do Google Cloud com o ícone do menu de navegação em destaque

Tarefa 1: analisar os dados

Nesta tarefa, você vai analisar os dados disponíveis no conjunto de dados thelook_ecommerce.

  1. No console do Cloud, no Menu de navegação (Ícone do menu de navegação), selecione BigQuery.
Observação: a caixa de mensagem Olá! Este é o BigQuery no console do Cloud pode aparecer, com links para o guia de início rápido e as notas da versão das atualizações da interface. Clique em Concluído para continuar.
  1. Expanda a lista de conjuntos de dados clicando na seta suspensa ao lado do ID do projeto.

  2. Role a página até o conjunto de dados thelook_ecommerce, expanda ele e estude as tabelas listadas.

Observe as tabelas orders e order_items quando o conjunto de dados for aberto.

  1. Selecione a tabela orders e analise as guias Esquema, Detalhes e Visualização.

  2. Na guia Esquema, perceba as colunas na tabelas, listadas na coluna Nome do campo. Estude as colunas e as informações de Tipo.

  1. Selecione a guia Detalhes e estude as seções Informações da tabela e Informações do armazenamento.

  2. Selecione a guia Visualização, que mostra as primeiras mil linhas de uma tabela.

  3. No painel Explorador, selecione a tabela order_items e analise as guias Esquema, Detalhes e Visualização.

Tarefa 2: encontrar os 10 pedidos mais recentes

O tempo decorrido desde a última visita se refere ao tempo desde a última compra do cliente. Ele é medido em unidades de tempo como dias, semanas ou meses. Uma pontuação maior indica que um cliente fez uma compra mais recente.

Nesta tarefa, você vai calcular o tempo decorrido desde os pedidos dos clientes para determinar se um cliente fez um pedido recentemente. Por exemplo, se a última compra do cliente foi há 400 dias, a pontuação dele é 400.

  1. No BigQuery Studio, clique em + Escrever nova consulta. Uma nova guia Sem título é aberta.
Observação: sempre que você executa uma nova consulta no Editor de consultas, é possível substituir a consulta antiga copiando e colando a nova consulta sobre a anterior na mesma guia Sem título, ou então clicar no ícone Escrever nova consulta (+) para abrir uma nova guia Sem título e executar a consulta.
  1. Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
SELECT user_id AS customer_id, DATE_DIFF(CURRENT_TIMESTAMP(), MAX(created_at), DAY) AS recency, FROM `thelook_ecommerce.orders` GROUP BY user_id ORDER BY recency DESC LIMIT 10;
  1. Clique em Executar.

Na seção Resultados da consulta da guia Resultados, uma tabela mostra os 10 clientes que fizeram um pedido há mais tempo.

Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente. Encontrar os 10 pedidos mais recentes

Tarefa 3: determinar a frequência dos pedidos

Clientes que fazem pedidos com maior frequência são considerados mais engajados com a marca e têm mais chances de fazer novas compras no futuro.

Nesta tarefa, você vai determinar a frequências dos pedidos dos clientes, ou seja, vai contar o número total de pedidos que cada cliente fez. Por exemplo, se um cliente fez 10 pedidos separados, a frequência desse cliente é 10.

  1. Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
SELECT user_id AS customer_id, COUNT(order_id) as frequency, FROM `thelook_ecommerce.orders` WHERE created_at >= '2022-01-01' and created_at < '2023-01-01' GROUP BY customer_id ORDER BY frequency DESC LIMIT 10;
  1. Clique em Executar.

Dica: para encontrar a maior frequência, clique na seta para baixo na tabela e selecione Classificar em ordem decrescente.

Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente. Determinar a frequência dos pedidos

Tarefa 4: determinar o valor total gasto

Valor em dinheiro é o valor total que um cliente gastou com uma empresa em determinado período. Identificar os clientes que gastaram mais dinheiro pode ajudar as empresas a melhorar o relacionamento com os clientes e segmentar os esforços de marketing para os clientes mais lucrativos.

Nesta tarefa, você vai determinar o valor total de dinheiro gasto em 2022 pelos 10 principais clientes. Para isso, você vai usar uma junção interna para conectar as tabelas "order" e "order_items". Você também vai precisar usar o método SUM() para somar o preço de venda.

  1. Copie a consulta a seguir no Editor de consultas. Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
SELECT o.user_id AS customer_id, SUM(oi.sale_price) as monetary FROM `thelook_ecommerce.orders` o INNER JOIN `thelook_ecommerce.order_items` oi ON o.order_id = oi.order_id WHERE o.created_at >= '2022-01-01' and o.created_at < '2023-01-01' GROUP BY customer_id LIMIT 10;
  1. Clique em Executar.

Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente. Determinar o valor total gasto

Tarefa 5: criar uma CTE

Uma CTE, ou expressão de tabela comum, é um conjunto temporário de resultados em uma consulta SQL. Para criá-la, use uma cláusula WITH e uma instrução SELECT nomeada. CTEs geralmente são incluídas em outras instruções SELECT. Elas tornam mais fácil escrever consultas mais complexas sem precisar criar uma nova tabela.

Nesta tarefa, você vai usar uma CTE para escrever uma consulta que combina os cálculos de tempo decorrido desde a última compra, frequência e valor em dinheiro que você fez antes.

  1. Copie a consulta a seguir no Editor de consultas. Reserve um momento para analisar o código SQL. Você consegue prever como serão os resultados da consulta?
WITH rfm_calc AS ( SELECT o.user_id AS customer_id, DATE_DIFF(CURRENT_TIMESTAMP(), MAX(o.created_at), DAY) AS recency, COUNT(o.order_id) AS frequency, ROUND(SUM(oi.sale_price)) AS monetary FROM `thelook_ecommerce.orders` o INNER JOIN `thelook_ecommerce.order_items` oi ON o.order_id = oi.order_id GROUP BY customer_id ) -- Agora você vai retornar os valores dessa CTE SELECT * FROM Rfm_calc;
  1. Clique em Executar.

Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente. Criar uma CTE

Tarefa 6: aplicar um método estatístico aos cálculos de RFM

Valores de RFM medem o tempo desde a última compra de um cliente, a frequência com que esse cliente faz compras e quanto ele gastou em cada compra. Quantis dividem um conjunto de dados em partes iguais. Por exemplo, tercis dividem um conjunto de dados em três partes iguais e quartis dividem em quatro partes iguais.

Nesta tarefa, você vai segmentar os clientes neste exemplo usando os valores de RFM e quantis. Você vai usar a função NTILE() no BigQuery para calcular os quantis dos valores de RFM. Assim, poderá entender melhor como os clientes estão distribuídos em termos dos valores de RFM.

Para isso, crie uma nova CTE chamada rfm_quant. Ela vai usar a função NTILE() para calcular os quantis dos valores de RFM na CTE "rfm_calc" que você criou na etapa anterior.

Depois de criar a CTE rfm_quant, você pode usá-la para segmentar os clientes.

Por fim, use a instrução CASE para atribuir nomes de categorias de segmentação de clientes com base nos quantis produzidos. Uma instrução CASE é uma instrução SQL que permite avaliar várias condições e retornar um valor diferente com base nas condições atendidas.

  1. Copie a consulta a seguir no Editor de consultas:
WITH rfm_calc AS ( SELECT o.user_id AS customer_id, DATE_DIFF(CURRENT_TIMESTAMP(), MAX(o.created_at), DAY) AS recency, COUNT(o.order_id) AS frequency, ROUND(SUM(oi.sale_price)) AS monetary FROM `thelook_ecommerce.orders` o INNER JOIN `thelook_ecommerce.order_items` oi ON o.order_id = oi.order_id GROUP BY customer_id ), -- Aqui você está aproveitando a CTE "rfm_calc" e criando outra CTE rfm_quant AS ( SELECT customer_id, NTILE(4) OVER (ORDER BY recency) AS recency_quantile, NTILE(4) OVER (ORDER BY frequency) AS frequency_quantile, NTILE(4) OVER (ORDER BY monetary) AS monetary_quantile FROM rfm_calc ) --Depois, execute uma consulta SELECT que atribui categorias com base na lógica de quantis e retorna valores SELECT customer_id,recency_quantile, frequency_quantile, monetary_quantile, CASE WHEN monetary_quantile >= 3 AND frequency_quantile >= 3 THEN "High Value Customer" WHEN frequency_quantile >= 3 THEN "Loyal Customer" WHEN recency_quantile <= 1 THEN "At Risk Customer" WHEN recency_quantile >= 3 THEN "Persuadable Customer" END AS customer_segment FROM rfm_quant;
  1. Clique em Executar.

Clique em Verificar meu progresso para confirmar que você concluiu a tarefa corretamente. Aplicar um método estatístico aos cálculos de RFM

Conclusão

Bom trabalho!

Você ajudou a Martina a entender melhor os clientes segmentando os dados.

Primeiro, você analisou os dados.

Segundo, você usou a tabela de pedidos para determinar os pedidos mais recentes e a frequência com que os clientes fazem pedidos.

Terceiro, você usou uma junção interna para deduzir o valor total pago pelos 10 principais clientes em 2022.

Quarto, você criou uma CTE para consolidar os resultados da consulta.

Por fim, você aplicou um método estatístico aos cálculos de RFM para a segmentação de clientes.

Agora você tem experiência prática em usar o BigQuery para calcular o tempo desde a última compra e com que frequência os clientes fazem compras. Você também aprendeu a calcular quanto dinheiro os clientes gastaram combinando duas tabelas. Depois, usou essas tabelas e cálculos para criar uma nova tabela temporária. Isso permitiu que usasse métodos estatísticos para agrupar os clientes em segmentos.

Agora você sabe como usar o método RFM em fontes de dados no BigQuery.

Finalize o laboratório

Antes de encerrar o laboratório, certifique-se de que você concluiu todas as tarefas. Quando tudo estiver pronto, clique em Terminar o laboratório e depois em Enviar.

Depois que você finalizar um laboratório, não será mais possível acessar o ambiente do laboratório nem o trabalho que você concluiu nele.

Copyright 2024 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de empresas e produtos podem ser marcas registradas das empresas a que estão associados.