Pesquisa para Startup

Introdução

No projeto de hoje,  trabalhando com amostras de dados e fazendo estimativas para a população, no projeto trabalhamos juntos a uma Startup chamada Agility que pretende lançar um curso sobre Técnicas de Trading Algorítmico.

Nesse projeto foi utilizado apenas o Excel como ferramenta e técnicas estatísticas para gerar e validar minha análise. Vou disponibilizar a planilha utilizada no planilhas google ou no meu Github.

Contexto e Objetivo

Os fundadores não têm a certeza sobre a demanda que existe em cima desse mercado, então realizaram uma pesquisa com a sua rede de contatos para decidir se existe demanda sobre esse curso ou não. Essa pesquisa contou com 120 pessoas que preencheram o formulário dentro da plataforma Survey Monkey.

Então eles nos contactaram para resolver seu problema, nossa tarefa será descobrir se a população tem interesse no curso a ser vendido. Se sim, com qual preço médio e se conseguimos entender o perfil dos usuários. Também foi constatado que teriam alguns requisitos importantes antes de começar nossa análise:

- Os fundadores só investiriam tempo com o curso tendo uma taxa de aprovação de 25% pelo menos.

- O preço de venda mínimo para cobrir a operação da startup de 85 reais.

- Também que não era possível deixar valores em branco no formulário, então todas as pessoas que não têm interesse no curso foram preenchidas com algum valor, sendo necessário uma padronização nesses valores.

Desenvolvimento do Projeto

Coleta e Tipos dos Dados

Na base original que foi disponibilizada consta com 6 variáveis, 1 identificador único, 1 variável binária, 1 quantitativa, 1 quantitativa que foi agrupada em faixas e 2 variáveis categóricas. A cada linha é referente a um formulário preenchido, abaixo o metadados dos dados:

Metadados da base.

Preparação dos Dados

De primeiro momento realizo uma busca, para entender como está a qualidade dos dados. Além dos valores das pessoas que não tem interesse, a base apresenta uma boa qualidade, dado que não apresentam dados nulos ou faltantes. Então, criamos uma variável chamada preço e substituímos os valores das pessoas que não tem interesse no curso por 0, segue abaixo uma foto de como ficou:

Substituímos o valor original para zero na coluna preço.

Análise Exploratória

Para análise exploratória foi feita em alguns passos primeiro realizamos análise univariada, após isso realizo a análise bivariada com correlações e depois a implantação da inferência estatística. Essa etapa é feita visando gerar ideias e possíveis hipóteses mais interessantes para agregar do ponto de vista do negócio.

Análise Unidimensional

Nossa variável alvo é “interesse_no_Curso”, ela é uma variável binária que conta como 0 pessoas que não tem interesse e 1 pra pessoas que têm interesse no curso. Obtemos que 39 pessoas teriam interesse no curso ofertado.

Pessoas com interesse no curso.

Também obtemos que o valor mínimo obtido na pesquisa foi de R$ 73 e R$ 110 como valor máximo, os dados do preço apresentaram uma distribuição normal, tendo uma média de R$ 91,46 e mediana R$ 90 reais. E também 75% dos respondentes pagariam até 97 reais no curso.

Distribuição dos preços.

A faixa etária mais frequente no conjunto é a de 35-39 anos, e as com menos ocorrências são menos de 18 (2,5%), 18-24 (4,1%) e 50-54 (3,33%).70% dos respondentes contam com até 39 anos.

Gráfico de Pareto da Faixa Etária.

A base também é predominantemente composta por homens totalizando 72% dos respondentes.

Gênero obtido na amostra.

Mesmo obtendo todas essas informações, que superariam os requisitos propostos pelos investidores, como a nossa base se trata de uma amostra, teremos que fazer uma inferência pra ter a possível confirmação, antes de contactá-los novamente e fazer a confirmação dos requisitos estabelecidos. Porém, irei abordar sobre os perfis dos clientes ou das pessoas que responderam à pesquisa.

Análise Bidimensional

Correlação IV

Primeira parte, realizo o cálculo da correlação para a variável “interesse_no_Curso” e obtenho os seguintes resultados: As variáveis Sexo e Escolaridade apresentam um fraco poder de separação, enquanto faixa etária se torna um pouco mais explicativa tendo um poder médio de separação. Pessoas de 30 a 39 anos são as que mais tendem a ter interesse no curso ofertado, poderia ter uma campanha criada para direcionar o produto direcionada para eles, sendo assim nosso público-alvo.

Tabela IV

Correlação Coeficiente de Determinação

Para entender possíveis associações com o preço médio usamos o coeficiente de determinação, para fazer o cálculo levo em consideração apenas pessoas com interesse no curso.A variável que menos explica sua diferença é a de preço médio. Enquanto o sexo, explica 48% dos preços que vão ser pagos, mulheres e homens tem diferentes opiniões.Já em relação a faixa etária, existe uma forte associação entre as duas variáveis, onde ela explica 90% da diferença de preços. Sendo assim, conforme muda a faixa etária, ocorre diferentes opiniões relacionadas ao preço.

Mesmo obtendo bons resultados, é necessário ter calma e cuidado com esses valores, pois se tratar de uma amostra, pode não ser o valor real, visto que muitas categorias das variáveis continham poucos valores ou nenhum, sendo assim não é possível entender precisamente o perfil dos interessados. Fatores como uma amostra viesada pode ter causada impactos diretos nos valores.

Inferência Estatística

Antes de fazer as estimativas, é bom deixar claro que a nossa amostra não é totalmente representativa, dado que a amostra ou pesquisa contém apenas pessoas a rede de contatos dos investidores o que pode acabar causando o viés de seleção, para ser uma possível amostra válida, seria necessário considerar uma Amostragem Aleatória Simples para realização da pesquisa.

Dito isso, não ficou explicito a prioridade de interesse, então vou realizar dois estudos sobre a inferência estatística, um analisando a população como quem tem interesse no curso e parâmetro de interesse pessoas que buscam aprender sobre o mercado financeiro e outro com o preço médio como parâmetro de interesse e a população como quem compraria o curso.

Levamos em consideração que a confiança em cima do estudo seria 90% o mais adequado, o resultado se encontra abaixo.

Estudo – Interesse no Curso

Necessário voltar aos requisitos onde foi passado que seria necessário um valor de 25% de aprovação pelo menos.

No nosso estudo, obtemos o seguinte resultado: Obtemos o intervalo de confiança de 25,4% e 39,6% isso nos diz que se fosse realizado um grande estudo com 100 diferentes amostras em 90 delas conteriam a real média.

Com base na nossa estimativa, podemos confirmar que eles poderiam investir seu tempo para criar um curso, que a população teria um interesse no curso acima do que foi estabelecido.

Caso os investidores entendam que a margem de erro em 7% seja um valor muito acima do ideal, já realizo o cálculo para descobrir o número de amostras adequado para gerar um melhor resultado e passar para os investidores.

Concluímos que para obter uma margem de erro no valor de 5%, seria necessária uma pesquisa realizada com 240 pessoas, o dobro da amostra que temos no momento.

Estudo – Preço Médio a ser pago

Trabalhando com o preço médio a ser pago no curso, os investidores também tinham um requisito com o valor de venda mínimo sendo de R$ 85.

Obtemos os seguintes valores do intervalo R$ 89,27 e R$ 93,65, assim como no outro estudo, a cada 100 estudos em 90 deles conteriam o real preço médio a ser pago no curso.

Também podemos confirmar com eles que o real preço médio superaria os seus requisitos e pagaria a operação da startup, dado que a população pagaria um valor acima do valor mínimo estabelecido, com base na nossa estimativa.

A margem de erro ficou em 2,19 reais, assim como no outro estudo, caso fique fora do ideal pelos investidores, também estimo o tamanho adequado da amostra e obtenho que o tamanho ideal seria de 80 pessoas para obter uma margem de erro de 1,5%, no estudo foi observado apenas 39 pessoas.

Validação do Projeto

Após realizar as análises, entrego o projeto para os investidores e verifico se os requisitos estabelecidos no começo continuam válidos.

Com os valores obtidos, poderíamos dizer que teríamos a validação para lançar o curso, e assim no futuro (pelo menos uns 3 meses) ter uma nova análise, sendo da base de clientes que compraram o curso.

Assim podendo entender, quais os perfis dos clientes que compram o curso e pode r sugerir possíveis público-alvo para campanhas e assim gerar mais valor para o negócio da startup.

Conclusão

O resultado da análise busca ajudar os investidores da startup com base na análise feita, assim gerando mais segurança e evitar um gasto financeiro desnecessário.

Utilizamos da inferência estatística para trazer mais clareza para os investidores, e entendemos seu possível sucesso no lançamento do curso, visto que bateria suas metas pré-estabelecidas gerando um retorno financeiro agradável para os investidores.

Trabalhos Recentes