Existem basicamente dois grandes conjuntos de dados que podem ser processados para fins de retenção de alunos em Instituições de Educação Superior:
a) Dados Legados: conjunto de informações que o aluno carrega ao ingressar em um curso superior;
b) Dados Novos: gerados a partir do momento de sua matrícula.
Há muito estudamos essa disciplina, anteriormente chamada “Data Based Marketing” e atualmente conhecida como “Big Data” como ferramenta de Marketing Educacional.
Um tema moderno e aderente a Tecnologia da Informação.
Ainda que puristas simplifiquem o uso da caderneta no varejo como um modelo prosaico e viável de big data, entendemos que somente com o processamento adequado torna-se aceitável o risco de tomar decisões de marketing com base em dados.
Os dados devem ser usados para a captação de novos alunos no planejamento de campanhas e nas ações de conversão. No entanto o maior aproveitamento desses insumos está na retenção de alunos por meio da criação de sistemas de prevenção nos quais, por meio de processos de regressão, classificamos os discentes em níveis de risco de evasão antes mesmo do início das aulas.
O maior desafio para criar esses sistemas é a persistência da coleta de dados e o trabalho de estruturação desses modelos divide-se em quatro fases:
1- Criação de um “Super Cadastro” e aplicação junto ao grupo ingressante para levantamento dos dados legados;
2- Persistência na alimentação do “Super Cadastro” com os dados gerados depois da matrícula;
3- Primeira regressão e analise;
4- Políticas e ações de contingenciamento da evasão.
Para o desenvolvimento do cadastro é importante agrupar os dados legados e gerados em algumas dimensões principais e hierarquiza-las de acordo com a realidade da instituição definindo um peso para cada uma das dimensões analisadas.
Fora do Brasil o “big data” é uma realidade e uma das mais importantes táticas de marketing educacional adotada com sucesso em instituições de ensino presencial e a distância.
Os alunos são classificados com graus de risco de evasão e um ingressante já possui um quociente com base nos seus dados legados (o grau de risco por enquadrar-se ou não nas dimensões estabelecidas pelo sistema).
Muitas das dimensões não fazem sentido para a realidade brasileira, mas mostram que nessa área, são os detalhes que contam:
– Where does the student live? On campus, in a fraternity/sorority, off campus? Etc.
– Number of times the prospect visited campus before enrolling in open houses.
Analisando os modelos de dados de dezenas de universidades no exterior e tropicalizando com indicadores do nosso mercado, chegamos ao seguinte conjunto de dimensões componentes de um modelo estruturado para evasão:
1. Dados Legados
a) Social
Data de Nascimento e Idade; Gênero; Status matrimonial; Possui filho (s); Portador de necessidades especiais; Nível de escolaridade dos pais etc.
b) Formação
Ano de conclusão do ensino médio; Rede e colégio de origem etc.
c) Processo Seletivo
Idade ao ingressar na IES; Curso no qual se matriculou; Visitou a IES antes da matrícula; Nota no ENEM, no processo seletivo e na redação; Matriculou-se no início ou no final do processo seletivo etc.
d) Forma de Ingresso
Ingresso por meio de processo seletivo agendado, tradicional, transferência, portador de diploma e segunda graduação etc.
e) Geográfico – CEP
Distância do local de residência e do local de trabalho; Utiliza transporte próprio, transporte público ou não necessita de meios de transporte para chegar a IES; Reside com os Pais etc.
2. Dados Gerados
a) Acadêmico
Número de logs e perfil de navegação em área restrita e AVA; Notas; Disciplinas de adaptação e em regime de dependência; Reprovação; Ausências e carga horária realizada; Atrasos e ausência na ultima aula; ENADE; Número de livros retirados e com devolução atrasada na Biblioteca; Suspensões etc.
b) Financeiro
Atraso no pagamento de mensalidade; Aplicou para Bolsa de Estudos, PROUNI e FIES; Conseguiu o benefício; Percentual de benefício etc.
c) Participação em atividades Extra Classe
Atividades atléticas; Atividades complementares oferecidas pela IES (jornal, centro de idiomas, júri simulado); Outras atividades complementares (grêmio, DCE, D.A, C.A) etc
d) Conexões
Possui amigos; Sofre bulling etc
e) Outros
Número de alunos na sala de aula; Solicitou dispensa por motivos de saúde; Visitas a enfermaria; Expectativa salarial e salário médio de estagiário da área e de profissional recém formado; Reclamações em redes sociais e em canais oficiais; Protocolo de documentação de transferência ou trancamento em secretaria etc.
O número e o peso dado para cada dimensão irá variar de acordo com uma série de fatores e a Instituição somente irá desenvolver um “algoritmo” personalizado e seguro, depois de um longo período mensurando a evasão. Em cada evasão a Instituição irá arquivar a ficha do aluno de forma a criar a massa critica de dados sobre a qual irá fazer suas regressões para a extração da informação.
Dessa forma ao consolidar os dados dos evadidos saberá quanto UM KM de distância da residência ou do local de trabalho pesa percentualmente na probabilidade de um aluno se evadir. Também, entre outros, quanto cada amigo que ele possui pesa na sua retenção e quanto fazer parte de atividades complementares influirá na hora de ir embora.