Saltar para o conteúdo principal
A migração de dados históricos é o processo de transferência de métricas de desempenho e dados de eventos da plataforma de anúncios anterior de um cliente para acelerar os modelos de machine learning do Topsort e reduzir o período de aprendizado inicial durante a transição de plataforma.

Problema

Quando os clientes migram para o Topsort, suas campanhas enfrentam um problema de cold start onde:
  • Sem Histórico de Desempenho: Novas campanhas começam sem nenhum dado de desempenho histórico
  • Período de Aprendizado: Modelos de machine learning requerem 1-4 semanas para acumular dados suficientes para otimização
  • Desempenho Subótimo: Durante o cold start, as campanhas podem ter desempenho inferior devido à falta de dados de treinamento
  • Frustração do Anunciante: Anunciantes podem experimentar efetividade reduzida de campanha nas semanas iniciais
Enquanto a Migração de Campanhas lida com a estrutura e configurações da campanha, a migração de dados históricos especificamente aborda dados de desempenho para acelerar o treinamento do modelo e otimização.

Solução

Nós fornecemos uma solução de ingestão de dados históricos que importa métricas de desempenho e dados de eventos da plataforma anterior do cliente. Estes dados servem como material de treinamento inicial para os modelos de machine learning do Topsort, reduzindo significativamente o período de cold start.

Como os Dados Históricos Ajudam

Aceleração do Treinamento do Modelo:
  • Fornece dados de treinamento imediatos para algoritmos de machine learning
  • Reduz o período de cold start de 4 semanas para 1-2 semanas
  • Permite otimização de campanha e decisões de lances mais rápidas
Continuidade de Desempenho:
  • As campanhas podem aproveitar padrões de desempenho históricos
  • Melhores recomendações de lance inicial baseadas em dados passados
  • Decisões de segmentação melhoradas a partir do comportamento histórico do usuário
Redução de Risco:
  • Minimiza a queda de desempenho durante a transição de plataforma
  • Mantém a confiança do anunciante com níveis de desempenho familiares
  • Fornece métricas de linha de base para comparação e otimização

Implementação Técnica

Nossa integração de dados históricos:
  • Ingere dados de eventos incluindo impressões orgânicas, cliques e compras
  • Processa métricas de desempenho nos níveis de campanha, produto e usuário
  • Treina modelos iniciais usando dados históricos importados antes do go-live
  • Calibra algoritmos durante a operação inicial para desempenho ótimo
  • Atualiza embeddings para usuários, produtos e posicionamentos com base em padrões históricos

Processo de Migração

1

Avaliação de Dados e Definição de Escopo

Avaliar Disponibilidade de Dados Históricos
  • Avaliar quais dados de desempenho estão disponíveis da plataforma anterior
  • Determinar a qualidade e completude dos dados
  • Definir o intervalo de tempo para dados históricos (tipicamente 3-6 meses)
  • Identificar métricas-chave que se alinham com o rastreamento do Topsort
 
2

Exportação e Preparação de Dados

Tipos de Dados Históricos Necessários:
  • Métricas de desempenho de campanha (impressões, cliques, conversões, gastos)
  • Dados de desempenho no nível do produto (taxas de cliques, taxas de conversão)
  • Eventos de comportamento do usuário (buscas, visualizações, compras)
  • Padrões de tráfego orgânico e tendências sazonais
  • Histórico de utilização de lances e orçamento
Todos os dados históricos devem estar em conformidade com regulamentações de privacidade. Dados no nível de usuário devem ser anonimizados ou agregados quando exigido por leis locais de privacidade.
3
 
4

Validação e Processamento de Dados

Etapas de Garantia de Qualidade:
  • Validar completude e precisão dos dados
  • Normalizar métricas para corresponder ao esquema de dados do Topsort
  • Limpar e processar dados para treinamento do modelo
  • Identificar e lidar com anomalias ou outliers de dados
 
5

Treinamento e Calibração do Modelo

Processo de Treinamento Inicial:
  • Importar dados históricos para o pipeline de treinamento do Topsort
  • Treinar modelos iniciais de machine learning usando padrões históricos
  • Calibrar algoritmos para desempenho ótimo
  • Validar precisão do modelo em relação a resultados históricos conhecidos
 
6

Implantação em Produção e Monitoramento

Processo de Go-Live:
  • Implantar modelos treinados no ambiente de produção
  • Monitorar desempenho inicial em relação às linhas de base históricas
  • Ajustar finamente algoritmos com base em novos dados em tempo real
  • Gradualmente mudar da otimização de dados históricos para dados em tempo real

Requisitos de Dados

Métricas de Desempenho Necessárias

Categoria de MétricaCampos NecessáriosFormato de Exemplo
Desempenho de Campanhacampaign_id, date, impressions, clicks, conversions, spendcampaign-123, 2024-01-15, 1000, 50, 5, 25.00
Desempenho de Produtoproduct_id, campaign_id, date, impressions, clicks, ctr, conversion_rateprod-456, campaign-123, 2024-01-15, 100, 10, 0.10, 0.02
Eventos de Usuáriouser_id (anonimizado), event_type, product_id, timestamp, valueuser-789, purchase, prod-456, 2024-01-15T10:30:00Z, 49.99
Tráfego Orgânicoproduct_id, date, organic_impressions, organic_clicks, search_termsprod-456, 2024-01-15, 500, 25, "summer shoes"

Exemplos de Formato CSV

Dados de Desempenho de Campanha:
campaign_id,date,impressions,clicks,conversions,spend,ctr,conversion_rate
campaign-123,2024-01-15,1000,50,5,25.00,0.05,0.10
campaign-124,2024-01-15,800,40,3,20.00,0.05,0.075
Dados de Desempenho de Produto:
product_id,campaign_id,date,impressions,clicks,conversions,revenue
prod-456,campaign-123,2024-01-15,100,10,2,49.98
prod-457,campaign-123,2024-01-15,150,8,1,24.99
Dados de Eventos de Usuário:
user_id,event_type,product_id,timestamp,value,campaign_id
user-789,view,prod-456,2024-01-15T10:00:00Z,,
user-789,click,prod-456,2024-01-15T10:05:00Z,,campaign-123
user-789,purchase,prod-456,2024-01-15T10:30:00Z,49.99,campaign-123

Processo de Treinamento do Modelo

Treinamento de Integração

Processamento de Dados Inicial:
  • Dados de eventos históricos são integrados aos pipelines de treinamento
  • Modelos são treinados usando 3-6 meses de dados de desempenho históricos
  • Embeddings iniciais são criados para usuários, produtos e campanhas
  • Previsões de desempenho de linha de base são estabelecidas

Otimização Contínua

Aprendizado Contínuo:
  • Atualizações Diárias: Embeddings de busca de ID atualizados com novos dados
  • Retreinamento Semanal: Retreinamento completo do modelo incorporando dados históricos e novos
  • Adaptação em Tempo Real: Embeddings de comportamento do usuário atualizados continuamente
  • Monitoramento de Desempenho: Comparação de desempenho histórico vs. atual
A combinação de dados históricos e aprendizado em tempo real tipicamente alcança desempenho ótimo dentro de 2-3 semanas, comparado a 4-6 semanas apenas com cold start.

Métricas de Sucesso

O sucesso da migração de dados históricos é medido por:
  • Período de Cold Start Reduzido: Tempo de aprendizado diminuído de 4 semanas para 1-2 semanas
  • Continuidade de Desempenho: Desempenho de campanha dentro de 10-15% dos níveis históricos desde o primeiro dia
  • Precisão do Modelo: Precisão de previsão melhorada em 20-30% comparado a cenários de cold start
  • Satisfação do Anunciante: Confiança do anunciante mantida ou melhorada durante a transição

Integração com Migração de Campanhas

Processos Complementares

A migração de dados históricos funciona junto com a Migração de Campanhas:
  1. Estrutura de Campanha: A migração básica de campanha lida com configurações, orçamentos e segmentação
  2. Dados de Desempenho: A migração de dados históricos fornece a base de desempenho
  3. Benefício Combinado: Juntos, eles garantem campanhas funcionais e desempenho otimizado desde o primeiro dia

Sequência Recomendada

  1. Completar a Migração de Campanhas primeiro para estabelecer a estrutura da campanha
  2. Executar a migração de dados históricos em paralelo durante a fase de testes
  3. Implantar tanto a estrutura da campanha quanto os modelos treinados simultaneamente
  4. Monitorar desempenho em relação às linhas de base históricas
A migração de dados históricos requer coordenação técnica adicional e pode estender o cronograma geral de migração em 1-2 semanas para treinamento e validação do modelo.

Próximos Passos

Para clientes interessados em migração de dados históricos:
  1. Avaliar disponibilidade de dados da sua plataforma atual
  2. Coordenar equipes técnicas para discutir requisitos de dados históricos
  3. Planejar extração de dados junto com o cronograma de migração de campanha
  4. Coordenar com a equipe de machine learning para requisitos de treinamento do modelo

Última atualização: