La migración de datos históricos es el proceso de transferir métricas de rendimiento y datos de eventos de la plataforma publicitaria anterior de un cliente para acelerar los modelos de aprendizaje automático de Topsort y reducir el período de aprendizaje inicial durante la transición de la plataforma.
Problema
Cuando los clientes migran a Topsort, sus campañas enfrentan un problema de arranque en frío donde:
- Sin historial de rendimiento: Las campañas nuevas comienzan sin datos históricos de rendimiento
- Período de aprendizaje: Los modelos de aprendizaje automático requieren de 1 a 4 semanas para acumular datos suficientes para la optimización
- Rendimiento subóptimo: Durante el arranque en frío, las campañas pueden tener un rendimiento inferior debido a la falta de datos de entrenamiento
- Frustración del anunciante: Los anunciantes pueden experimentar una efectividad reducida de la campaña en las semanas iniciales
Mientras que Migración de campaña
gestiona la estructura y la configuración de la campaña, así como la migración de datos históricos
específicamente aborda los datos de rendimiento para acelerar el entrenamiento y
optimización del modelo.
Solución
Proporcionamos una solución de ingesta de datos históricos que importa métricas de rendimiento y datos de eventos de la plataforma anterior del cliente. Estos datos sirven como material de entrenamiento inicial para los modelos de aprendizaje automático de Topsort, lo que reduce significativamente el período de arranque en frío.
Cómo ayudan los datos históricos
Aceleración del entrenamiento de modelos:
- Proporciona datos de entrenamiento inmediatos para algoritmos de aprendizaje automático
- Reduce el período de arranque en frío de 4 semanas a 1-2 semanas
- Permite una optimización de campañas y unas decisiones de puja más rápidas
Continuidad del rendimiento:
- Las campañas pueden aprovechar los patrones de rendimiento históricos
- Mejores recomendaciones iniciales de ofertas basadas en datos históricos
- Mejora de las decisiones de segmentación a partir del comportamiento histórico del usuario
Reducción de riesgos:
- Minimiza la caída de rendimiento durante la transición de plataforma
- Mantiene la confianza del anunciante con niveles de rendimiento familiares
- Proporciona métricas de referencia para la comparación y la optimización
Implementación técnica
Nuestra integración de datos históricos:
- Ingiere datos de eventos incluyendo impresiones orgánicas, clics y compras
- Procesa métricas de rendimiento a nivel de campaña, producto y usuario
- Entrena modelos iniciales usando datos históricos importados antes de la puesta en marcha
- Calibra algoritmos durante la operación inicial para un rendimiento óptimo
- Actualiza embeddings para usuarios, productos y ubicaciones basados en patrones históricos
Proceso de migración
1
Evaluación de datos y definición del alcance
Evaluar la disponibilidad de datos históricos
- Evaluar qué datos de rendimiento están disponibles de la plataforma anterior
- Determinar la calidad y la integridad de los datos
- Definir el rango de tiempo para los datos históricos (normalmente de 3 a 6 meses)
- Identificar las métricas clave que se alineen con el seguimiento de Topsort
2
Exportación y preparación de datos
Tipos de datos históricos requeridos:
- Métricas de rendimiento de la campaña (impresiones, clics, conversiones, gasto)
- Datos de rendimiento a nivel de producto (tasas de clics, tasas de conversión)
- Eventos de comportamiento del usuario (búsquedas, visualizaciones, compras)
- Patrones de tráfico orgánico y tendencias estacionales
- Historial de licitaciones y utilización del presupuesto
Todos los datos históricos deben cumplir con las normas de privacidad. Datos a nivel de usuario
deberán anonimizarse o agregarse cuando así lo exijan las leyes locales de privacidad.
3
4
Validación y procesamiento de datos
Pasos de control de calidad:
- Validar la integridad y precisión de los datos
- Normalizar las métricas para que coincidan con el esquema de datos de Topsort
- Limpiar y procesar datos para el entrenamiento del modelo
- Identificar y gestionar anomalías o valores atípicos en los datos
5
Entrenamiento y calibración del modelo
Proceso de formación inicial:
- Importar datos históricos al proceso de entrenamiento de Topsort
- Entrenar los modelos iniciales de aprendizaje automático utilizando patrones históricos
- Calibrar los algoritmos para un rendimiento óptimo
- Validar la precisión del modelo comparándola con resultados históricos conocidos
6
Despliegue y monitoreo de la producción
Proceso de puesta en marcha:
- Implementar los modelos entrenados en el entorno de producción
- Monitorear el rendimiento inicial en comparación con los valores de referencia históricos
- Ajustar los algoritmos en función de los nuevos datos en tiempo real
- Pasar gradualmente de la optimización de datos históricos a la optimización de datos en tiempo real
Requisitos de datos
Métricas de rendimiento requeridas
| Categoría de métrica | Campos obligatorios | Formato de ejemplo |
|---|---|---|
| Rendimiento de la campaña | id_campaña, fecha, impresiones, clics, conversiones, gasto | campaña-123, 2024-01-15, 1000, 50, 5, 25.00 |
| Rendimiento del producto | id_producto, id_campaña, fecha, impresiones, clics, ctr, tasa_conversión | prod-456, campaña-123, 2024-01-15, 100, 10, 0.10, 0.02 |
| Eventos del usuario | id_usuario (anonimizado), tipo_evento, id_producto, timestamp, valor | usuario-789, compra, prod-456, 2024-01-15T10:30:00Z, 49.99 |
| Tráfico orgánico | id_producto, fecha, impresiones_orgánicas, clics_orgánicos, términos_búsqueda | prod-456, 2024-01-15, 500, 25, "zapatos de verano" |
Ejemplos de formato CSV
Datos de rendimiento de la campaña:
Datos de rendimiento del producto:
Datos de eventos del usuario:
Proceso de entrenamiento del modelo
Entrenamiento de incorporación
Procesamiento inicial de datos:
- Los datos de eventos históricos se integran en los pipelines de entrenamiento
- Los modelos se entrenan utilizando datos históricos de rendimiento de 3 a 6 meses
- Se crean embeddings iniciales para usuarios, productos y campañas
- Se establecen predicciones de rendimiento de referencia
Optimización continua
Aprendizaje continuo:
- Actualizaciones diarias: Embeddings de búsqueda de ID actualizados con nuevos datos
- Reentrenamiento semanal: Reentrenamiento completo del modelo incorporando datos históricos y nuevos
- Adaptación en tiempo real: Embeddings de comportamiento del usuario actualizados continuamente
- Monitoreo del rendimiento: Comparación de rendimiento histórico vs actual
Métricas de éxito
El éxito de la migración de datos históricos se mide por:
- Período de arranque en frío reducido: Tiempo de aprendizaje reducido de 4 semanas a 1-2 semanas
- Continuidad del rendimiento: Rendimiento de la campaña dentro del 10-15% de los niveles históricos desde el primer día
- Precisión del modelo: Precisión de predicción mejorada en un 20-30% en comparación con escenarios de arranque en frío
- Satisfacción del anunciante: Confianza del anunciante mantenida o mejorada durante la transición
Integración con migración de campañas
Procesos complementarios
La migración de datos históricos funciona junto con Migración de campaña:
- Estructura de la campaña: La migración básica de campañas maneja configuraciones, presupuestos y segmentación
- Datos de rendimiento: La migración de datos históricos proporciona la base del rendimiento
- Beneficio combinado: Juntos, garantizan campañas funcionales y un rendimiento optimizado desde el primer día
Secuencia recomendada
- Completa primero Migración de campaña para establecer la estructura de la campaña
- Ejecutar la migración de datos históricos en paralelo durante la fase de pruebas
- Implementar tanto la estructura de la campaña como los modelos entrenados simultáneamente
- Supervisar el rendimiento con respecto a las líneas de base históricas
Siguientes pasos
Para clientes interesados en la migración de datos históricos:
- Evaluar la disponibilidad de datos desde su plataforma actual
- Coordinar equipos técnicos para discutir los requisitos de datos históricos
- Planificar la extracción de datos junto con el cronograma de migración de la campaña
- Coordinar con el equipo de aprendizaje automático para los requisitos de entrenamiento del modelo
Last updated: