Zum Hauptinhalt springen
Die Migration historischer Daten ist der Prozess der Übertragung von Leistungsmetriken und Ereignisdaten von der vorherigen Werbeplattform eines Kunden, um die Machine-Learning-Modelle von Topsort zu beschleunigen und die anfängliche Lernphase beim Plattformübergang zu verkürzen.

Problem

Wenn Kunden zu Topsort migrieren, stehen ihre Kampagnen vor einem Cold-Start-Problem, bei dem:
  • Keine Leistungshistorie: Neue Kampagnen starten ohne jegliche historische Leistungsdaten
  • Lernphase: Machine-Learning-Modelle benötigen 1-4 Wochen, um genügend Daten für Optimierung zu sammeln
  • Suboptimale Leistung: Während des Cold-Starts können Kampagnen aufgrund fehlender Trainingsdaten unterdurchschnittlich abschneiden
  • Werbetreibendenfrust: Werbetreibende können während der ersten Wochen reduzierte Kampagneneffizienz feststellen
Während die Kampagnenmigration die Kampagnenstruktur und -einstellungen behandelt, befasst sich die Migration historischer Daten speziell mit Leistungsdaten zur Beschleunigung des Modelltrainings und der Optimierung.

Lösung

Wir bieten eine Lösung zur Ingestion historischer Daten, die Leistungsmetriken und Ereignisdaten von der vorherigen Plattform des Kunden importiert. Diese Daten dienen als anfängliches Trainingsmaterial für die Machine-Learning-Modelle von Topsort und reduzieren die Cold-Start-Phase erheblich.

Wie historische Daten helfen

Beschleunigung des Modelltrainings:
  • Bietet sofortige Trainingsdaten für Machine-Learning-Algorithmen
  • Reduziert Cold-Start-Phase von 4 Wochen auf 1-2 Wochen
  • Ermöglicht schnellere Kampagnenoptimierung und Gebotsentscheidungen
Leistungskontinuität:
  • Kampagnen können historische Leistungsmuster nutzen
  • Bessere anfängliche Gebotsempfehlungen basierend auf vergangenen Daten
  • Verbesserte Targeting-Entscheidungen aus historischem Nutzerverhalten
Risikominderung:
  • Minimiert Leistungseinbußen während des Plattformübergangs
  • Erhält Werbetreibendenvertrauen mit vertrauten Leistungsniveaus
  • Bietet Benchmark-Metriken für Vergleich und Optimierung

Technische Implementierung

Unsere historische Datenintegration:
  • Nimmt Ereignisdaten auf, einschließlich organischer Impressionen, Klicks und Käufe
  • Verarbeitet Leistungsmetriken auf Kampagnen-, Produkt- und Nutzerebene
  • Trainiert anfängliche Modelle unter Verwendung importierter historischer Daten vor Go-Live
  • Kalibriert Algorithmen während des anfänglichen Betriebs für optimale Leistung
  • Aktualisiert Embeddings für Nutzer, Produkte und Placements basierend auf historischen Mustern

Migrationsprozess

1

Datenbewertung und Scope-Definition

Verfügbarkeit historischer Daten bewerten
  • Bewerten, welche Leistungsdaten von der vorherigen Plattform verfügbar sind
  • Datenqualität und Vollständigkeit bestimmen
  • Zeitraum für historische Daten definieren (typischerweise 3-6 Monate)
  • Schlüsselmetriken identifizieren, die mit Topsort-Tracking übereinstimmen
 
2

Datenexport und Vorbereitung

Erforderliche historische Datentypen:
  • Kampagnenleistungsmetriken (Impressionen, Klicks, Conversions, Ausgaben)
  • Produktebenen-Leistungsdaten (Klickraten, Conversion-Raten)
  • Nutzerverhaltensereignisse (Suchen, Views, Käufe)
  • Organische Traffic-Muster und saisonale Trends
  • Gebots- und Budgetnutzungshistorie
Alle historischen Daten müssen Datenschutzbestimmungen einhalten. Daten auf Nutzerebene müssen anonymisiert oder aggregiert werden, wenn dies durch lokale Datenschutzgesetze erforderlich ist.
3
 
4

Datenvalidierung und -verarbeitung

Qualitätssicherungsschritte:
  • Datenvollständigkeit und -genauigkeit validieren
  • Metriken normalisieren, um zum Topsort-Datenschema zu passen
  • Daten für Modelltraining bereinigen und verarbeiten
  • Datenanomalien oder Ausreißer identifizieren und behandeln
 
5

Modelltraining und Kalibrierung

Anfänglicher Trainingsprozess:
  • Historische Daten in Topsort-Trainingspipeline importieren
  • Anfängliche Machine-Learning-Modelle mit historischen Mustern trainieren
  • Algorithmen für optimale Leistung kalibrieren
  • Modellgenauigkeit gegen bekannte historische Ergebnisse validieren
 
6

Produktionsbereitstellung und Überwachung

Go-Live-Prozess:
  • Trainierte Modelle in Produktionsumgebung bereitstellen
  • Anfängliche Leistung gegen historische Benchmarks überwachen
  • Algorithmen basierend auf neuen Echtzeitdaten verfeinern
  • Schrittweise von historischer Datenoptimierung zu Echtzeitdaten übergehen

Datenanforderungen

Erforderliche Leistungsmetriken

MetrikkategorieErforderliche FelderBeispielformat
Kampagnenleistungcampaign_id, date, impressions, clicks, conversions, spendcampaign-123, 2024-01-15, 1000, 50, 5, 25.00
Produktleistungproduct_id, campaign_id, date, impressions, clicks, ctr, conversion_rateprod-456, campaign-123, 2024-01-15, 100, 10, 0.10, 0.02
Nutzerereignisseuser_id (anonymisiert), event_type, product_id, timestamp, valueuser-789, purchase, prod-456, 2024-01-15T10:30:00Z, 49.99
Organischer Trafficproduct_id, date, organic_impressions, organic_clicks, search_termsprod-456, 2024-01-15, 500, 25, "summer shoes"

Beispiele für CSV-Format

Kampagnenleistungsdaten:
campaign_id,date,impressions,clicks,conversions,spend,ctr,conversion_rate
campaign-123,2024-01-15,1000,50,5,25.00,0.05,0.10
campaign-124,2024-01-15,800,40,3,20.00,0.05,0.075
Produktleistungsdaten:
product_id,campaign_id,date,impressions,clicks,conversions,revenue
prod-456,campaign-123,2024-01-15,100,10,2,49.98
prod-457,campaign-123,2024-01-15,150,8,1,24.99
Nutzerereignisdaten:
user_id,event_type,product_id,timestamp,value,campaign_id
user-789,view,prod-456,2024-01-15T10:00:00Z,,
user-789,click,prod-456,2024-01-15T10:05:00Z,,campaign-123
user-789,purchase,prod-456,2024-01-15T10:30:00Z,49.99,campaign-123

Modelltrainingsprozess

Onboarding-Training

Anfängliche Datenverarbeitung:
  • Historische Ereignisdaten werden in Trainingspipelines eingespeist
  • Modelle werden mit 3-6 Monaten historischer Leistungsdaten trainiert
  • Anfängliche Embeddings für Nutzer, Produkte und Kampagnen werden erstellt
  • Baseline-Leistungsvorhersagen werden etabliert

Kontinuierliche Optimierung

Kontinuierliches Lernen:
  • Tägliche Updates: ID-Lookup-Embeddings werden mit neuen Daten aktualisiert
  • Wöchentliches Retraining: Vollständiges Modell-Retraining, das sowohl historische als auch neue Daten einbezieht
  • Echtzeitanpassung: Nutzerverhalten-Embeddings werden kontinuierlich aktualisiert
  • Leistungsüberwachung: Historische Leistung mit aktueller Leistung vergleichen
Die Kombination aus historischen Daten und Echtzeitlernen erreicht typischerweise optimale Leistung in 2-3 Wochen, verglichen mit 4-6 Wochen bei reinem Cold-Start.

Erfolgsmetriken

Der Erfolg der Migration historischer Daten wird gemessen durch:
  • Reduzierte Cold-Start-Phase: Lernzeit von 4 Wochen auf 1-2 Wochen verkürzt
  • Leistungskontinuität: Kampagnenleistung innerhalb von 10-15% historischer Niveaus ab Tag eins
  • Modellgenauigkeit: 20-30% verbesserte Vorhersagegenauigkeit im Vergleich zu Cold-Start-Szenarien
  • Werbetreibendenzufriedenheit: Werbetreibendenvertrauen während Übergang aufrechterhalten oder verbessert

Integration mit Kampagnenmigration

Komplementäre Prozesse

Die Migration historischer Daten funktioniert parallel zur Kampagnenmigration:
  1. Kampagnenstruktur: Basis-Kampagnenmigration behandelt Einstellungen, Budgets und Targeting
  2. Leistungsdaten: Migration historischer Daten liefert die Leistungsgrundlage
  3. Kombinierter Nutzen: Zusammen gewährleisten sie sowohl funktionale Kampagnen als auch optimierte Leistung ab Tag eins

Empfohlene Reihenfolge

  1. Schließen Sie zuerst die Kampagnenmigration ab, um die Kampagnenstruktur zu etablieren
  2. Führen Sie die Migration historischer Daten parallel während der Testphase aus
  3. Stellen Sie Kampagnenstruktur und trainierte Modelle gleichzeitig bereit
  4. Überwachen Sie die Leistung gegen historische Benchmarks
Die Migration historischer Daten erfordert zusätzliche technische Koordination und kann den gesamten Migrationszeitplan um 1-2 Wochen für Modelltraining und Validierung verlängern.

Nächste Schritte

Für Kunden, die an der Migration historischer Daten interessiert sind:
  1. Bewerten Sie die Datenverfügbarkeit Ihrer aktuellen Plattform
  2. Koordinieren Sie technische Teams, um Anforderungen an historische Daten zu besprechen
  3. Planen Sie die Datenextraktion parallel zum Kampagnenmigrationszeitplan
  4. Koordinieren Sie mit dem Machine-Learning-Team für Modelltrainingsanforderungen

Zuletzt aktualisiert: