Catalog One est le système de standardisation de catalogues de Topsort conçu pour aider les marketplaces, les détaillants et les marques à maintenir des données produits cohérentes, consultables et sans doublons. En identifiant et en unifiant les marques, catégories et produits à travers différents catalogues, Topsort améliore la découverte de produits, les rapports et le ciblage publicitaire.
Avantages Clés
Données Plus Propres
Fini les étiquettes de marques et catégories incohérentes.
UX Améliorée
Les annonces dédupliquées évitent l’encombrement et le contenu répété.
Meilleure Attribution
Des identifiants produits précis permettent un meilleur suivi des performances et de l’attribution entre les canaux.
Prêt pour le Ciblage Publicitaire
Les données unifiées prennent en charge les publicités au niveau produit, le reciblage et l’analyse.
Intégration API
Processus d’ingestion facile à intégrer avec retour sur le résultat.
Exigences
Les clients envoient leur catalogue produit à notre API Catalogue. L’API Catalogue Topsort accepte les données produits dans un format structuré incluant des attributs clés tels que le titre, la description, le nom de la marque, le nom de la catégorie et l’ID produit (voir Description du Schéma)
Fonctionnalités d’Ingénierie du Point de Terminaison
Traitement Asynchrone : Une fois qu’un catalogue est reçu, Topsort déclenche une tâche de standardisation hors ligne. Cette tâche traite le catalogue en utilisant une logique de correspondance avancée et des modèles d’apprentissage automatique. Le temps nécessaire pour exécuter le processus complet de standardisation peut dépendre de la taille du catalogue original, mais une estimation approximative est d’environ 10 produits par seconde.
Fonctionnalités ML du Point de Terminaison
Reconnaissance de Marque : Fait correspondre la marque d’entrée à un ID de marque canonique en utilisant un mélange de correspondance floue, de modèles pré-entraînés et de grands modèles de langage.
Classification des Catégories : Mappe automatiquement les catégories en texte libre dans une taxonomie de catégories standardisée, permettant une navigation et des rapports cohérents. Topsort utilise la taxonomie Google comme référence pour les catégories.
Déduplication des Produits : Détecte et relie les produits en double dans le catalogue. Les doublons sont regroupés sous un
master_product_id unifié en utilisant des techniques comme le score de similarité et le regroupement basé sur les vecteurs.Description de la Sortie
La sortie est un catalogue propre, dédupliqué et enrichi où chaque produit est lié à des marques reconnues, des catégories standardisées et des groupes de produits maîtres. Topsort peut également inclure des scores pour chaque tâche d’inférence.
Pour consommer ce catalogue standardisé, voici l’URL de la documentation du point de terminaison.
Il s’agit d’un point de terminaison paginé qui fonctionne avec une limite de débit de 10 requêtes par seconde.
Last updated: