Flux e-commerce et ID catégories

5 réponses
AuteurMessage

bipeurs |
Membre

 

Inscrit le : 09/05/2005

# Le 07/10/2010 à 12:18

Bonjour,

Je suis en train d'intégrer plusieurs flux de e-commerçants français, et je fais face à une problématique au niveau des ID de catégories présentes dans les flux catalogues.

Les plateformes d'affiliation ne fournissent aucun fichier de correspondance entre ces ID et des noms de catégories, je suis obligé de les contacter une à une et les réponses sont longues à obtenir, et ils semblent ne pas s'être penché sur ce problème.

Comment faites-vous pour intégrer ces flux ?

Y a-t-il d'autres solutions ?

Merci

cerise | Gaël
Modérateur

Photo de cerise

Inscrit le : 31/10/2008

# Le 07/10/2010 à 12:29

les flux des plateformes sont une horreur... Aucune cohérence même au sein d'une même plateforme, chaque marchand a sa propre syntaxe... Netaff a des flux a peu près homogènes, Zanox s'y met mais on est loin de quelque chose de satisfaisant...

le gros point noir, effectivement les catégories... Tu as même certains marchands qui utilisent le chiffre 7 comme séparateur entre catégorie et sous catégories

L'ID de catégorie, bien oui, mais malheureusement pas toujours présent !

Bref, c'est super balaise à intégrer. Donc pour notre comparateur, on avait fait un choix un peu singulier : parser les flux pour en extraire toutes les catégories et sous-catégories, afin de se faire une table de catégories par recoupements et de réaffecter ensuite les produits dans les catégories stockées lors des mises à jours des flux... Pas le plus efficace, mais au moins on est pas dépendants des éventuels changements d'ID dans un flux, et on peut intégrer de cette façon n'importe quel flux de n'importe quel programme

bipeurs | Guillaume
Membre

 

Inscrit le : 09/05/2005

# Le 07/10/2010 à 12:42

Merci pour ta réponse.

En effet, ta méthode est intéressante, mais en cas de création de nouvelle catégorie dans le flux, comment fais-tu ? (tu reparses les flux pour mettre à jour tes tables de catégories régulièrement ?)

Et pour pouvoir créer une table de catégories par recoupement, tu es obligé d'avoir non seulement des ID de catégories mais aussi les noms des catégories qui correspondent à ces ID... et cela est quasiment jamais présent dans les flux (par exemple pixmania, nocibe, brandalley chez trade)

tonguide | Jeremy
Modérateur

 

Inscrit le : 09/05/2005

# Le 07/10/2010 à 12:48

Perso, si je devais faire un comparateur, je ne m'occuperai pas du tout des catégories fournis par les marchands (c'est un boulot plus usant que de trier les produits je trouve). J'aurai tendance à essayer de recouper les produits entre eux en prenant une sélection de flux propre comme base de travail sur laquel je m'appuierai pour les autres flux. Au moins le tri devrait être plus propre si toutefois l'algorithme de reconnaisse est bien étudié (même si il faut trier plus que nécessaire au début).

cerise | Gaël
Modérateur

Photo de cerise

Inscrit le : 31/10/2008

# Le 07/10/2010 à 13:26

oui ça revient un peu à faire que ce que tu dis tonguide sauf qu'à défaut d'avoir un flux propre comme base de travail, on est parti de la compilation d'une ensemble de plus d'une centaine de flux, pour en extraire les catégories redondantes, similaires ou approchantes

voilà comment on fait :

1 - on parse les flux pour en extraire les catégories et sous catégories. (chez netaffiliation, c'est bien, ils ont une hiérarchie qui est communes à tous leurs flux, les autres, c'est autant de structures que de flux) et on les injecte dans une table, ce qui permet d'avoir une base de travail sur laquelle s'appuyer plutôt que de devoir se taper la création de catégories à la main...
2 - un script s'occupe de faire les regroupements de catégories identiques ou similaires (c'est notre base propre), et de pondérer les résultats en fonction des occurrences : elle contient environ 15 000 catégories et sous-catégories. Elles ont donc un ID interne et un hash unique obtenu à partir de la compilation de plusieurs critères
3 - on mappe les produits qui correspondent au hash obtenu en 2. >> c'est notre table de correspondance produits/catégories

On arrive à un truc qui n'est pas parfait, mais qui est suffisant et tourne depuis 3 ans, sans avoir eu besoin de modifier quoi que se soit. l'avantage, la base catégorie s'enrichie et s'affine au fur et à mesure des mises à jour produits et il y a zéro maintenance. Inconvénients, on obtient certains trucs bizzaroïdes parfois...

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 07/10/2010 à 13:29

Dans le tourisme c'est un peu différent, mais idem on ne peut pas se fier au classement présent dans les flux, ce serait n'importe quoi. Les "produits" qu'on trouve, on les associe à nos produits, qui utilisent notre classement.

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

Répondre

Vous ne pouvez pas participer au forum, car votre inscription n'a pas été validée. Pour vous faire valider en tant que Membre, cliquez ici.

© MHN - Tous droits réservés | CNIL N°844440 | 25/11/2024 17:30:44 | Généré en 4.94ms | Contacts | Mentions légales |