Cas Dupliqués dans le Journal
Aperçu
L'enrichissement Cas Dupliqués dans le Journal crée des copies physiques des cas existants dans votre journal d'événements. Il s'agit d'un outil spécialisé réservé aux administrateurs, conçu à des fins de test, vous permettant d'élargir rapidement votre jeu de données en dupliquant les cas avec des identifiants modifiés. Chaque cas dupliqué conserve tous les événements et attributs originaux mais reçoit un nouvel identifiant unique pour le distinguer du cas source.
Cet enrichissement est particulièrement utile lorsque vous devez tester la façon dont votre analyse de process mining, vos filtres ou vos tableaux de bord fonctionnent avec des volumes de données plus importants, ou lorsque vous souhaitez créer des données synthétiques à des fins de formation et de démonstration.
Remarque : Cet enrichissement est disponible uniquement aux administrateurs en raison de son impact significatif sur le volume des données et de son usage prévu pour les scénarios de test et de développement plutôt que pour l'analyse en production.
Utilisations Courantes
- Étendre de petits ensembles de données de test pour simuler des volumes de données à l'échelle de la production
- Créer des scénarios de test de charge pour évaluer les performances des tableaux de bord et des calculateurs
- Générer des données dupliquées pour tester le comportement des filtres avec un nombre important de cas
- Préparer des ensembles de données de démonstration avec un volume suffisant pour les formations
- Tester les performances système et les temps de réponse avec des charges de données accrues
- Valider que les enrichissements et calculs gèrent correctement les grands ensembles de données
Paramètres
Nombre de Copies : Spécifiez combien de copies de chaque cas créer. Par exemple, définir cette valeur à 5 entraînera la duplication de chaque cas original 5 fois, ce qui multipliera effectivement votre nombre total de cas par 6 (original plus 5 copies). La valeur par défaut est 1, ce qui double votre jeu de données.
Exemple
Extension du Jeu de Données pour Test de Performance
Scénario : Vous disposez d’un journal de processus de 100 cas et devez tester la performance de votre tableau de bord avec 1 000 cas avant la mise en production.
Paramètres :
- Nombre de Copies : 9
Avant : | ID de Cas | Activité | Horodatage | |-----------|----------|------------| | PO-001 | Création de Commande | 2024-01-15 09:00 | | PO-001 | Validation de Commande | 2024-01-15 10:00 | | PO-002 | Création de Commande | 2024-01-15 11:00 | | PO-002 | Validation de Commande | 2024-01-15 12:00 |
Après (montrant les copies pour PO-001) : | ID de Cas | Activité | Horodatage | |-----------|----------|------------| | PO-001 | Création de Commande | 2024-01-15 09:00 | | PO-001 | Validation de Commande | 2024-01-15 10:00 | | PO-001_2 | Création de Commande | 2024-01-15 09:00 | | PO-001_2 | Validation de Commande | 2024-01-15 10:00 | | PO-001_3 | Création de Commande | 2024-01-15 09:00 | | ... | ... | ... | | PO-001_10 | Création de Commande | 2024-01-15 09:00 | | PO-001_10 | Validation de Commande | 2024-01-15 10:00 |
Résultat : Votre jeu de données de 100 cas contient désormais 1 000 cas, vous permettant de tester les caractéristiques de performance à grande échelle.
Informations : Après avoir dupliqué les cas, vous pouvez identifier les goulets d'étranglement des calculateurs et déterminer quelles visualisations nécessitent une optimisation avant la mise en production avec des volumes de données réels.
Fonctionnement
- Itération des Cas : L'enrichissement parcourt tous les cas existants dans votre journal d'événements
- Duplication des Cas : Pour chaque cas original, il crée le nombre spécifié de copies
- Génération d’ID : Chaque copie reçoit un ID de cas unique en ajoutant "_n" à l’ID original (où n est le numéro de copie à partir de 2)
- Copie des Événements : Tous les événements du cas original sont dupliqués dans le nouveau cas, en préservant les horodatages et tous les attributs d’événement
- Préservation des Attributs : Tous les attributs de niveau cas (sauf les colonnes calculées) sont copiés dans les nouveaux cas
- Finalisation du Journal : Le journal d’événements est finalisé avec les tables de cas et d’événements étendues
Sortie
L'enrichissement modifie le journal d'événements en :
- Nouveaux Cas : Créant (NumberOfCopies * nombre de cas originaux) cas supplémentaires
- ID de Cas : Les nouveaux cas ont des IDs au format "OriginalCaseId_n" où n est l’indice de la copie (2, 3, 4, etc.)
- Événements : Chaque nouveau cas contient des copies exactes de tous les événements du cas original
- Attributs : Tous les attributs de cas et d’événement sont conservés sur les cas et événements dupliqués
Notes Importantes :
- Cet enrichissement ne crée aucun nouvel attribut
- Les cas originaux restent inchangés
- Les colonnes calculées ne sont pas copiées (elles seront recalculées à partir des données)
- Les colonnes masquées ne sont pas copiées dans les nouveaux événements
Bonnes Pratiques
- Utilisez cet enrichissement uniquement en environnement de développement ou de test
- Soyez attentif au volume des données — la duplication de grands ensembles peut augmenter significativement le temps de traitement
- Supprimez l’enrichissement ou enregistrez une copie séparée de votre notebook après les tests
- Considérez l’impact sur les métriques calculées pouvant être affectées par des données dupliquées
Cette documentation fait partie de la plateforme de process mining mindzie Studio.