Filtre Small Ends
Vue d'ensemble
Le filtre Small Ends supprime automatiquement les périodes de faible activité au début et à la fin de votre journal d'événements. Ce filtre intelligent au niveau des cas détecte les périodes de "mise en route" et de "ralentissement" où les volumes d'événements sont significativement inférieurs à la moyenne, puis supprime les cas qui se situent entièrement dans ces périodes. Il permet de s'assurer que votre analyse se concentre sur des périodes d'activité commerciale normale plutôt que sur des artefacts liés à la collecte des données ou des creux saisonniers.
Utilisations courantes
- Supprimer les données des périodes de mise en service du système avant la stabilisation des processus
- Exclure les périodes de fin d'extraction où les données peuvent être incomplètes
- Filtrer les périodes de vacances avec une activité réduite
- Éliminer les problèmes de qualité des données aux limites des journaux
- Concentrer l'analyse sur des périodes avec un comportement de processus représentatif
- Nettoyer les journaux d'événements pour des métriques de débit et de performance précises
Paramètres
Start Factor : Un multiplicateur (de 0.0 à 1.0) appliqué à la moyenne quotidienne des événements. Les jours au début du journal avec un nombre d'événements inférieur à (Start Factor x Moyenne d'événements par jour) sont supprimés. Une valeur plus basse est plus permissive (garde plus de données) ; une valeur plus élevée est plus agressive (supprime plus de données précoces).
End Factor : Un multiplicateur (de 0.0 à 1.0) appliqué à la moyenne quotidienne des événements. Les jours à la fin du journal avec un nombre d'événements inférieur à (End Factor x Moyenne d'événements par jour) sont supprimés. Fonctionne de la même manière que Start Factor mais pour la fin du journal.
Valeurs par défaut : Les deux facteurs sont par défaut à 0.1 (10 %), ce qui signifie que les jours avec moins de 10 % de l'activité quotidienne moyenne sont considérés comme « petits » et supprimés.
Exemples
Exemple 1 : Nettoyage standard
Scénario : Votre journal d'événements commence par une période de mise en œuvre du système où peu de transactions ont eu lieu, et se termine par des données incomplètes issues de la date d'extraction. Vous souhaitez supprimer automatiquement ces périodes de faible activité.
Paramètres :
- Start Factor : 0.1
- End Factor : 0.1
Résultat :
Le filtre calcule la moyenne des événements par jour sur l'ensemble du journal (par exemple, 500 événements/jour). Les jours avec moins de 50 événements sont considérés comme de faible activité. Si les 5 premiers jours comptent respectivement 10, 25, 30, 45 et 80 événements, le filtre commence à partir du jour 4. De même, les jours de faible activité à la fin sont supprimés.
Remarques : Cela gère automatiquement les problèmes aux limites des données sans sélection manuelle des dates, garantissant que l'analyse couvre uniquement des périodes avec des niveaux d'activité représentatifs.
Exemple 2 : Suppression agressive au début
Scénario : Vos données de processus incluent une longue période pilote avant le déploiement complet. Vous souhaitez supprimer agressivement les données précoces tout en conservant les données de fin de journal.
Paramètres :
- Start Factor : 0.3
- End Factor : 0.1
Résultat :
Les jours au début avec moins de 30 % de l'activité moyenne quotidienne sont supprimés. Cela élimine une plus grande partie de la période pilote/montée en charge. La fin utilise le seuil standard de 10 %, préservant davantage les données récentes.
Remarques : Des facteurs asymétriques permettent de gérer des situations où le début et la fin du journal présentent des caractéristiques différentes. Les périodes pilotes ont souvent une montée en charge plus longue que la phase de ralentissement.
Exemple 3 : Suppression minimale
Scénario : Vous souhaitez conserver autant de données que possible tout en supprimant les problèmes évidents de qualité de données aux limites du journal.
Paramètres :
- Start Factor : 0.05
- End Factor : 0.05
Résultat :
Seuls les jours avec moins de 5 % de l'activité moyenne quotidienne sont supprimés. Cela ne détecte que les périodes de très faible activité extrême tout en conservant la grande majorité des données, y compris les variations saisonnières modérées.
Remarques : Utilisez des facteurs faibles lorsque votre activité présente des variations naturelles et que vous ne voulez pas supprimer accidentellement des périodes légitimes de faible activité comme les week-ends ou les creux saisonniers.
Exemple 4 : Suppression des frontières saisonnières
Scénario : Votre journal couvre une année entière mais inclut le mois de décembre (période des fêtes) à la fois au début et à la fin en raison du moment de l'extraction. Vous souhaitez vous concentrer sur les périodes hors vacances.
Paramètres :
- Start Factor : 0.4
- End Factor : 0.4
Résultat :
Les jours avec moins de 40 % de l'activité moyenne sont supprimés aux deux extrémités. Cela supprime efficacement les périodes de vacances où l'activité a chuté significativement en dessous des niveaux normaux.
Remarques : Des facteurs plus élevés aident à exclure les variations saisonnières susceptibles de biaiser l’analyse. Cependant, attention à ne pas supprimer trop de données valides.
Exemple 5 : Mise en œuvre d’un nouveau système
Scénario : Les données ont été extraites d’un nouveau système mis en service il y a 3 mois. Le premier mois avait une activité très faible car les utilisateurs étaient en formation et en migration.
Paramètres :
- Start Factor : 0.5
- End Factor : 0.1
Résultat :
La première partie du journal (période de mise en œuvre/formation avec moins de 50 % d’activité) est supprimée, tandis que les données récentes sont conservées avec un minimum de suppression en fin de journal. Cela concentre l’analyse sur la période après la stabilisation du système.
Remarques : Les périodes de mise en œuvre présentent souvent des schémas qui ne représentent pas les opérations normales. Leur suppression garantit que vos métriques de processus reflètent la performance opérationnelle réelle.
Fonctionnement
- Calcul des fréquences journalières : Le filtre compte les événements pour chaque jour dans le journal
- Calcul de l’activité moyenne : Calcule la moyenne des événements par jour sur toute la période
- Détection de la limite de début : Parcourt à partir du début pour trouver le premier jour dépassant (Start Factor x Moyenne)
- Détection de la limite de fin : Parcourt à partir de la fin pour trouver le dernier jour dépassant (End Factor x Moyenne)
- Application de l’intervalle de dates : Filtre pour ne conserver que les cas dans les limites des dates calculées
Résultat
Ce filtre fonctionne au niveau des cas en fonction des limites temporelles :
- Calcule automatiquement les seuils d’activité basés sur la moyenne quotidienne d’événements
- Identifie le premier jour d’activité "normale" au début du journal
- Identifie le dernier jour d’activité "normale" à la fin du journal
- Retourne les cas contenus dans la période d’activité normale calculée
- Préserve tous les attributs de cas et d’événements pour les cas inclus
- Les facteurs doivent être compris entre 0 et 1 (exclus)
Utilisez le filtre Small Ends pour nettoyer automatiquement les limites de vos journaux d’événements et garantir que votre analyse reflète les opérations commerciales normales au lieu des phases de mise en œuvre, des artefacts d’extraction ou des anomalies saisonnières.
Cette documentation fait partie de la plateforme de process mining mindzie Studio.