Data Selector
Overzicht
De Data Selector calculator is een hulpmiddel voor het nabewerken van data waarmee specifieke kolommen uit de output van een andere calculator worden geselecteerd en eventueel worden gesorteerd en beperkt. Deze calculator is essentieel voor het creëren van gerichte dataviews door relevante kolommen te kiezen, de data te ordenen en alleen de top N rijen weer te geven.
In tegenstelling tot de meeste calculators die procesdata direct analyseren, werkt Data Selector met de outputtabellen van andere calculators, waardoor het ideaal is voor het verfijnen van analyseresultaten voor dashboards, rapporten en exports.
Veelvoorkomende toepassingen
- Voorbereiden van specifieke dat subsets voor e-mailbezorging of export naar belanghebbenden
- Creëren van vereenvoudigde dashboardweergaven met alleen sleutelstatistieken uit complexe analyses
- Selecteren en sorteren van top N resultaten uit grote analyse-outputs (bijv. top 10 traagste cases)
- Rapporten focussen op relevante kolommen door onnodige details te verwijderen
- Omzetten van uitgebreide analyseresultaten in overzichtelijke samenvattingen voor management
- Creëren van datapijplijnen door meerdere calculators te koppelen en specifieke outputs per stap te selecteren
Instellingen
Source Calculator: Selecteer de calculatorblok waarvan je de output wilt gebruiken. Deze calculator moet al zijn uitgevoerd in het huidige notebook.
Source Table: Kies welke tabel gebruikt wordt als de source calculator meerdere resultaat tabellen produceert. De meeste calculators produceren een enkele tabel (index 0), maar sommige retourneren meerdere tabellen met verschillende soorten informatie.
Columns to Include: Selecteer welke kolommen uit de source tabel in de output moeten verschijnen. Je kunt meerdere kolommen selecteren, die worden weergegeven in de door jou opgegeven volgorde. Kolomnamen moeten exact overeenkomen met de namen in de output van de source calculator.
Sort Column: Optioneel een kolom kiezen waarop de resultaten gesorteerd worden. Als je geen sorteerkolom opgeeft, behouden de data dezelfde volgorde als in de source calculator output.
Sort Direction: Bij inschakelen van sorteren, kies of gesorteerd wordt op:
- Oplopende volgorde: Laag naar hoog (A-Z, 0-9, oudste naar nieuwste)
- Aflopende volgorde: Hoog naar laag (Z-A, 9-0, nieuwste naar oudste)
Maximum Rows: Geef het maximum aantal rijen op dat in de output wordt opgenomen. Stel in op 0 of laat leeg voor geen limiet. In combinatie met sorteren kun je hiermee "top N" resultaten selecteren (bijv. top 20 traagste cases bij aflopende sortering op duur).
Voorbeelden
Voorbeeld 1: Top 10 traagste inkooporders voor managementrapport
Scenario: Je Case Duration calculator heeft 2.500 inkooporders geanalyseerd, maar je wilt een managementdashboard maken dat alleen de 10 traagste cases toont voor directe aandacht.
Instellingen:
- Source Calculator: "Purchase Order Duration Analysis"
- Source Table: 0 (primaire resultaat tabel)
- Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
- Sort Column: Duration
- Sort Direction: Descending
- Maximum Rows: 10
Output:
De calculator toont een gerichte tabel met precies 4 kolommen en 10 rijen:
| Case ID | Leveranciersnaam | Duur | Totale Waarde |
|---|---|---|---|
| PO-2024-8821 | Acme Manufacturing | 47,3 dagen | $125,400 |
| PO-2024-9156 | Global Supplies Inc | 42,8 dagen | $89,200 |
| PO-2024-7633 | TechParts Ltd | 38,5 dagen | $156,800 |
| ... | ... | ... | ... |
Inzichten: Door alleen essentiële kolommen te selecteren en te beperken tot 10 rijen, heb je een actueel dashboard gemaakt dat problematische cases benadrukt zonder managers te overstelpen met 2.500 rijen data. Sorteren op duur zorgt ervoor dat de urgentste cases eerst verschijnen. De kolom Totale Waarde toont de financiële impact van deze vertragingen.
Voorbeeld 2: Wekelijkse activiteitenoverzicht voor e-maildistributie
Scenario: Je voert elke week een analyse uit van activiteitsfrequentie die details geeft over 45 verschillende activiteiten. Je wilt de proceseigenaar enkel de top 15 meest frequente activiteiten via e-mail sturen met vereenvoudigde metrics.
Instellingen:
- Source Calculator: "Weekly Activity Frequency Report"
- Source Table: 0
- Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
- Sort Column: Event Count
- Sort Direction: Descending
- Maximum Rows: 15
Output:
Een overzichtelijke, gerichte tabel perfect voor e-mail:
| Activiteit | Aantal Evenementen | Percentage van Totale Evenementen |
|---|---|---|
| Create Purchase Requisition | 1.847 | 18,2% |
| Manager Approval | 1.823 | 17,9% |
| Vendor Selection | 1.792 | 17,6% |
| ... | ... | ... |
Inzichten: Deze vereenvoudigde weergave verwijdert kolommen als "First Occurrence" en "Last Occurrence" die de e-mail onnodig vol maken, terwijl de essentiële metrics blijven die tonen welke activiteiten het proces domineren. De ontvanger ziet direct dat de top 3 activiteiten meer dan de helft van alle procesevenementen omvatten.
Voorbeeld 3: Dashboard vereenvoudiging voor klantanalyse
Scenario: Je Breakdown by Categories calculator heeft klanten geanalyseerd op 12 verschillende metrics, maar je dashboard widget heeft ruimte voor slechts 5 kolommen die de top 20 klanten tonen.
Instellingen:
- Source Calculator: "Customer Performance Analysis"
- Source Table: 0
- Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
- Sort Column: Total Revenue
- Sort Direction: Descending
- Maximum Rows: 20
Output:
Dashboardgereed overzicht met gerichte metrics:
| Klantnaam | Aantal Cases | Gemiddelde Duur | Totale Omzet | Percentage Op Tijd |
|---|---|---|---|---|
| MegaCorp Industries | 487 | 8,2 dagen | $4.850.000 | 92% |
| TechStart Solutions | 356 | 7,5 dagen | $3.240.000 | 95% |
| Global Systems Inc | 298 | 9,1 dagen | $2.870.000 | 88% |
| ... | ... | ... | ... | ... |
Inzichten: Je hebt een uitgebreide 12-koloms analyse omgezet naar een dashboardvriendelijke 5-koloms weergave die precies toont wat stakeholders moeten weten: welke klanten de meeste omzet genereren, hoeveel orders ze plaatsen, hoe lang de verwerking duurt en hun leveringsprestaties. Sortering op omzet zorgt dat de belangrijkste klanten direct zichtbaar zijn.
Voorbeeld 4: Variantanalyse - Top varianten op frequentie
Scenario: Je variantanalyse heeft 284 unieke procesvarianten geïdentificeerd. Je wil je verbeterinspanningen richten op de top 25 meest voorkomende varianten, die doorgaans 80% van je casevolume vertegenwoordigen.
Instellingen:
- Source Calculator: "Process Variant Analysis"
- Source Table: 0
- Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
- Sort Column: Frequency
- Sort Direction: Descending
- Maximum Rows: 25
Output:
| Variant ID | Frequentie | Cumulatief Percentage | Gemiddelde Duur | Bevat Herwerk |
|---|---|---|---|---|
| VAR-001 | 1.245 | 24,8% | 6,2 dagen | Nee |
| VAR-002 | 876 | 42,2% | 8,5 dagen | Ja |
| VAR-003 | 623 | 54,6% | 5,8 dagen | Nee |
| ... | ... | ... | ... | ... |
Inzichten: De top 25 varianten vormen de kern van je proces, en de cumulatieve percentagekolom toont dat focus op deze varianten het merendeel van de cases omvat. De kolom "Bevat Herwerk" geeft direct aan welke veelvoorkomende varianten inefficiënte herwerkstappen bevatten, wat helpt bij het prioriteren van verbeteringen.
Voorbeeld 5: Datumbereikanalyse voor trendanalyse
Scenario: Je rate-over-time calculator heeft dagelijkse statistieken voor 90 dagen gegenereerd, maar je wilt alleen de belangrijkste metrics in chronologische volgorde tonen zonder rijlimiet voor een complete trendanalyse.
Instellingen:
- Source Calculator: "90-Day Completion Rate Analysis"
- Source Table: 0
- Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
- Sort Column: Date
- Sort Direction: Ascending
- Maximum Rows: 0 (geen limiet)
Output:
Alle 90 rijen weergegeven in chronologische volgorde:
| Datum | Cases Voltooid | Voltooiingspercentage |
|---|---|---|
| 2024-10-01 | 23 | 87,4% |
| 2024-10-02 | 28 | 91,2% |
| 2024-10-03 | 31 | 89,7% |
| ... | ... | ... |
Inzichten: Door te sorteren op datum oplopend en geen rijen te beperken, behoud je de volledige tijdreeks voor grafieken of export. Je hebt de output vereenvoudigd door statistische kolommen (zoals "Standaarddeviatie" en "Min/Max") te verwijderen die niet nodig zijn voor basistrendanalyse, waardoor de data schoner is voor grafieksoftware.
Voorbeeld 6: Meerdere tabelbronnen selecteren
Scenario: Je conformance checker retourneert twee tabellen: tabel 0 bevat samenvattende statistieken, en tabel 1 bevat gedetailleerde overtredingslijsten. Je wilt een rapport maken van de gedetailleerde overtredingen.
Instellingen:
- Source Calculator: "Standard Process Conformance Check"
- Source Table: 1 (detailtabel, niet samenvatting)
- Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
- Sort Column: Violation Type
- Sort Direction: Ascending
- Maximum Rows: 100
Output:
| Case ID | Overtredingstype | Activiteit | Tijdstip |
|---|---|---|---|
| CS-1234 | Verplichte stap ontbreekt | Invoice Approval | 2024-11-15 14:22 |
| CS-5678 | Verplichte stap ontbreekt | Purchase Approval | 2024-11-16 09:15 |
| CS-9012 | Volgorde fout | Goods Receipt | 2024-11-16 11:45 |
| ... | ... | ... | ... |
Inzichten: Door tabel 1 te selecteren in plaats van de standaard tabel 0, krijg je toegang tot de gedetailleerde overtredingsdata en niet enkel samenvattende aantallen. Sorteren op overtredingstype groepeert gelijksoortige problemen, wat het identificeren van patronen vereenvoudigt. De limiet van 100 rijen zorgt dat het rapport beheersbaar blijft en toch de belangrijkste overtredingen omvat.
Output
De Data Selector calculator toont een tabel met precies de door jou geselecteerde kolommen, in de volgorde die je hebt opgegeven. De structuur van de tabel is dynamisch en afhankelijk van je kolomkeuzes.
Kenmerken van de output
Kolomstructuur: Alleen de kolommen die je in "Columns to Include" hebt geselecteerd verschijnen in de output. Kolomnamen, datatypes en opmaak worden behouden vanuit de source calculator.
Aantal rijen: Bepaald door de instelling Maximum Rows:
- Als Maximum Rows = 0 of leeg: alle rijen uit de source tabel
- Als Maximum Rows > 0: maximaal dat aantal rijen (minder als de source minder heeft)
Rijenvolgorde: Bepaald door de sorteerinstellingen:
- Zonder sorteerkolom: dezelfde volgorde als de source calculator
- Met sorteerkolom: rijen worden gerangschikt volgens de kolom en sorteer richting
Interactieve functies
Klik op rijen: In veel gevallen kun je op een rij klikken om onderliggende cases of details te zien, net zoals in de source calculator.
Exportmogelijkheden: De verfijnde output is te exporteren naar Excel of CSV-bestanden, ideaal om te delen met belanghebbenden zonder toegang tot het mindzie platform.
E-mailintegratie: De output van deze calculator wordt vaak gebruikt in geautomatiseerde e-mailbezorging, om gerichte dat subsets naar proceseigenaren en managers te sturen op geplande momenten.
Dashboard widgets: De vereenvoudigde, gerichte output is perfect om in dashboardwidgets te embedden waar ruimte beperkt is.
Gebruikstips
- Zorg altijd dat de source calculator succesvol is uitgevoerd voordat je Data Selector draait
- Gebruik de previewfunctie in de calculatorconfiguratie om beschikbare kolommen van je source te zien
- Kolomnamen zijn hoofdlettergevoelig - ze moeten exact overeenkomen met de naam in de source
- Bij combinatie van sorteren en limiet wordt eerst gesorteerd, daarna toegepast op het rijlimiet (zo maak je "top N" selecties)
- Als de source calculator geen resultaten heeft of een fout geeft, produceert Data Selector een lege tabel
- Je kunt meerdere Data Selector calculators achter elkaar gebruiken om data steeds verder te verfijnen
Veelvoorkomende patronen
Dashboardpatroon: Complexe calculator -> Data Selector (selecteer sleutelkolommen, top N rijen) -> Dashboardwidget
E-mailpatroon: Analysecalculator -> Data Selector (focus op actiegerichte data) -> Geautomatiseerde e-mailbezorging
Exportpatroon: Uitgebreide analyse -> Data Selector (vereenvoudigen voor externe stakeholders) -> Excel-export
Pijplijnpatroon: Calculator A -> Data Selector 1 (verfijnen) -> Calculator B (vervolganalyse) -> Data Selector 2 (eindoutput)
De Data Selector is bijzonder waardevol wanneer je analyseresultaten aan stakeholders presenteert die gerichte, bruikbare informatie nodig hebben in plaats van uitgebreide analytische details. Het slaat de brug tussen gedetailleerde process mining analyse en heldere, besluitklare rapportage.
Deze documentatie maakt deel uit van het mindzie Studio process mining platform.