Data Selector

Overzicht

De Data Selector calculator is een hulpmiddel voor naverwerking van gegevens dat specifieke kolommen selecteert uit de uitvoer van een andere calculator en optioneel de resultaten sorteert en beperkt. Deze calculator is essentieel voor het creëren van gerichte dataviews door relevante kolommen te kiezen, de data te ordenen en alleen de top N rijen weer te geven.

In tegenstelling tot de meeste calculators die procesdata direct analyseren, werkt Data Selector met de outputtabellen van andere calculators, waardoor het ideaal is om analyseresultaten te verfijnen voor dashboards, rapporten en exports.

Veelvoorkomende toepassingen

  • Voorbereiden van specifieke datasets voor e-mailbezorging of export naar stakeholders
  • Creëren van vereenvoudigde dashboardweergaven die alleen kernstatistieken tonen uit complexe analyses
  • Selecteren en sorteren van de top N resultaten uit grote analyse-uitvoer (bijv. top 10 langzaamste cases)
  • Rapporten richten op relevante kolommen door onnodige details te verwijderen
  • Omzetten van uitgebreide analyseresultaten in samenvattingen voor het management
  • Opzetten van datapijplijnen door meerdere calculators aan elkaar te koppelen en bij elke stap specifieke outputs te selecteren

Instellingen

Source Calculator: Selecteer het calculatorblok waarvan u de uitvoer wilt gebruiken. Deze calculator moet al uitgevoerd zijn in het huidige notebook.

Source Table: Kies welke tabel gebruikt moet worden als de broncalculator meerdere resultaat tabellen oplevert. De meeste calculators produceren één tabel (index 0), maar sommige geven meerdere tabellen met verschillende soorten informatie terug.

Columns to Include: Selecteer welke kolommen uit de bron-tabel in de uitvoer moeten verschijnen. U kunt meerdere kolommen selecteren en ze verschijnen in de volgorde die u opgeeft. Kolomnamen moeten exact overeenkomen met hoe ze in de broncalculator-output voorkomen.

Sort Column: Optioneel kunt u een kolom kiezen waarop de resultaten gesorteerd moeten worden. Als u geen sorteerkolom opgeeft, blijft de data in dezelfde volgorde als in de broncalculator-output.

Sort Direction: Bij sortering kiest u of de sortering in:

  • Oplopende volgorde: Van laag naar hoog (A-Z, 0-9, oud naar nieuw)
  • Aflopende volgorde: Van hoog naar laag (Z-A, 9-0, nieuw naar oud)

Maximum Rows: Specificeer het maximale aantal rijen dat in de uitvoer mag verschijnen. Stel in op 0 of laat leeg voor geen limiet. Gecombineerd met sortering kunt u zo de "top N" resultaten selecteren (bijv. top 20 langzaamste cases bij sortering op duur aflopend).

Voorbeelden

Voorbeeld 1: Top 10 langzaamste inkooporders voor rapport management

Scenario: Uw Case Duration calculator heeft 2.500 inkooporders geanalyseerd, maar u wilt een executive dashboard maken dat slechts de 10 langzaamste cases toont voor directe aandacht.

Instellingen:

  • Source Calculator: "Purchase Order Duration Analysis"
  • Source Table: 0 (primaire resultaatentabel)
  • Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
  • Sort Column: Duration
  • Sort Direction: Descending
  • Maximum Rows: 10

Output:

De calculator toont een gerichte tabel met precies 4 kolommen en 10 rijen:

Case ID Naam leverancier Duur Totale waarde
PO-2024-8821 Acme Manufacturing 47,3 dagen $125.400
PO-2024-9156 Global Supplies Inc 42,8 dagen $89.200
PO-2024-7633 TechParts Ltd 38,5 dagen $156.800
... ... ... ...

Inzichten: Door alleen de essentiële kolommen te selecteren en te beperken tot 10 rijen, heeft u een uitvoerbaar dashboard gemaakt dat problematische cases benadrukt zonder het management te overladen met 2.500 rijen data. De sortering op duur zorgt dat de meest dringende cases eerst verschijnen. De opname van Totale waarde toont de financiële impact van deze vertragingen.

Voorbeeld 2: Wekelijkse activiteitenoverzicht voor e-maildistributie

Scenario: U runt een wekelijkse analyse van activiteitsfrequenties die gedetailleerde statistieken genereert voor 45 verschillende activiteiten. U wilt de procesverantwoordelijke alleen de top 15 meest frequente activiteiten met vereenvoudigde metrics e-mailen.

Instellingen:

  • Source Calculator: "Weekly Activity Frequency Report"
  • Source Table: 0
  • Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
  • Sort Column: Event Count
  • Sort Direction: Descending
  • Maximum Rows: 15

Output:

Een heldere, gerichte tabel perfect voor e-mail:

Activiteitsnaam Aantal gebeurtenissen Percentage van totaal aantal gebeurtenissen
Create Purchase Requisition 1.847 18,2%
Manager Approval 1.823 17,9%
Vendor Selection 1.792 17,6%
... ... ...

Inzichten: Deze vereenvoudigde weergave verwijdert kolommen zoals "Eerste voorkomen" en "Laatste voorkomen" die de e-mail rommelig maken, terwijl de essentiële metrics behouden blijven die tonen welke activiteiten domineren. De ontvanger ziet direct dat de top 3 activiteiten meer dan de helft van alle procesgebeurtenissen beslaan.

Voorbeeld 3: Customer Analysis Dashboard vereenvoudiging

Scenario: Uw Breakdown by Categories calculator heeft klanten geanalyseerd op 12 verschillende metrics, maar de dashboard-widget heeft alleen ruimte om 5 kolommen voor de top 20 klanten te tonen.

Instellingen:

  • Source Calculator: "Customer Performance Analysis"
  • Source Table: 0
  • Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
  • Sort Column: Total Revenue
  • Sort Direction: Descending
  • Maximum Rows: 20

Output:

Dashboard-klare tabel met gerichte metrics:

Klantnaam Aantal cases Gemiddelde duur Totale omzet Percentage op tijd
MegaCorp Industries 487 8,2 dagen $4.850.000 92%
TechStart Solutions 356 7,5 dagen $3.240.000 95%
Global Systems Inc 298 9,1 dagen $2.870.000 88%
... ... ... ... ...

Inzichten: U heeft een uitgebreide analyse van 12 kolommen omgezet in een dashboardvriendelijke weergave met 5 kolommen die exact tonen wat stakeholders moeten weten: welke klanten de meeste omzet genereren, hoeveel orders ze plaatsen, hoe lang de verwerking duurt, en hun leveringsprestaties. Sortering op omzet zorgt dat de belangrijkste klanten in één oogopslag zichtbaar zijn.

Voorbeeld 4: Variant Analyse - Top varianten op frequentie

Scenario: Uw variantanalyse identificeerde 284 unieke procesvarianten. U wilt uw verbeterinspanning richten op de top 25 meest voorkomende varianten die doorgaans 80% van uw caseload vertegenwoordigen.

Instellingen:

  • Source Calculator: "Process Variant Analysis"
  • Source Table: 0
  • Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
  • Sort Column: Frequency
  • Sort Direction: Descending
  • Maximum Rows: 25

Output:

Variant ID Frequentie Cumulatief percentage Gemiddelde duur Bevat herwerk
VAR-001 1.245 24,8% 6,2 dagen Nee
VAR-002 876 42,2% 8,5 dagen Ja
VAR-003 623 54,6% 5,8 dagen Nee
... ... ... ... ...

Inzichten: De top 25 varianten vormen de kern van uw proces en de kolom Cumulatief percentage toont dat deze varianten het merendeel van de cases bestrijken. De kolom "Bevat herwerk" markeert direct welke veelvoorkomende varianten inefficiënte herwerkstappen bevatten, waarmee u verbeterkansen kunt prioriteren.

Voorbeeld 5: Datumrange-analyse voor trendanalyse

Scenario: Uw rate-over-time calculator genereerde dagelijkse statistieken voor 90 dagen, maar u wilt alleen de kernmetrics tonen in chronologische volgorde zonder rijlimiet voor een volledige trendanalyse.

Instellingen:

  • Source Calculator: "90-Day Completion Rate Analysis"
  • Source Table: 0
  • Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
  • Sort Column: Date
  • Sort Direction: Ascending
  • Maximum Rows: 0 (geen limiet)

Output:

Alle 90 rijen getoond in chronologische volgorde:

Datum Aantal voltooide cases Voltooiingspercentage
2024-10-01 23 87,4%
2024-10-02 28 91,2%
2024-10-03 31 89,7%
... ... ...

Inzichten: Door te sorteren op datum oplopend en het aantal rijen niet te beperken, behoudt u de volledige tijdreeks voor grafiekweergave of export. U heeft de output vereenvoudigd door statistische kolommen (zoals "Standaardafwijking" en "Min/Max") te verwijderen die voor basis trendvisualisatie niet nodig zijn, wat de data schoner maakt voor grafiektools.

Voorbeeld 6: Multi-Table Bronselectie

Scenario: Uw conformance checker levert twee tabellen: tabel 0 bevat samenvattende statistieken en tabel 1 bevat gedetailleerde overtredingslijsten. U wilt een rapport maken van de gedetailleerde overtredingen.

Instellingen:

  • Source Calculator: "Standard Process Conformance Check"
  • Source Table: 1 (detailtabel, niet samenvatting)
  • Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
  • Sort Column: Violation Type
  • Sort Direction: Ascending
  • Maximum Rows: 100

Output:

Case ID Type overtreding Activiteitsnaam Tijdstempel
CS-1234 Verplichte stap ontbreekt Invoice Approval 2024-11-15 14:22
CS-5678 Verplichte stap ontbreekt Purchase Approval 2024-11-16 09:15
CS-9012 Buiten volgorde Goods Receipt 2024-11-16 11:45
... ... ... ...

Inzichten: Door tabel 1 te selecteren in plaats van de standaard tabel 0 krijgt u toegang tot gedetailleerde overtredingsgegevens in plaats van alleen samenvattende tellingen. Sorteren op overtredingstype groepeert gelijke problemen, waardoor het makkelijker is patronen te herkennen. De limiet van 100 rijen zorgt dat het rapport beheersbaar blijft terwijl het de belangrijkste overtredingen omvat.

Output

De Data Selector calculator toont een tabel met precies de kolommen die u hebt geselecteerd, in de door u opgegeven volgorde. De tabelstructuur is dynamisch en hangt af van uw kolomselecties.

Kenmerken van output

Kolomstructuur: Alleen de geselecteerde kolommen uit "Columns to Include" verschijnen in de output. Kolomnamen, datatypes en formattering worden van de broncalculator behouden.

Aantal rijen: Wordt bepaald door de instelling Maximum Rows:

  • Als Maximum Rows = 0 of leeg: Alle rijen uit de bron-tabel
  • Als Maximum Rows > 0: Maximaal dat aantal rijen (mogelijk minder als er minder rijen in de bron-tabel zijn)

Rijvolgorde: Wordt bepaald door de sorteerinstellingen:

  • Geen sorteerkolom opgegeven: Behoudt dezelfde volgorde als in de broncalculator
  • Sorteerkolom opgegeven: Rijen worden gesorteerd volgens de sorteer kolom en richting

Interactieve functies

Klik op rijen: In veel gevallen leidt klikken op een rij tot een drilldown naar de onderliggende cases of details, net zoals in de broncalculator.

Exportmogelijkheden: De verfijnde output kan worden geëxporteerd naar Excel- of CSV-bestanden, wat ideaal is om te delen met stakeholders zonder toegang tot het mindzie-platform.

E-mailintegratie: De output van deze calculator wordt vaak gebruikt in combinatie met geautomatiseerde e-mailbezorging om gerichte datasets op geplande momenten naar procesverantwoordelijken en management te sturen.

Dashboardwidgets: De vereenvoudigde en gerichte output is perfect om in dashboardwidgets in te sluiten waar ruimte beperkt is.

Gebruikstips

  • Zorg altijd dat de broncalculator succesvol is uitgevoerd voordat u Data Selector draait
  • Gebruik de previewfunctie in de calculatorconfiguratie om beschikbare kolommen van uw bron te bekijken
  • Kolomnamen zijn hoofdlettergevoelig - ze moeten exact overeenkomen met de bron
  • Bij combinatie van sortering en rijlimieten wordt eerst gesorteerd en daarna het aantal rijen beperkt (waardoor "top N" selectie mogelijk is)
  • Als de broncalculator geen resultaten heeft of een foutmelding geeft, produceert Data Selector een lege tabel
  • Meerdere Data Selector calculators kunnen achter elkaar worden gebruikt om data stapsgewijs te verfijnen

Veelvoorkomende patronen

Dashboardpatroon: Complexe calculator -> Data Selector (selecteer kernkolommen, top N rijen) -> Dashboardwidget

E-mailpatroon: Analysecalculator -> Data Selector (focus op actiegerichte data) -> Geautomatiseerde e-mailbezorging

Exportpatroon: Uitgebreide analyse -> Data Selector (vereenvoudigen voor externe stakeholders) -> Excel-export

Pijplijnpatroon: Calculator A -> Data Selector 1 (verfijnen) -> Calculator B (verdere analyse) -> Data Selector 2 (definitieve output)

De Data Selector is bijzonder waardevol wanneer u analyseresultaten moet presenteren aan stakeholders die gerichte, bruikbare informatie nodig hebben in plaats van volledige analytische details. Het overbrugt de kloof tussen gedetailleerde procesmining-analyse en duidelijke, besluitklare rapportage.


Deze documentatie maakt deel uit van het mindzie Studio process mining platform.