Daten Selektor

Überblick

Der Data Selector Rechner ist ein Tool zur Daten-Nachverarbeitung, das bestimmte Spalten aus der Ausgabe eines anderen Rechners auswählt und optional die Ergebnisse sortiert und begrenzt. Dieser Rechner ist essenziell, um fokussierte Datenansichten zu erstellen, indem relevante Spalten ausgewählt, die Daten geordnet und nur die Top-N-Zeilen angezeigt werden.

Im Gegensatz zu den meisten Rechnern, die Prozessdaten direkt analysieren, arbeitet der Data Selector mit den Ausgabetabellen anderer Rechner, was ihn ideal macht, um Analyseergebnisse für Dashboards, Berichte und Exporte zu verfeinern.

Häufige Anwendungsfälle

Vorbereitung spezifischer Datenausschnitte für E-Mail-Versand oder Export an Stakeholder
Erstellung vereinfachter Dashboard-Ansichten, die nur Schlüsselkennzahlen aus komplexen Analysen zeigen
Auswahl und Sortierung der Top-N-Ergebnisse aus großen Analyseergebnissen (z.B. Top 10 langsamste Fälle)
Fokussierung von Berichten auf relevante Spalten durch Entfernen unnötiger Details
Transformation umfassender Analyseergebnisse in executive-freundliche Zusammenfassungen
Erstellung von Datenpipelines durch Verkettung mehrerer Rechner und Auswahl spezifischer Ausgaben in jedem Schritt

Einstellungen

Source Calculator: Wählen Sie den Rechner-Block aus, dessen Ausgabe Sie verwenden möchten. Dieser Rechner muss im aktuellen Notebook bereits ausgeführt worden sein.

Source Table: Wählen Sie die Tabelle aus, falls der Quellrechner mehrere Ergebnistabellen erzeugt. Die meisten Rechner produzieren eine einzelne Tabelle (Index 0), aber einige liefern mehrere Tabellen mit unterschiedlichen Informationen.

Columns to Include: Wählen Sie aus, welche Spalten aus der Quelltabelle in der Ausgabe erscheinen sollen. Sie können mehrere Spalten auswählen, die in der von Ihnen angegebenen Reihenfolge erscheinen. Die Spaltennamen müssen genau mit denen der Quellrechner-Ausgabe übereinstimmen.

Sort Column: Optional eine Spalte wählen, nach der die Ergebnisse sortiert werden sollen. Wenn keine Sortierspalte angegeben wird, bleibt die Reihenfolge der Quellrechner-Ausgabe erhalten.

Sort Direction: Wenn eine Sortierung aktiviert ist, wählen Sie aus, ob in

Aufsteigender Reihenfolge: Kleinste bis größte Werte (A-Z, 0-9, älteste bis neueste)
Absteigender Reihenfolge: Größte bis kleinste Werte (Z-A, 9-0, neueste bis älteste) sortiert werden soll

Maximum Rows: Legen Sie die maximale Anzahl der Zeilen fest, die in der Ausgabe enthalten sein sollen. 0 oder leer für keine Begrenzung. In Kombination mit Sortierung können Sie so z.B. die „Top N“ Ergebnisse auswählen (z.B. die 20 langsamsten Fälle bei absteigend sortierter Dauer).

Beispiele

Beispiel 1: Top 10 langsamste Bestellungen für Executive Report

Szenario: Ihr Case Duration Rechner hat 2.500 Bestellungen analysiert, aber Sie wollen ein Executive-Dashboard erstellen, das nur die 10 langsamsten Fälle für sofortige Aufmerksamkeit zeigt.

Einstellungen:

Source Calculator: "Purchase Order Duration Analysis"
Source Table: 0 (primäre Ergebnistabelle)
Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
Sort Column: Duration
Sort Direction: Descending
Maximum Rows: 10

Ausgabe:

Der Rechner zeigt eine fokussierte Tabelle mit genau 4 Spalten und 10 Zeilen an:

Case ID	Lieferantenname	Dauer	Gesamtwert
PO-2024-8821	Acme Manufacturing	47,3 Tage	125.400 $
PO-2024-9156	Global Supplies Inc	42,8 Tage	89.200 $
PO-2024-7633	TechParts Ltd	38,5 Tage	156.800 $
...	...	...	...

Erkenntnisse: Durch die Auswahl nur der wesentlichen Spalten und Begrenzung auf 10 Zeilen haben Sie ein handlungsorientiertes Dashboard geschaffen, das problematische Fälle hervorhebt, ohne die Führungskräfte mit 2.500 Datenzeilen zu überfluten. Die Sortierung nach Dauer stellt sicher, dass die dringendsten Fälle zuerst erscheinen. Die Aufnahme des Gesamtwerts zeigt die finanziellen Auswirkungen dieser Verzögerungen.

Beispiel 2: Wöchentliche Aktivitätszusammenfassung für E-Mail-Versand

Szenario: Sie führen eine wöchentliche Analyse der Aktivitätenfrequenz durch, die ausführliche Statistiken für 45 verschiedene Aktivitäten generiert. Sie wollen dem Prozessverantwortlichen per E-Mail nur die 15 häufigsten Aktivitäten mit vereinfachten Kennzahlen zusenden.

Einstellungen:

Source Calculator: "Weekly Activity Frequency Report"
Source Table: 0
Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
Sort Column: Event Count
Sort Direction: Descending
Maximum Rows: 15

Ausgabe:

Eine saubere, fokussierte Tabelle, ideal für E-Mails:

Aktivitätsname	Ereignisanzahl	Anteil an allen Ereignissen
Purchase Requisition anlegen	1.847	18,2 %
Manager Genehmigung	1.823	17,9 %
Lieferantenauswahl	1.792	17,6 %
...	...	...

Erkenntnisse: Diese vereinfachte Ansicht entfernt Spalten wie „Erstes Auftreten“ und „Letztes Auftreten“, die die E-Mail überladen, während wesentliche Kennzahlen erhalten bleiben, die zeigen, welche Aktivitäten den Prozess dominieren. Der Empfänger sieht sofort, dass die Top 3 Aktivitäten über die Hälfte aller Prozessereignisse ausmachen.

Beispiel 3: Vereinfachung eines Kundenanalyse-Dashboards

Szenario: Ihr Breakdown by Categories Rechner hat Kunden anhand von 12 unterschiedlichen Kennzahlen analysiert, aber Ihr Dashboard-Widget hat nur Platz für 5 Spalten für die Top 20 Kunden.

Einstellungen:

Source Calculator: "Customer Performance Analysis"
Source Table: 0
Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
Sort Column: Total Revenue
Sort Direction: Descending
Maximum Rows: 20

Ausgabe:

Dashboard-geeignete Tabelle mit fokussierten Kennzahlen:

Kundenname	Fallanzahl	Durchschnittliche Dauer	Gesamtumsatz	Pünktlichkeitsquote
MegaCorp Industries	487	8,2 Tage	4.850.000 $	92 %
TechStart Solutions	356	7,5 Tage	3.240.000 $	95 %
Global Systems Inc	298	9,1 Tage	2.870.000 $	88 %
...	...	...	...	...

Erkenntnisse: Sie haben eine umfangreiche 12-Spalten-Analyse in eine dashboardfreundliche 5-Spalten-Ansicht verwandelt, die genau zeigt, was Stakeholder wissen müssen: Welche Kunden den meisten Umsatz generieren, wie viele Bestellungen sie tätigen, wie lange die Bearbeitung dauert und wie gut die Lieferperformance ist. Die Sortierung nach Umsatz stellt sicher, dass die wichtigsten Kunden auf einen Blick sichtbar sind.

Beispiel 4: Variantenanalyse – Top-Varianten nach Häufigkeit

Szenario: Ihre Variantenanalyse hat 284 einzigartige Prozessvarianten identifiziert. Sie wollen Ihre Verbesserungsmaßnahmen auf die 25 häufigsten Varianten konzentrieren, die typischerweise 80 % des Fallvolumens ausmachen.

Einstellungen:

Source Calculator: "Process Variant Analysis"
Source Table: 0
Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
Sort Column: Frequency
Sort Direction: Descending
Maximum Rows: 25

Ausgabe:

Varianten-ID	Häufigkeit	Kumulativer Anteil	Durchschnittliche Dauer	Enthält Nacharbeit
VAR-001	1.245	24,8 %	6,2 Tage	Nein
VAR-002	876	42,2 %	8,5 Tage	Ja
VAR-003	623	54,6 %	5,8 Tage	Nein
...	...	...	...	...

Erkenntnisse: Die Top 25 Varianten bilden den Kern Ihres Prozesses, und die Spalte mit dem kumulativen Anteil zeigt, dass die Konzentration auf diese Varianten den Großteil der Fälle abdeckt. Die Spalte "Enthält Nacharbeit" markiert sofort, welche häufigen Varianten ineffiziente Nacharbeitsschritte enthalten und hilft so, Verbesserungspotenziale zu priorisieren.

Beispiel 5: Datumsbereichsanalyse für Trenddarstellung

Szenario: Ihr Rate-over-Time Rechner hat tägliche Statistiken über 90 Tage generiert, aber Sie möchten nur die wichtigsten Kennzahlen in chronologischer Reihenfolge ohne Zeilenbegrenzung für eine vollständige Trendanalyse anzeigen.

Einstellungen:

Source Calculator: "90-Day Completion Rate Analysis"
Source Table: 0
Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
Sort Column: Date
Sort Direction: Ascending
Maximum Rows: 0 (keine Begrenzung)

Ausgabe:

Alle 90 Zeilen in chronologischer Reihenfolge angezeigt:

Datum	Abgeschlossene Fälle	Abschlussquote
2024-10-01	23	87,4 %
2024-10-02	28	91,2 %
2024-10-03	31	89,7 %
...	...	...

Erkenntnisse: Durch aufsteigende Sortierung nach Datum und unbegrenzte Zeilenanzahl bleibt die vollständige Zeitreihe für Diagramme oder Exporte erhalten. Die Ausgabe wurde vereinfacht, indem statistische Spalten (wie „Standardabweichung“ und „Min/Max“) entfernt wurden, die für eine grundlegende Trendvisualisierung nicht notwendig sind, was die Daten für Grafiktools sauberer macht.

Beispiel 6: Auswahl mehrerer Quelltabellen

Szenario: Ihr Conformance Checker liefert zwei Tabellen: Tabelle 0 enthält zusammenfassende Statistiken, Tabelle 1 detaillierte Verstöße. Sie wollen einen Bericht aus der Tabelle mit den detaillierten Verstößen erstellen.

Einstellungen:

Source Calculator: "Standard Process Conformance Check"
Source Table: 1 (Detailtabelle, nicht Summary)
Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
Sort Column: Violation Type
Sort Direction: Ascending
Maximum Rows: 100

Ausgabe:

Case ID	Verstoßart	Aktivitätsname	Zeitstempel
CS-1234	Fehlender erforderlicher Schritt	Rechnungsfreigabe	2024-11-15 14:22
CS-5678	Fehlender erforderlicher Schritt	Bestellfreigabe	2024-11-16 09:15
CS-9012	Falsche Reihenfolge	Wareneingang	2024-11-16 11:45
...	...	...	...

Erkenntnisse: Durch die Auswahl von Tabelle 1 anstelle der Standardtabelle 0 greifen Sie auf die detaillierten Verstoßdaten zu und nicht nur auf Zusammenfassungsstatistiken. Die Sortierung nach Verstoßart gruppiert ähnliche Probleme, was Mustererkennung erleichtert. Die Begrenzung auf 100 Zeilen stellt sicher, dass der Bericht übersichtlich bleibt und die wichtigsten Verstöße abdeckt.

Ausgabe

Der Data Selector Rechner zeigt eine Tabelle mit genau den von Ihnen angegebenen Spalten in der von Ihnen gewählten Reihenfolge an. Die Tabellenstruktur ist dynamisch und hängt von Ihrer Spaltenauswahl ab.

Eigenschaften der Ausgabe

Spaltenstruktur: Es erscheinen nur die Spalten, die Sie unter „Columns to Include“ ausgewählt haben. Spaltennamen, Datentypen und Formatierungen werden aus der Quelle übernommen.

Anzahl der Zeilen: Abhängig von der Einstellung Maximum Rows:

Wenn Maximum Rows = 0 oder leer: Alle Zeilen der Quelltabelle
Wenn Maximum Rows > 0: Bis zu dieser Anzahl (kann weniger sein, wenn die Quelle weniger Zeilen hat)

Reihenfolge der Zeilen: Abhängig von der Sortierung:

Wenn keine Sortierspalte angegeben: Bleibt die ursprüngliche Reihenfolge der Quellrechner-Ausgabe
Wenn Sortierspalte angegeben: Zeilen werden nach der Sortierspalte und Sortierrichtung geordnet

Interaktive Funktionen

Klick auf Zeilen: In vielen Fällen können Sie durch Klicken auf eine Zeile in die zugrundeliegenden Fälle oder Details hineinzoomen, ähnlich wie im Quellrechner.

Export-Funktionen: Die verfeinerte Ausgabe kann nach Excel oder CSV exportiert werden, ideal zum Teilen mit Stakeholdern ohne Zugriff auf die mindzie-Plattform.

E-Mail-Integration: Oft wird die Ausgabe dieses Rechners für automatisierten E-Mail-Versand genutzt, um fokussierte Datensätze an Prozessverantwortliche und Führungskräfte geplant zu senden.

Dashboard Widgets: Die vereinfachte, fokussierte Ausgabe eignet sich perfekt zum Einbetten in Dashboard-Widgets mit begrenztem Platz.

Nutzungstipps

Stellen Sie sicher, dass der Quellrechner erfolgreich ausgeführt wurde, bevor Sie Data Selector nutzen
Verwenden Sie die Vorschaufunktion in der Rechnerkonfiguration, um verfügbare Spalten aus Ihrer Quelle zu sehen
Spaltennamen sind case-sensitiv – sie müssen exakt so wie in der Quelle geschrieben sein
Bei Kombination von Sortierung mit Zeilenlimit wird zuerst sortiert, dann begrenzt (ermöglicht Top-N-Auswahl)
Wenn der Quellrechner keine Ergebnisse oder einen Fehler zurückgibt, liefert Data Selector eine leere Tabelle
Sie können mehrere Data Selector Rechner in Folge verwenden, um Daten nach und nach zu verfeinern

Häufige Muster

Dashboard-Muster: Komplexer Rechner -> Data Selector (Schlüsselspalten, Top-N-Zeilen) -> Dashboard-Widget

E-Mail-Muster: Analyse-Rechner -> Data Selector (Fokus auf handlungsrelevante Daten) -> Automatisierter E-Mail-Versand

Export-Muster: Umfassende Analyse -> Data Selector (Vereinfachung für externe Stakeholder) -> Excel-Export

Pipeline-Muster: Rechner A -> Data Selector 1 (Verfeinerung) -> Rechner B (weitere Analyse) -> Data Selector 2 (Endausgabe)

Der Data Selector ist besonders wertvoll, wenn Analyseergebnisse an Stakeholder vermittelt werden müssen, die fokussierte, handlungsrelevante Informationen und keine umfassenden Analysedetails benötigen. Er überbrückt die Lücke zwischen detaillierter Process Mining Analyse und klaren, entscheidungsfertigen Berichten.

Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.