Datenselector

Übersicht

Der Datenselector-Rechner ist ein Werkzeug zur nachträglichen Datenverarbeitung, das bestimmte Spalten aus der Ausgabe eines anderen Rechners auswählt und optional die Ergebnisse sortiert und begrenzt. Dieser Rechner ist unerlässlich, um fokussierte Datenansichten zu erstellen, indem relevante Spalten ausgewählt, die Daten sortiert und nur die obersten N Zeilen angezeigt werden.

Im Gegensatz zu den meisten Rechnertypen, die Prozessdaten direkt analysieren, arbeitet der Datenselector mit den Ausgabetabellen anderer Rechner und eignet sich daher ideal, um Analyseergebnisse für Dashboards, Berichte und Exporte zu verfeinern.

Häufige Verwendungszwecke

Vorbereitung spezifischer Datensätze für E-Mail-Versand oder Export an Stakeholder
Erstellung vereinfachter Dashboard-Ansichten, die nur Schlüsselkennzahlen aus komplexen Analysen zeigen
Auswahl und Sortierung der Top-N-Ergebnisse aus großen Analyseergebnissen (z. B. die 10 langsamsten Fälle)
Fokussierung von Berichten auf relevante Spalten durch Entfernen unnötiger Details
Umwandlung umfassender Analyseergebnisse in für Führungskräfte verständliche Zusammenfassungen
Erstellung von Datenpipelines durch Verketten mehrerer Rechner und Auswahl spezifischer Ausgaben auf jeder Stufe

Einstellungen

Source Calculator: Wählen Sie den Rechnerblock aus, dessen Ausgabe Sie verwenden möchten. Dieser Rechner muss im aktuellen Notebook bereits ausgeführt worden sein.

Source Table: Wählen Sie die Tabelle aus, falls der Quellrechner mehrere Ergebnis-Tabellen erzeugt. Die meisten Rechner produzieren eine einzelne Tabelle (Index 0), aber manche Rechner liefern mehrere Tabellen mit unterschiedlichen Informationstypen.

Columns to Include: Wählen Sie aus, welche Spalten aus der Quelltabelle in der Ausgabe erscheinen sollen. Sie können mehrere Spalten auswählen, die in der von Ihnen angegebenen Reihenfolge erscheinen. Die Spaltennamen müssen genau mit denen im Quellrechner-Ausgabe übereinstimmen.

Sort Column: Optional können Sie eine Spalte wählen, nach der die Ergebnisse sortiert werden sollen. Wenn keine Sortierspalte angegeben wird, bleibt die Datenreihenfolge wie in der Quellrechnungsausgabe erhalten.

Sort Direction: Bei aktivierter Sortierung wählen Sie, ob auf- oder absteigend sortiert wird:

Aufsteigend: Von niedrig nach hoch (A-Z, 0-9, älteste bis neueste)
Absteigend: Von hoch nach niedrig (Z-A, 9-0, neueste bis älteste)

Maximum Rows: Geben Sie die maximale Anzahl von Zeilen an, die in der Ausgabe erscheinen sollen. Setzen Sie auf 0 oder leer für keine Begrenzung. In Kombination mit der Sortierung lässt sich so beispielsweise die Auswahl der "top N" Ergebnisse ermöglichen (z. B. die 20 langsamsten Fälle bei absteigender Dauer-Sortierung).

Beispiele

Beispiel 1: Top 10 langsamste Bestellungen für Executive-Bericht

Szenario: Ihr Rechner Case Duration hat 2.500 Bestellungen analysiert. Sie möchten jedoch ein Executive-Dashboard erstellen, das nur die 10 langsamsten Fälle zeigt, um sofortige Aufmerksamkeit zu erlangen.

Einstellungen:

Source Calculator: „Purchase Order Duration Analysis“
Source Table: 0 (primäre Ergebnistabelle)
Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
Sort Column: Duration
Sort Direction: Absteigend
Maximum Rows: 10

Ausgabe:

Der Rechner zeigt eine fokussierte Tabelle mit genau 4 Spalten und 10 Zeilen:

Case ID	Lieferantenname	Dauer	Gesamtwert
PO-2024-8821	Acme Manufacturing	47,3 Tage	125.400 $
PO-2024-9156	Global Supplies Inc	42,8 Tage	89.200 $
PO-2024-7633	TechParts Ltd	38,5 Tage	156.800 $
...	...	...	...

Erkenntnisse: Durch die Auswahl nur der wesentlichen Spalten und der Begrenzung auf 10 Zeilen haben Sie ein handlungsorientiertes Dashboard erstellt, das problematische Fälle hervorhebt, ohne die Führungskräfte mit 2.500 Zeilen zu überfluten. Die Sortierung nach Dauer stellt sicher, dass die dringendsten Fälle zuerst erscheinen. Die Einbeziehung des Gesamtwerts zeigt die finanziellen Auswirkungen dieser Verzögerungen.

Beispiel 2: Wöchentliche Aktivitätsübersicht für E-Mail-Verteilung

Szenario: Sie führen eine wöchentliche Analyse der Aktivitätsfrequenz durch, die detaillierte Statistik für 45 verschiedene Aktivitäten generiert. Sie möchten dem Prozessverantwortlichen nur die 15 am häufigsten vorkommenden Aktivitäten mit vereinfachten Kennzahlen per E-Mail senden.

Einstellungen:

Source Calculator: „Weekly Activity Frequency Report“
Source Table: 0
Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
Sort Column: Event Count
Sort Direction: Absteigend
Maximum Rows: 15

Ausgabe:

Eine saubere, fokussierte Tabelle, perfekt für E-Mails:

Aktivitätenname	Ereignisanzahl	Prozentualer Anteil an Gesamt-Ereignissen
Create Purchase Requisition	1.847	18,2 %
Manager Approval	1.823	17,9 %
Vendor Selection	1.792	17,6 %
...	...	...

Erkenntnisse: Diese vereinfachte Ansicht entfernt Spalten wie „First Occurrence“ und „Last Occurrence“, die in der E-Mail stören würden, und behält die wesentlichen Kennzahlen bei, die zeigen, welche Aktivitäten den Prozess dominieren. Der Empfänger sieht sofort, dass die Top-3-Aktivitäten über die Hälfte aller Prozessereignisse ausmachen.

Beispiel 3: Vereinfachung des Customer-Analysis-Dashboards

Szenario: Ihr Rechner Breakdown by Categories hat Kunden über 12 verschiedene Kennzahlen analysiert, aber Ihr Dashboard-Widget bietet nur Platz für 5 Spalten der Top-20-Kunden.

Einstellungen:

Source Calculator: „Customer Performance Analysis“
Source Table: 0
Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
Sort Column: Total Revenue
Sort Direction: Absteigend
Maximum Rows: 20

Ausgabe:

Dashboard-fertige Tabelle mit fokussierten Kennzahlen:

Kundenname	Fallanzahl	Durchschnittliche Dauer	Gesamterlös	Pünktlichkeitsanteil
MegaCorp Industries	487	8,2 Tage	4.850.000 $	92 %
TechStart Solutions	356	7,5 Tage	3.240.000 $	95 %
Global Systems Inc	298	9,1 Tage	2.870.000 $	88 %
...	...	...	...	...

Erkenntnisse: Sie haben eine umfassende 12-Spalten-Analyse in eine dashboardfreundliche 5-Spalten-Ansicht umgewandelt, die genau das zeigt, was die Stakeholder wissen müssen: welche Kunden die höchsten Erlöse generieren, wie viele Aufträge sie tätigen, wie lange die Bearbeitung dauert und wie gut die Lieferperformance ist. Die Sortierung nach Erlös stellt sicher, dass die wichtigsten Kunden auf einen Blick sichtbar sind.

Beispiel 4: Variantenanalyse - Top-Varianten nach Häufigkeit

Szenario: Ihre Variantenanalyse identifizierte 284 einzigartige Prozessvarianten. Sie möchten sich auf die Top 25 der häufigsten Varianten konzentrieren, die typischerweise 80 % Ihres Fallvolumens ausmachen.

Einstellungen:

Source Calculator: „Process Variant Analysis“
Source Table: 0
Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
Sort Column: Frequency
Sort Direction: Absteigend
Maximum Rows: 25

Ausgabe:

Varianten-ID	Häufigkeit	Kumulativer Prozentsatz	Durchschnittliche Dauer	Enthält Nacharbeit
VAR-001	1.245	24,8 %	6,2 Tage	Nein
VAR-002	876	42,2 %	8,5 Tage	Ja
VAR-003	623	54,6 %	5,8 Tage	Nein
...	...	...	...	...

Erkenntnisse: Die Top 25 Varianten repräsentieren den Kern Ihres Prozesses, und die Spalte mit dem kumulativen Prozentsatz zeigt, dass der Fokus auf diese Varianten die Mehrheit der Fälle abdeckt. Die Spalte „Enthält Nacharbeit“ signalisiert sofort, welche gängigen Varianten ineffiziente Nacharbeitsschritte enthalten, was hilft, Verbesserungsmöglichkeiten zu priorisieren.

Beispiel 5: Datumsbereichsanalyse für Trends

Szenario: Ihr Rechner rate-over-time hat tägliche Statistiken für 90 Tage erzeugt, aber Sie möchten nur die wichtigsten Kennzahlen in chronologischer Reihenfolge ohne Zeilenbegrenzung für eine vollständige Trendanalyse darstellen.

Einstellungen:

Source Calculator: „90-Day Completion Rate Analysis“
Source Table: 0
Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
Sort Column: Date
Sort Direction: Aufsteigend
Maximum Rows: 0 (keine Begrenzung)

Ausgabe:

Alle 90 Zeilen in chronologischer Reihenfolge angezeigt:

Datum	Abgeschlossene Fälle	Abschlussrate
2024-10-01	23	87,4 %
2024-10-02	28	91,2 %
2024-10-03	31	89,7 %
...	...	...

Erkenntnisse: Durch die Sortierung nach Datum aufsteigend und ohne Zeilenbegrenzung behalten Sie die vollständige Zeitreihe für Diagramme oder Exporte. Sie haben die Ausgabe durch Entfernen statistischer Spalten (wie „Standardabweichung“ und „Min/Max“) vereinfacht, die für eine grundlegende Trendvisualisierung nicht benötigt werden, und die Daten somit für Grafiktools bereinigt.

Beispiel 6: Auswahl aus mehreren Quelltabellen

Szenario: Ihr Conformance Checker liefert zwei Tabellen: Tabelle 0 enthält Zusammenfassungsstatistiken, Tabelle 1 detaillierte Verstoßauflistungen. Sie möchten aus der detaillierten Verstoß-Tabelle einen Bericht erstellen.

Einstellungen:

Source Calculator: „Standard Process Conformance Check“
Source Table: 1 (Detailtabelle, nicht Zusammenfassung)
Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
Sort Column: Violation Type
Sort Direction: Aufsteigend
Maximum Rows: 100

Ausgabe:

Case ID	Verstoßtyp	Aktivitätenname	Zeitstempel
CS-1234	Fehlender erforderlicher Schritt	Rechnungsfreigabe	2024-11-15 14:22
CS-5678	Fehlender erforderlicher Schritt	Bestellfreigabe	2024-11-16 09:15
CS-9012	Reihenfolgefehler	Wareneingang	2024-11-16 11:45
...	...	...	...

Erkenntnisse: Durch die Auswahl von Tabelle 1 statt der Standardtabelle 0 greifen Sie auf die detaillierten Verstoßdaten und nicht nur auf Zusammenfassungszähler zu. Die Sortierung nach Verstoßtyp gruppiert ähnliche Probleme, was die Identifizierung von Mustern erleichtert. Die Begrenzung auf 100 Zeilen stellt sicher, dass der Bericht übersichtlich bleibt und dennoch die wichtigsten Verstöße abdeckt.

Ausgabe

Der Datenselector-Rechner zeigt eine Tabelle mit den von Ihnen angegebenen genau ausgewählten Spalten in der ausgewählten Reihenfolge an. Die Tabellenstruktur ist dynamisch und hängt von Ihren Spaltenauswahlen ab.

Ausgabe-Eigenschaften

Spaltenstruktur: Nur die aus „Columns to Include“ ausgewählten Spalten erscheinen in der Ausgabe. Spaltennamen, Datentypen und Formatierungen werden aus dem Quellrechner übernommen.

Zeilenanzahl: Wird durch die Einstellung Maximum Rows bestimmt:

Wenn Maximum Rows = 0 oder leer: Alle Zeilen aus der Quelltabelle
Wenn Maximum Rows > 0: Bis zu so viele Zeilen (kann weniger sein, wenn der Quelloutput weniger Zeilen enthält)

Reihenfolge der Zeilen: Bestimmt durch die Sortierungseinstellungen:

Wenn keine Sortierspalte angegeben: Beibehaltung der Reihenfolge der Quellrechnung
Wenn Sortierspalte angegeben: Zeilen werden entsprechend der Sortierspalte und Sortierrichtung geordnet

Interaktive Funktionen

Klick auf Zeilen: In vielen Fällen führt ein Klick auf eine Zeile zu einer Drill-down-Ansicht mit den zugrundeliegenden Fällen oder Details, wie im Quellrechner.

Exportfunktionen: Die verfeinerte Ausgabe lässt sich als Excel- oder CSV-Dateien exportieren, was ideal zum Teilen mit Stakeholdern ist, die keinen Zugang zur mindzie-Plattform haben.

E-Mail-Integration: Die Ausgabe dieses Rechners wird oft in Verbindung mit automatisiertem E-Mail-Versand verwendet, um fokussierte Datensätze an Prozessverantwortliche und Führungskräfte geplant zu senden.

Dashboard-Widgets: Die vereinfachte, fokussierte Ausgabe eignet sich perfekt für die Einbettung in Dashboard-Widgets, wo der Platz begrenzt ist.

Anwendungstipps

Stellen Sie sicher, dass der Quellrechner vor dem Ausführen des Datenselectors erfolgreich ausgeführt wurde
Nutzen Sie die Vorschaufunktion in der Rechnerkonfiguration, um verfügbare Spalten aus Ihrer Quelle anzuzeigen
Spaltennamen sind case-sensitive – sie müssen exakt mit denen in der Quelle übereinstimmen
Bei Kombination von Sortierung und Zeilenbegrenzung wird zuerst sortiert und dann die Zeilenbegrenzung angewendet (ermöglicht „top N“-Auswahl)
Wenn der Quellrechner keine Ergebnisse hat oder ein Fehler auftritt, erzeugt der Datenselector eine leere Tabelle
Mehrere Datenselector-Rechner können nacheinander verwendet werden, um Daten schrittweise zu verfeinern

Gängige Muster

Dashboard-Muster: Komplexer Rechner -> Datenselector (Schlüsselspalten wählen, Top-N-Zeilen) -> Dashboard-Widget

E-Mail-Muster: Analyse-Rechner -> Datenselector (auf handlungsrelevante Daten fokussieren) -> Automatisierter E-Mail-Versand

Export-Muster: Umfassende Analyse -> Datenselector (für externe Stakeholder vereinfachen) -> Excel-Export

Pipeline-Muster: Rechner A -> Datenselector 1 (verfeinern) -> Rechner B (weitere Analyse) -> Datenselector 2 (Endausgabe)

Der Datenselector ist besonders wertvoll, wenn Analyseergebnisse Stakeholdern präsentiert werden sollen, die fokussierte, handlungsfähige Informationen benötigen statt umfassender analytischer Details. Er überbrückt die Lücke zwischen detaillierter Process-Mining-Analyse und klaren, entscheidungsbereiten Berichten.

Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.