Datenselector

Übersicht

Der Datenselector-Rechner ist ein Werkzeug zur nachträglichen Datenverarbeitung, das bestimmte Spalten aus der Ausgabe eines anderen Rechners auswählt und optional die Ergebnisse sortiert und begrenzt. Dieser Rechner ist unerlässlich, um fokussierte Datenansichten zu erstellen, indem relevante Spalten ausgewählt, die Daten sortiert und nur die obersten N Zeilen angezeigt werden.

Im Gegensatz zu den meisten Rechnertypen, die Prozessdaten direkt analysieren, arbeitet der Datenselector mit den Ausgabetabellen anderer Rechner und eignet sich daher ideal, um Analyseergebnisse für Dashboards, Berichte und Exporte zu verfeinern.

Häufige Verwendungszwecke

  • Vorbereitung spezifischer Datensätze für E-Mail-Versand oder Export an Stakeholder
  • Erstellung vereinfachter Dashboard-Ansichten, die nur Schlüsselkennzahlen aus komplexen Analysen zeigen
  • Auswahl und Sortierung der Top-N-Ergebnisse aus großen Analyseergebnissen (z. B. die 10 langsamsten Fälle)
  • Fokussierung von Berichten auf relevante Spalten durch Entfernen unnötiger Details
  • Umwandlung umfassender Analyseergebnisse in für Führungskräfte verständliche Zusammenfassungen
  • Erstellung von Datenpipelines durch Verketten mehrerer Rechner und Auswahl spezifischer Ausgaben auf jeder Stufe

Einstellungen

Source Calculator: Wählen Sie den Rechnerblock aus, dessen Ausgabe Sie verwenden möchten. Dieser Rechner muss im aktuellen Notebook bereits ausgeführt worden sein.

Source Table: Wählen Sie die Tabelle aus, falls der Quellrechner mehrere Ergebnis-Tabellen erzeugt. Die meisten Rechner produzieren eine einzelne Tabelle (Index 0), aber manche Rechner liefern mehrere Tabellen mit unterschiedlichen Informationstypen.

Columns to Include: Wählen Sie aus, welche Spalten aus der Quelltabelle in der Ausgabe erscheinen sollen. Sie können mehrere Spalten auswählen, die in der von Ihnen angegebenen Reihenfolge erscheinen. Die Spaltennamen müssen genau mit denen im Quellrechner-Ausgabe übereinstimmen.

Sort Column: Optional können Sie eine Spalte wählen, nach der die Ergebnisse sortiert werden sollen. Wenn keine Sortierspalte angegeben wird, bleibt die Datenreihenfolge wie in der Quellrechnungsausgabe erhalten.

Sort Direction: Bei aktivierter Sortierung wählen Sie, ob auf- oder absteigend sortiert wird:

  • Aufsteigend: Von niedrig nach hoch (A-Z, 0-9, älteste bis neueste)
  • Absteigend: Von hoch nach niedrig (Z-A, 9-0, neueste bis älteste)

Maximum Rows: Geben Sie die maximale Anzahl von Zeilen an, die in der Ausgabe erscheinen sollen. Setzen Sie auf 0 oder leer für keine Begrenzung. In Kombination mit der Sortierung lässt sich so beispielsweise die Auswahl der "top N" Ergebnisse ermöglichen (z. B. die 20 langsamsten Fälle bei absteigender Dauer-Sortierung).

Beispiele

Beispiel 1: Top 10 langsamste Bestellungen für Executive-Bericht

Szenario: Ihr Rechner Case Duration hat 2.500 Bestellungen analysiert. Sie möchten jedoch ein Executive-Dashboard erstellen, das nur die 10 langsamsten Fälle zeigt, um sofortige Aufmerksamkeit zu erlangen.

Einstellungen:

  • Source Calculator: „Purchase Order Duration Analysis“
  • Source Table: 0 (primäre Ergebnistabelle)
  • Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
  • Sort Column: Duration
  • Sort Direction: Absteigend
  • Maximum Rows: 10

Ausgabe:

Der Rechner zeigt eine fokussierte Tabelle mit genau 4 Spalten und 10 Zeilen:

Case ID Lieferantenname Dauer Gesamtwert
PO-2024-8821 Acme Manufacturing 47,3 Tage 125.400 $
PO-2024-9156 Global Supplies Inc 42,8 Tage 89.200 $
PO-2024-7633 TechParts Ltd 38,5 Tage 156.800 $
... ... ... ...

Erkenntnisse: Durch die Auswahl nur der wesentlichen Spalten und der Begrenzung auf 10 Zeilen haben Sie ein handlungsorientiertes Dashboard erstellt, das problematische Fälle hervorhebt, ohne die Führungskräfte mit 2.500 Zeilen zu überfluten. Die Sortierung nach Dauer stellt sicher, dass die dringendsten Fälle zuerst erscheinen. Die Einbeziehung des Gesamtwerts zeigt die finanziellen Auswirkungen dieser Verzögerungen.

Beispiel 2: Wöchentliche Aktivitätsübersicht für E-Mail-Verteilung

Szenario: Sie führen eine wöchentliche Analyse der Aktivitätsfrequenz durch, die detaillierte Statistik für 45 verschiedene Aktivitäten generiert. Sie möchten dem Prozessverantwortlichen nur die 15 am häufigsten vorkommenden Aktivitäten mit vereinfachten Kennzahlen per E-Mail senden.

Einstellungen:

  • Source Calculator: „Weekly Activity Frequency Report“
  • Source Table: 0
  • Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
  • Sort Column: Event Count
  • Sort Direction: Absteigend
  • Maximum Rows: 15

Ausgabe:

Eine saubere, fokussierte Tabelle, perfekt für E-Mails:

Aktivitätenname Ereignisanzahl Prozentualer Anteil an Gesamt-Ereignissen
Create Purchase Requisition 1.847 18,2 %
Manager Approval 1.823 17,9 %
Vendor Selection 1.792 17,6 %
... ... ...

Erkenntnisse: Diese vereinfachte Ansicht entfernt Spalten wie „First Occurrence“ und „Last Occurrence“, die in der E-Mail stören würden, und behält die wesentlichen Kennzahlen bei, die zeigen, welche Aktivitäten den Prozess dominieren. Der Empfänger sieht sofort, dass die Top-3-Aktivitäten über die Hälfte aller Prozessereignisse ausmachen.

Beispiel 3: Vereinfachung des Customer-Analysis-Dashboards

Szenario: Ihr Rechner Breakdown by Categories hat Kunden über 12 verschiedene Kennzahlen analysiert, aber Ihr Dashboard-Widget bietet nur Platz für 5 Spalten der Top-20-Kunden.

Einstellungen:

  • Source Calculator: „Customer Performance Analysis“
  • Source Table: 0
  • Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
  • Sort Column: Total Revenue
  • Sort Direction: Absteigend
  • Maximum Rows: 20

Ausgabe:

Dashboard-fertige Tabelle mit fokussierten Kennzahlen:

Kundenname Fallanzahl Durchschnittliche Dauer Gesamterlös Pünktlichkeitsanteil
MegaCorp Industries 487 8,2 Tage 4.850.000 $ 92 %
TechStart Solutions 356 7,5 Tage 3.240.000 $ 95 %
Global Systems Inc 298 9,1 Tage 2.870.000 $ 88 %
... ... ... ... ...

Erkenntnisse: Sie haben eine umfassende 12-Spalten-Analyse in eine dashboardfreundliche 5-Spalten-Ansicht umgewandelt, die genau das zeigt, was die Stakeholder wissen müssen: welche Kunden die höchsten Erlöse generieren, wie viele Aufträge sie tätigen, wie lange die Bearbeitung dauert und wie gut die Lieferperformance ist. Die Sortierung nach Erlös stellt sicher, dass die wichtigsten Kunden auf einen Blick sichtbar sind.

Beispiel 4: Variantenanalyse - Top-Varianten nach Häufigkeit

Szenario: Ihre Variantenanalyse identifizierte 284 einzigartige Prozessvarianten. Sie möchten sich auf die Top 25 der häufigsten Varianten konzentrieren, die typischerweise 80 % Ihres Fallvolumens ausmachen.

Einstellungen:

  • Source Calculator: „Process Variant Analysis“
  • Source Table: 0
  • Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
  • Sort Column: Frequency
  • Sort Direction: Absteigend
  • Maximum Rows: 25

Ausgabe:

Varianten-ID Häufigkeit Kumulativer Prozentsatz Durchschnittliche Dauer Enthält Nacharbeit
VAR-001 1.245 24,8 % 6,2 Tage Nein
VAR-002 876 42,2 % 8,5 Tage Ja
VAR-003 623 54,6 % 5,8 Tage Nein
... ... ... ... ...

Erkenntnisse: Die Top 25 Varianten repräsentieren den Kern Ihres Prozesses, und die Spalte mit dem kumulativen Prozentsatz zeigt, dass der Fokus auf diese Varianten die Mehrheit der Fälle abdeckt. Die Spalte „Enthält Nacharbeit“ signalisiert sofort, welche gängigen Varianten ineffiziente Nacharbeitsschritte enthalten, was hilft, Verbesserungsmöglichkeiten zu priorisieren.

Szenario: Ihr Rechner rate-over-time hat tägliche Statistiken für 90 Tage erzeugt, aber Sie möchten nur die wichtigsten Kennzahlen in chronologischer Reihenfolge ohne Zeilenbegrenzung für eine vollständige Trendanalyse darstellen.

Einstellungen:

  • Source Calculator: „90-Day Completion Rate Analysis“
  • Source Table: 0
  • Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
  • Sort Column: Date
  • Sort Direction: Aufsteigend
  • Maximum Rows: 0 (keine Begrenzung)

Ausgabe:

Alle 90 Zeilen in chronologischer Reihenfolge angezeigt:

Datum Abgeschlossene Fälle Abschlussrate
2024-10-01 23 87,4 %
2024-10-02 28 91,2 %
2024-10-03 31 89,7 %
... ... ...

Erkenntnisse: Durch die Sortierung nach Datum aufsteigend und ohne Zeilenbegrenzung behalten Sie die vollständige Zeitreihe für Diagramme oder Exporte. Sie haben die Ausgabe durch Entfernen statistischer Spalten (wie „Standardabweichung“ und „Min/Max“) vereinfacht, die für eine grundlegende Trendvisualisierung nicht benötigt werden, und die Daten somit für Grafiktools bereinigt.

Beispiel 6: Auswahl aus mehreren Quelltabellen

Szenario: Ihr Conformance Checker liefert zwei Tabellen: Tabelle 0 enthält Zusammenfassungsstatistiken, Tabelle 1 detaillierte Verstoßauflistungen. Sie möchten aus der detaillierten Verstoß-Tabelle einen Bericht erstellen.

Einstellungen:

  • Source Calculator: „Standard Process Conformance Check“
  • Source Table: 1 (Detailtabelle, nicht Zusammenfassung)
  • Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
  • Sort Column: Violation Type
  • Sort Direction: Aufsteigend
  • Maximum Rows: 100

Ausgabe:

Case ID Verstoßtyp Aktivitätenname Zeitstempel
CS-1234 Fehlender erforderlicher Schritt Rechnungsfreigabe 2024-11-15 14:22
CS-5678 Fehlender erforderlicher Schritt Bestellfreigabe 2024-11-16 09:15
CS-9012 Reihenfolgefehler Wareneingang 2024-11-16 11:45
... ... ... ...

Erkenntnisse: Durch die Auswahl von Tabelle 1 statt der Standardtabelle 0 greifen Sie auf die detaillierten Verstoßdaten und nicht nur auf Zusammenfassungszähler zu. Die Sortierung nach Verstoßtyp gruppiert ähnliche Probleme, was die Identifizierung von Mustern erleichtert. Die Begrenzung auf 100 Zeilen stellt sicher, dass der Bericht übersichtlich bleibt und dennoch die wichtigsten Verstöße abdeckt.

Ausgabe

Der Datenselector-Rechner zeigt eine Tabelle mit den von Ihnen angegebenen genau ausgewählten Spalten in der ausgewählten Reihenfolge an. Die Tabellenstruktur ist dynamisch und hängt von Ihren Spaltenauswahlen ab.

Ausgabe-Eigenschaften

Spaltenstruktur: Nur die aus „Columns to Include“ ausgewählten Spalten erscheinen in der Ausgabe. Spaltennamen, Datentypen und Formatierungen werden aus dem Quellrechner übernommen.

Zeilenanzahl: Wird durch die Einstellung Maximum Rows bestimmt:

  • Wenn Maximum Rows = 0 oder leer: Alle Zeilen aus der Quelltabelle
  • Wenn Maximum Rows > 0: Bis zu so viele Zeilen (kann weniger sein, wenn der Quelloutput weniger Zeilen enthält)

Reihenfolge der Zeilen: Bestimmt durch die Sortierungseinstellungen:

  • Wenn keine Sortierspalte angegeben: Beibehaltung der Reihenfolge der Quellrechnung
  • Wenn Sortierspalte angegeben: Zeilen werden entsprechend der Sortierspalte und Sortierrichtung geordnet

Interaktive Funktionen

Klick auf Zeilen: In vielen Fällen führt ein Klick auf eine Zeile zu einer Drill-down-Ansicht mit den zugrundeliegenden Fällen oder Details, wie im Quellrechner.

Exportfunktionen: Die verfeinerte Ausgabe lässt sich als Excel- oder CSV-Dateien exportieren, was ideal zum Teilen mit Stakeholdern ist, die keinen Zugang zur mindzie-Plattform haben.

E-Mail-Integration: Die Ausgabe dieses Rechners wird oft in Verbindung mit automatisiertem E-Mail-Versand verwendet, um fokussierte Datensätze an Prozessverantwortliche und Führungskräfte geplant zu senden.

Dashboard-Widgets: Die vereinfachte, fokussierte Ausgabe eignet sich perfekt für die Einbettung in Dashboard-Widgets, wo der Platz begrenzt ist.

Anwendungstipps

  • Stellen Sie sicher, dass der Quellrechner vor dem Ausführen des Datenselectors erfolgreich ausgeführt wurde
  • Nutzen Sie die Vorschaufunktion in der Rechnerkonfiguration, um verfügbare Spalten aus Ihrer Quelle anzuzeigen
  • Spaltennamen sind case-sensitive – sie müssen exakt mit denen in der Quelle übereinstimmen
  • Bei Kombination von Sortierung und Zeilenbegrenzung wird zuerst sortiert und dann die Zeilenbegrenzung angewendet (ermöglicht „top N“-Auswahl)
  • Wenn der Quellrechner keine Ergebnisse hat oder ein Fehler auftritt, erzeugt der Datenselector eine leere Tabelle
  • Mehrere Datenselector-Rechner können nacheinander verwendet werden, um Daten schrittweise zu verfeinern

Gängige Muster

Dashboard-Muster: Komplexer Rechner -> Datenselector (Schlüsselspalten wählen, Top-N-Zeilen) -> Dashboard-Widget

E-Mail-Muster: Analyse-Rechner -> Datenselector (auf handlungsrelevante Daten fokussieren) -> Automatisierter E-Mail-Versand

Export-Muster: Umfassende Analyse -> Datenselector (für externe Stakeholder vereinfachen) -> Excel-Export

Pipeline-Muster: Rechner A -> Datenselector 1 (verfeinern) -> Rechner B (weitere Analyse) -> Datenselector 2 (Endausgabe)

Der Datenselector ist besonders wertvoll, wenn Analyseergebnisse Stakeholdern präsentiert werden sollen, die fokussierte, handlungsfähige Informationen benötigen statt umfassender analytischer Details. Er überbrückt die Lücke zwischen detaillierter Process-Mining-Analyse und klaren, entscheidungsbereiten Berichten.


Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.