Daten Selektor
Überblick
Der Data Selector Rechner ist ein Tool zur Daten-Nachverarbeitung, das bestimmte Spalten aus der Ausgabe eines anderen Rechners auswählt und optional die Ergebnisse sortiert und begrenzt. Dieser Rechner ist essenziell, um fokussierte Datenansichten zu erstellen, indem relevante Spalten ausgewählt, die Daten geordnet und nur die Top-N-Zeilen angezeigt werden.
Im Gegensatz zu den meisten Rechnern, die Prozessdaten direkt analysieren, arbeitet der Data Selector mit den Ausgabetabellen anderer Rechner, was ihn ideal macht, um Analyseergebnisse für Dashboards, Berichte und Exporte zu verfeinern.
Häufige Anwendungsfälle
- Vorbereitung spezifischer Datenausschnitte für E-Mail-Versand oder Export an Stakeholder
- Erstellung vereinfachter Dashboard-Ansichten, die nur Schlüsselkennzahlen aus komplexen Analysen zeigen
- Auswahl und Sortierung der Top-N-Ergebnisse aus großen Analyseergebnissen (z.B. Top 10 langsamste Fälle)
- Fokussierung von Berichten auf relevante Spalten durch Entfernen unnötiger Details
- Transformation umfassender Analyseergebnisse in executive-freundliche Zusammenfassungen
- Erstellung von Datenpipelines durch Verkettung mehrerer Rechner und Auswahl spezifischer Ausgaben in jedem Schritt
Einstellungen
Source Calculator: Wählen Sie den Rechner-Block aus, dessen Ausgabe Sie verwenden möchten. Dieser Rechner muss im aktuellen Notebook bereits ausgeführt worden sein.
Source Table: Wählen Sie die Tabelle aus, falls der Quellrechner mehrere Ergebnistabellen erzeugt. Die meisten Rechner produzieren eine einzelne Tabelle (Index 0), aber einige liefern mehrere Tabellen mit unterschiedlichen Informationen.
Columns to Include: Wählen Sie aus, welche Spalten aus der Quelltabelle in der Ausgabe erscheinen sollen. Sie können mehrere Spalten auswählen, die in der von Ihnen angegebenen Reihenfolge erscheinen. Die Spaltennamen müssen genau mit denen der Quellrechner-Ausgabe übereinstimmen.
Sort Column: Optional eine Spalte wählen, nach der die Ergebnisse sortiert werden sollen. Wenn keine Sortierspalte angegeben wird, bleibt die Reihenfolge der Quellrechner-Ausgabe erhalten.
Sort Direction: Wenn eine Sortierung aktiviert ist, wählen Sie aus, ob in
- Aufsteigender Reihenfolge: Kleinste bis größte Werte (A-Z, 0-9, älteste bis neueste)
- Absteigender Reihenfolge: Größte bis kleinste Werte (Z-A, 9-0, neueste bis älteste) sortiert werden soll
Maximum Rows: Legen Sie die maximale Anzahl der Zeilen fest, die in der Ausgabe enthalten sein sollen. 0 oder leer für keine Begrenzung. In Kombination mit Sortierung können Sie so z.B. die „Top N“ Ergebnisse auswählen (z.B. die 20 langsamsten Fälle bei absteigend sortierter Dauer).
Beispiele
Beispiel 1: Top 10 langsamste Bestellungen für Executive Report
Szenario: Ihr Case Duration Rechner hat 2.500 Bestellungen analysiert, aber Sie wollen ein Executive-Dashboard erstellen, das nur die 10 langsamsten Fälle für sofortige Aufmerksamkeit zeigt.
Einstellungen:
- Source Calculator: "Purchase Order Duration Analysis"
- Source Table: 0 (primäre Ergebnistabelle)
- Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
- Sort Column: Duration
- Sort Direction: Descending
- Maximum Rows: 10
Ausgabe:
Der Rechner zeigt eine fokussierte Tabelle mit genau 4 Spalten und 10 Zeilen an:
| Case ID | Lieferantenname | Dauer | Gesamtwert |
|---|---|---|---|
| PO-2024-8821 | Acme Manufacturing | 47,3 Tage | 125.400 $ |
| PO-2024-9156 | Global Supplies Inc | 42,8 Tage | 89.200 $ |
| PO-2024-7633 | TechParts Ltd | 38,5 Tage | 156.800 $ |
| ... | ... | ... | ... |
Erkenntnisse: Durch die Auswahl nur der wesentlichen Spalten und Begrenzung auf 10 Zeilen haben Sie ein handlungsorientiertes Dashboard geschaffen, das problematische Fälle hervorhebt, ohne die Führungskräfte mit 2.500 Datenzeilen zu überfluten. Die Sortierung nach Dauer stellt sicher, dass die dringendsten Fälle zuerst erscheinen. Die Aufnahme des Gesamtwerts zeigt die finanziellen Auswirkungen dieser Verzögerungen.
Beispiel 2: Wöchentliche Aktivitätszusammenfassung für E-Mail-Versand
Szenario: Sie führen eine wöchentliche Analyse der Aktivitätenfrequenz durch, die ausführliche Statistiken für 45 verschiedene Aktivitäten generiert. Sie wollen dem Prozessverantwortlichen per E-Mail nur die 15 häufigsten Aktivitäten mit vereinfachten Kennzahlen zusenden.
Einstellungen:
- Source Calculator: "Weekly Activity Frequency Report"
- Source Table: 0
- Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
- Sort Column: Event Count
- Sort Direction: Descending
- Maximum Rows: 15
Ausgabe:
Eine saubere, fokussierte Tabelle, ideal für E-Mails:
| Aktivitätsname | Ereignisanzahl | Anteil an allen Ereignissen |
|---|---|---|
| Purchase Requisition anlegen | 1.847 | 18,2 % |
| Manager Genehmigung | 1.823 | 17,9 % |
| Lieferantenauswahl | 1.792 | 17,6 % |
| ... | ... | ... |
Erkenntnisse: Diese vereinfachte Ansicht entfernt Spalten wie „Erstes Auftreten“ und „Letztes Auftreten“, die die E-Mail überladen, während wesentliche Kennzahlen erhalten bleiben, die zeigen, welche Aktivitäten den Prozess dominieren. Der Empfänger sieht sofort, dass die Top 3 Aktivitäten über die Hälfte aller Prozessereignisse ausmachen.
Beispiel 3: Vereinfachung eines Kundenanalyse-Dashboards
Szenario: Ihr Breakdown by Categories Rechner hat Kunden anhand von 12 unterschiedlichen Kennzahlen analysiert, aber Ihr Dashboard-Widget hat nur Platz für 5 Spalten für die Top 20 Kunden.
Einstellungen:
- Source Calculator: "Customer Performance Analysis"
- Source Table: 0
- Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
- Sort Column: Total Revenue
- Sort Direction: Descending
- Maximum Rows: 20
Ausgabe:
Dashboard-geeignete Tabelle mit fokussierten Kennzahlen:
| Kundenname | Fallanzahl | Durchschnittliche Dauer | Gesamtumsatz | Pünktlichkeitsquote |
|---|---|---|---|---|
| MegaCorp Industries | 487 | 8,2 Tage | 4.850.000 $ | 92 % |
| TechStart Solutions | 356 | 7,5 Tage | 3.240.000 $ | 95 % |
| Global Systems Inc | 298 | 9,1 Tage | 2.870.000 $ | 88 % |
| ... | ... | ... | ... | ... |
Erkenntnisse: Sie haben eine umfangreiche 12-Spalten-Analyse in eine dashboardfreundliche 5-Spalten-Ansicht verwandelt, die genau zeigt, was Stakeholder wissen müssen: Welche Kunden den meisten Umsatz generieren, wie viele Bestellungen sie tätigen, wie lange die Bearbeitung dauert und wie gut die Lieferperformance ist. Die Sortierung nach Umsatz stellt sicher, dass die wichtigsten Kunden auf einen Blick sichtbar sind.
Beispiel 4: Variantenanalyse – Top-Varianten nach Häufigkeit
Szenario: Ihre Variantenanalyse hat 284 einzigartige Prozessvarianten identifiziert. Sie wollen Ihre Verbesserungsmaßnahmen auf die 25 häufigsten Varianten konzentrieren, die typischerweise 80 % des Fallvolumens ausmachen.
Einstellungen:
- Source Calculator: "Process Variant Analysis"
- Source Table: 0
- Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
- Sort Column: Frequency
- Sort Direction: Descending
- Maximum Rows: 25
Ausgabe:
| Varianten-ID | Häufigkeit | Kumulativer Anteil | Durchschnittliche Dauer | Enthält Nacharbeit |
|---|---|---|---|---|
| VAR-001 | 1.245 | 24,8 % | 6,2 Tage | Nein |
| VAR-002 | 876 | 42,2 % | 8,5 Tage | Ja |
| VAR-003 | 623 | 54,6 % | 5,8 Tage | Nein |
| ... | ... | ... | ... | ... |
Erkenntnisse: Die Top 25 Varianten bilden den Kern Ihres Prozesses, und die Spalte mit dem kumulativen Anteil zeigt, dass die Konzentration auf diese Varianten den Großteil der Fälle abdeckt. Die Spalte "Enthält Nacharbeit" markiert sofort, welche häufigen Varianten ineffiziente Nacharbeitsschritte enthalten und hilft so, Verbesserungspotenziale zu priorisieren.
Beispiel 5: Datumsbereichsanalyse für Trenddarstellung
Szenario: Ihr Rate-over-Time Rechner hat tägliche Statistiken über 90 Tage generiert, aber Sie möchten nur die wichtigsten Kennzahlen in chronologischer Reihenfolge ohne Zeilenbegrenzung für eine vollständige Trendanalyse anzeigen.
Einstellungen:
- Source Calculator: "90-Day Completion Rate Analysis"
- Source Table: 0
- Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
- Sort Column: Date
- Sort Direction: Ascending
- Maximum Rows: 0 (keine Begrenzung)
Ausgabe:
Alle 90 Zeilen in chronologischer Reihenfolge angezeigt:
| Datum | Abgeschlossene Fälle | Abschlussquote |
|---|---|---|
| 2024-10-01 | 23 | 87,4 % |
| 2024-10-02 | 28 | 91,2 % |
| 2024-10-03 | 31 | 89,7 % |
| ... | ... | ... |
Erkenntnisse: Durch aufsteigende Sortierung nach Datum und unbegrenzte Zeilenanzahl bleibt die vollständige Zeitreihe für Diagramme oder Exporte erhalten. Die Ausgabe wurde vereinfacht, indem statistische Spalten (wie „Standardabweichung“ und „Min/Max“) entfernt wurden, die für eine grundlegende Trendvisualisierung nicht notwendig sind, was die Daten für Grafiktools sauberer macht.
Beispiel 6: Auswahl mehrerer Quelltabellen
Szenario: Ihr Conformance Checker liefert zwei Tabellen: Tabelle 0 enthält zusammenfassende Statistiken, Tabelle 1 detaillierte Verstöße. Sie wollen einen Bericht aus der Tabelle mit den detaillierten Verstößen erstellen.
Einstellungen:
- Source Calculator: "Standard Process Conformance Check"
- Source Table: 1 (Detailtabelle, nicht Summary)
- Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
- Sort Column: Violation Type
- Sort Direction: Ascending
- Maximum Rows: 100
Ausgabe:
| Case ID | Verstoßart | Aktivitätsname | Zeitstempel |
|---|---|---|---|
| CS-1234 | Fehlender erforderlicher Schritt | Rechnungsfreigabe | 2024-11-15 14:22 |
| CS-5678 | Fehlender erforderlicher Schritt | Bestellfreigabe | 2024-11-16 09:15 |
| CS-9012 | Falsche Reihenfolge | Wareneingang | 2024-11-16 11:45 |
| ... | ... | ... | ... |
Erkenntnisse: Durch die Auswahl von Tabelle 1 anstelle der Standardtabelle 0 greifen Sie auf die detaillierten Verstoßdaten zu und nicht nur auf Zusammenfassungsstatistiken. Die Sortierung nach Verstoßart gruppiert ähnliche Probleme, was Mustererkennung erleichtert. Die Begrenzung auf 100 Zeilen stellt sicher, dass der Bericht übersichtlich bleibt und die wichtigsten Verstöße abdeckt.
Ausgabe
Der Data Selector Rechner zeigt eine Tabelle mit genau den von Ihnen angegebenen Spalten in der von Ihnen gewählten Reihenfolge an. Die Tabellenstruktur ist dynamisch und hängt von Ihrer Spaltenauswahl ab.
Eigenschaften der Ausgabe
Spaltenstruktur: Es erscheinen nur die Spalten, die Sie unter „Columns to Include“ ausgewählt haben. Spaltennamen, Datentypen und Formatierungen werden aus der Quelle übernommen.
Anzahl der Zeilen: Abhängig von der Einstellung Maximum Rows:
- Wenn Maximum Rows = 0 oder leer: Alle Zeilen der Quelltabelle
- Wenn Maximum Rows > 0: Bis zu dieser Anzahl (kann weniger sein, wenn die Quelle weniger Zeilen hat)
Reihenfolge der Zeilen: Abhängig von der Sortierung:
- Wenn keine Sortierspalte angegeben: Bleibt die ursprüngliche Reihenfolge der Quellrechner-Ausgabe
- Wenn Sortierspalte angegeben: Zeilen werden nach der Sortierspalte und Sortierrichtung geordnet
Interaktive Funktionen
Klick auf Zeilen: In vielen Fällen können Sie durch Klicken auf eine Zeile in die zugrundeliegenden Fälle oder Details hineinzoomen, ähnlich wie im Quellrechner.
Export-Funktionen: Die verfeinerte Ausgabe kann nach Excel oder CSV exportiert werden, ideal zum Teilen mit Stakeholdern ohne Zugriff auf die mindzie-Plattform.
E-Mail-Integration: Oft wird die Ausgabe dieses Rechners für automatisierten E-Mail-Versand genutzt, um fokussierte Datensätze an Prozessverantwortliche und Führungskräfte geplant zu senden.
Dashboard Widgets: Die vereinfachte, fokussierte Ausgabe eignet sich perfekt zum Einbetten in Dashboard-Widgets mit begrenztem Platz.
Nutzungstipps
- Stellen Sie sicher, dass der Quellrechner erfolgreich ausgeführt wurde, bevor Sie Data Selector nutzen
- Verwenden Sie die Vorschaufunktion in der Rechnerkonfiguration, um verfügbare Spalten aus Ihrer Quelle zu sehen
- Spaltennamen sind case-sensitiv – sie müssen exakt so wie in der Quelle geschrieben sein
- Bei Kombination von Sortierung mit Zeilenlimit wird zuerst sortiert, dann begrenzt (ermöglicht Top-N-Auswahl)
- Wenn der Quellrechner keine Ergebnisse oder einen Fehler zurückgibt, liefert Data Selector eine leere Tabelle
- Sie können mehrere Data Selector Rechner in Folge verwenden, um Daten nach und nach zu verfeinern
Häufige Muster
Dashboard-Muster: Komplexer Rechner -> Data Selector (Schlüsselspalten, Top-N-Zeilen) -> Dashboard-Widget
E-Mail-Muster: Analyse-Rechner -> Data Selector (Fokus auf handlungsrelevante Daten) -> Automatisierter E-Mail-Versand
Export-Muster: Umfassende Analyse -> Data Selector (Vereinfachung für externe Stakeholder) -> Excel-Export
Pipeline-Muster: Rechner A -> Data Selector 1 (Verfeinerung) -> Rechner B (weitere Analyse) -> Data Selector 2 (Endausgabe)
Der Data Selector ist besonders wertvoll, wenn Analyseergebnisse an Stakeholder vermittelt werden müssen, die fokussierte, handlungsrelevante Informationen und keine umfassenden Analysedetails benötigen. Er überbrückt die Lücke zwischen detaillierter Process Mining Analyse und klaren, entscheidungsfertigen Berichten.
Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.