AI Causal Analysis (Alpha)

Der Rechner AI Causal Analysis nutzt Machine Learning, um zu entdecken, welche Fallattribute ein Zielergebnis am stärksten beeinflussen. Anstatt nur Korrelation anzuzeigen, isoliert er die Merkmale mit dem größten statistischen Einfluss darauf, ob ein Fall dem von Ihnen definierten Ergebnis entspricht – so können Sie von "Was geschieht" zu "Warum es geschieht" übergehen.

Alpha-Funktion: Dieser Rechner ist Teil des mindzie Alpha-Programms. Es erfordert, dass PreRelease für Ihren Mandanten aktiviert ist. Weitere Informationen finden Sie unter Alpha Features.

AI Causal Analysis Rechner-Editor

Übersicht

AI Causal Analysis beantwortet Fragen wie:

Warum dauern manche Fälle länger als 7 Tage bis zum Abschluss?
Welche Attribute machen es wahrscheinlicher, dass eine Rechnung verspätet bezahlt wird?
Was unterscheidet Fälle, die einen SLA verletzen, von denen, die ihn einhalten?
Welche Einrichtungen, Teams oder Produktkategorien beeinflussen ein bestimmtes Ergebnis am stärksten?

Sie definieren das Ergebnis (die Fälle, die Sie erklären möchten), zeigen dem Rechner eine Auswahl von Eingabespalten, und er liefert eine Rangliste der Faktoren, die am stärksten dafür verantwortlich sind, dass diese Fälle in die Ergebnisgruppe fallen.

Vergleich mit Root Cause Analysis

AI Causal Analysis verfolgt dasselbe Ziel wie der bestehende Rechner Root Cause Analysis, verfolgt jedoch einen deutlich strengeren Ansatz:

Fähigkeit	Root Cause Analysis	AI Causal Analysis
Findet Einzel-Attribut-Treiber	Ja	Ja
Findet Mehr-Attribut-Konjunktionen (bis zu 3 Attribute pro Regel)	Nein	Ja
Unterscheidet Korrelation von Kausalität	Nein	Ja (Kausalgraph + Propensity-Anpassung)
Liefert Konfidenzintervalle	Nein	Ja (95 % Wilson CI für jede Regel)
Kontrolliert Mehrfachtests	Nein	Ja (Benjamini-Hochberg FDR)
Verarbeitet numerische / Datums- / Zeitattribute	Nein (nur Strings)	Ja (ergebnisbewusstes Binning)
Verständliche Erzählung je Treiber	Nein	Ja

Verwenden Sie Root Cause Analysis für einen schnellen Einzel-Attribut-Scan und AI Causal Analysis für jede ernsthafte Untersuchung – insbesondere wenn jemand auf Basis der Ergebnisse handeln wird.

So fügen Sie den Rechner hinzu

Öffnen Sie ein Notebook in mindzieStudio
Klicken Sie auf Add Calculator und wählen Sie AI Causal Analysis (Alpha)
Konfigurieren Sie das Ergebnis und die Eingabespalten (siehe unten)
Klicken Sie auf Create

Konfiguration

Titel

Der Anzeigename des Rechners. Standard ist AI Causal Analysis (Alpha) – ändern Sie ihn in etwas, das zur konkreten Frage passt, die Sie beantworten, zum Beispiel Warum sind ICU-Aufenthalte lang? oder Treiber verspäteter Zahlungen.

Beschreibung

Optionale Freitext-Notizen. Nützlich, um die Geschäftsfrage, den analysierten Zeitraum oder den anfragenden Stakeholder zu dokumentieren.

Ergebnis-Definition

Das Ergebnis ist die Gruppe von Fällen, die Sie erklären möchten. Der Rechner vergleicht diese Fälle mit dem Rest des Datensatzes und identifiziert, welche Eingabespalten die beiden Gruppen am besten voneinander trennen.

Es stehen drei Modi zur Definition des Ergebnisses zur Verfügung:

Filter-Modus

Wählen Sie den Tab Filter und fügen Sie einen oder mehrere Filterausdrücke hinzu. Der Rechner betrachtet Fälle, die zum Filter passen, als "Ergebnis"-Gruppe.

Cases matching: angezeigt als Prozentsatz und absolute Anzahl, z. B. 11,2 % der Fälle / 2.795 von 25.000
Add Filter: öffnet den Standard-Filter-Builder – kombinieren Sie beliebig viele Bedingungen
Preview: wird beim Aufbau des Filters live aktualisiert, sodass Sie die Auswahl vor dem Ausführen des Rechners validieren können

Der Filter-Modus ist die flexibelste Option. Jede Bedingung, die Sie als mindzie-Filter ausdrücken können (Dauerschwellen, Attributübereinstimmungen, Aktivitätspräsenz usw.), kann zu einem Ergebnis werden. Im obigen Screenshot definiert der Filter select cases where actual_los_days is greater than 7 "Long Cases" als Ergebnis.

Top N %-Modus

Wählen Sie den Tab Top N%, um die höchsten (oder niedrigsten) Werte eines numerischen Attributs als Ergebnis zu verwenden. Das ist nützlich, wenn Sie "die schlechtesten Fälle" oder "die Top-Performer" erklären möchten, ohne einen festen Schwellenwert wählen zu müssen. Beispiel: die obersten 10 % der Fälle nach Durchlaufzeit.

Schwellen-Modus

Wählen Sie den Tab Threshold, um das Ergebnis mit einer einzigen numerischen Grenze für ein Attribut zu definieren. Jeder Fall oberhalb (oder unterhalb) des Wertes wird Teil der Ergebnisgruppe. Beispiel: Fälle, bei denen invoice_amount 50.000 übersteigt.

Ergebnis-Name

Eine kurze Bezeichnung, die die Ergebnisgruppe in den Resultaten identifiziert, zum Beispiel Long Cases, Late Payments oder SLA Breach. Dieser Name erscheint in der gesamten Analyseausgabe überall dort, wo auf die Ergebnisgruppe verwiesen wird.

Eingabespalten

Die Spalten, die das Modell bei der Suche nach Treibern des Ergebnisses nutzen darf.

Spaltenliste: Jedes Fallattribut im Datensatz wird angezeigt. Wählen Sie ein oder mehrere aus, um sie in die Analyse einzubeziehen. Ausgewählte Spalten werden hervorgehoben.
Auto-select-Umschalter: Bei aktivierter Option wählt mindzie automatisch eine sinnvolle Standardmenge von Eingabespalten basierend auf dem Datensatzschema aus. Schalten Sie dies aus, wenn Sie volle manuelle Kontrolle möchten – zum Beispiel, um eine Spalte auszuschließen, die trivial mit dem Ergebnis korreliert (etwa eine ID, die die Antwort verrät).

Tipps zur Auswahl der Eingabespalten:

Schließen Sie Spalten aus, die nachgelagert zum Ergebnis sind. Wenn discharge_date zur Berechnung von actual_los_days verwendet wird, wird sie die Ergebnisse dominieren, ohne Einsichten hinzuzufügen.
Schließen Sie Bezeichner mit hoher Kardinalität (person_id, order_id) aus, es sei denn, Sie möchten gezielt Effekte pro Entität untersuchen.
Nehmen Sie kontextuelle Attribute (Einrichtung, Produktkategorie, Priorität, Region) auf – dort liegen typischerweise die interessanten Treiber.

Show Advanced Settings

Öffnet zusätzliche Feinabstimmungsoptionen für die Suche. Die Standardwerte funktionieren für die meisten Analysen gut – überschreiben Sie sie nur, wenn Sie einen konkreten Grund haben.

Einstellung	Standard	Zweck
Beam width	50	Wie viele Kandidatenregeln bei jeder Suchtiefe behalten werden. Höher = erschöpfender, langsamer.
Max rule depth	3	Längste erlaubte Regel. `3` bedeutet Regeln der Form `A AND B AND C`.
Min cases per rule	30	Regeln, die weniger Fälle betreffen, werden als zu klein zum Handeln verworfen.
Min lift	1.2	Die Ergebnisquote innerhalb der Regel muss den Basiswert um mindestens diesen Faktor übersteigen (1,2 = mindestens 20 % höher als die Baseline).
FDR alpha	0.05	Benjamini-Hochberg-Signifikanzschwelle zur Kontrolle falscher Entdeckungen in der Regelsuche.
Max drivers returned	20	Obergrenze für die Anzahl der in der Tabellenansicht angezeigten Regeln.
Redundancy Jaccard	0.9	Regeln, deren Fallmengen sich um mehr als diesen Anteil überlappen, werden als Duplikate behandelt und gefiltert.
Sampling threshold	2.000.000 Fälle	Datensätze oberhalb dieser Größe werden mit Floyds Kombinationsalgorithmus deterministisch heruntergesampelt. Die Ausgabe meldet `WasSampled = true` und die tatsächliche Stichprobengröße.

Switch to Advanced View

Wechselt den Editor in den erweiterten Modus für feinkörnige Kontrolle über jeden Modellparameter. Die hier gezeigte geführte Ansicht reicht für die große Mehrheit der Anwendungsfälle aus.

Typischer Arbeitsablauf

Frage formulieren – entscheiden Sie, welches Ergebnis Sie erklären möchten. "Was macht Fälle langsam?" wird zu einem Filter-Ergebnis case_duration > 7 days.
Ergebnis definieren – nutzen Sie den Filter-, Top-N-%- oder Schwellen-Modus. Prüfen Sie, ob der Preview-Prozentsatz sinnvoll aussieht (zu wenige Fälle erzeugen instabile Ergebnisse; zu viele bedeuten, dass das Ergebnis nicht wirklich unterscheidend ist).
Ergebnis benennen – wählen Sie eine knappe Bezeichnung, die in Ergebnissen und Berichten gut lesbar ist.
Eingabespalten auswählen – starten Sie mit Auto-select und entfernen Sie anschließend alle Spalten, die die Antwort verraten oder nur Rauschen hinzufügen.
Create – führen Sie den Rechner aus. Das Ergebnis zeigt die nach Rang sortierten Treiber des Ergebnisses.
Interpretieren – prüfen Sie die obersten Treiber, verfeinern Sie Ergebnis oder Eingabemenge bei Bedarf und führen Sie den Rechner erneut aus.

Beispiel

Ein Krankenhaus-Betriebsteam möchte verstehen, warum manche stationäre Aufenthalte länger als 7 Tage dauern.

Einstellung	Wert
Titel	AI Causal Analysis (Alpha)
Filter-Modus	`select cases where actual_los_days is greater than 7`
Preview	2.795 von 25.000 Fällen entsprechen (11,2 %)
Ergebnis-Name	Long Cases
Eingabespalten	facility, subunit, bed, order_id, ... (automatisch ausgewählt)

Nach der Ausführung meldet der Rechner, welche Kombinationen von Einrichtung, Sub-Unit und Pflegeattributen Fälle mit langem Aufenthalt am stärksten von Fällen mit normalem Aufenthalt unterscheiden. Das verweist das Team auf konkrete Einheiten und Arbeitsabläufe, die untersucht werden sollten, anstatt alle Attribute manuell durchsuchen zu müssen.

Interpretation der Ergebnisse

Für jeden Top-Treiber erzeugt der Rechner einen verständlichen Erzählabsatz und ein Evidenz-Badge, das die Stärke des Befundes beschreibt:

Badge	Bedeutung	Handlungsempfehlung
Causal	Sowohl das Kausalgraph-Signal als auch der um Confounder bereinigte Effekt sind positiv.	Stärkster handlungsfähiger Beleg – sicher für Interventionen zu priorisieren.
Likely Causal	Der Kausalgraph verbindet die Regel mit dem Ergebnis, aber der Effekt schwächt sich nach Bereinigung um Confounder ab.	Vielversprechend – vor dem Handeln weiter untersuchen.
Associated	Der Effekt übersteht die Anpassung, aber der Graph ordnet die Regel nicht auf einem direkten Pfad zum Ergebnis an.	Reale Assoziation, aber wahrscheinlich indirekt – kann ein Stellvertreter für den eigentlichen Treiber sein.
Correlational	Es gibt eine Assoziation, aber wir können keinen kausalen Zusammenhang bestätigen.	Nur diagnostisches Signal – nicht allein danach handeln.

Beispiel-Erzählung für eine Causal-Regel:

Channel = Online ist ein wahrscheinlicher Treiber für Non-First Contact Resolution. Fälle, die dieser Regel entsprechen, zeigen eine Ergebnisquote von 46,1 % gegenüber der Baseline von 29,0 % (1,59x, 95 % CI 1,51x – 1,68x, p < 0,001). Sie umfasst 2.518 Fälle und macht 34,7 % aller Vorkommen von Non-First Contact Resolution aus. Der Effekt hielt der Anpassung um andere Top-Treiber stand und liegt im gelernten Kausalgraphen auf einem direkten Pfad zum Ergebnis.

Die Ansicht Full Table ergänzt die vollständige Rangliste mit Abdeckung, Lift, Konfidenzintervall, bereinigtem Effekt, p-Wert und Badge für jede Regel, die die Suche und den Signifikanzfilter überstanden hat.

So funktioniert der Algorithmus

AI Causal Analysis führt eine fünfstufige Pipeline aus. Jede Stufe hat eine spezifische Aufgabe und ist so konzipiert, dass das Gesamtergebnis auch bei Datensätzen mit Millionen von Fällen in Sekunden vorliegt.

1. Vorbereitung und Binning

Der Rechner kennzeichnet die Fälle in Ihrer Ergebnisgruppe mit 1; alle anderen werden mit 0 beschriftet. Das ist die Baseline-Rate, die Sie in der Ausgabe sehen.
Kategoriale Attribute (Strings, Booleans, Ganzzahlen mit niedriger Kardinalität) werden direkt verwendet. Jeder eindeutige Wert wird zu einem Kandidaten-Literal (z. B. facility = Memorial).
Numerische und Datums-/Zeit-Attribute werden mit einem MDL-optimalen, ergebnisbewussten Binner in Bins eingeteilt. Statt gleich breiter oder gleich häufiger Bins wählt der Binner Schnittpunkte, die Ergebnis- und Nicht-Ergebnisfälle am besten trennen, und nutzt anschließend das Prinzip der Minimum Description Length (MDL), um die Anzahl der Bins automatisch zu bestimmen. Dadurch wird eine numerische Spalte wie actual_los_days in eine kleine Menge sinnvoller Buckets überführt (z. B. <= 3 Tage, 4 – 7 Tage, > 7 Tage).

2. Bitmap-Indexierung

Jedes Literal wird als bitset gespeichert – ein Bit pro Fall, 1, wenn der Fall dem Literal entspricht. Die Kombination von Literalen mit AND wird zu einer schnellen bitweisen Schnittmenge:

facility = Memorial AND priority = High wird als bitset_A & bitset_B berechnet.
Abdeckung, Ergebniszählung und Lift für eine Kandidatenregel können unabhängig von der Regeltiefe in Mikrosekunden ausgewertet werden.

Literale, die weniger als Min cases per rule abdecken, werden vor Beginn der Suche verworfen.

3. Beam-Search-Subgroup-Discovery

Der Rechner durchläuft den Raum der Regeln in Breitensuche:

Tiefe 1: Bewerten Sie jedes einzelne Literal. Bewerten Sie es mit einem Qualitätsmaß (Lift und Weighted Relative Accuracy) und behalten Sie die besten Beam width (Standard 50).
Tiefe 2: Erweitern Sie jede behaltene Regel mit jedem anderen kompatiblen Literal, um Konjunktionen wie A AND B zu bilden. Bewerten Sie alle und behalten Sie erneut die besten Beam width.
Tiefe 3: Einmal mehr wiederholen. Stopp bei Max rule depth.

Regeln, die unter Min lift oder Min cases per rule fallen, werden auf jeder Ebene beschnitten.

Nach der Suche entfernt ein Jaccard-Redundanzfilter nahezu identische Regeln: Wenn zwei Regeln im Wesentlichen dieselben Fälle abdecken (Überlappung über Redundancy Jaccard, Standard 0,9), wird nur die bessere behalten.

4. Statistische Signifikanz

Für jede überlebende Regel berechnet der Rechner:

Das Risikoverhältnis (Ergebnisquote innerhalb der Regel geteilt durch Baseline-Rate) und dessen 95 % Wilson-Konfidenzintervall, das sich bei kleinen und extremen Wahrscheinlichkeiten gut verhält, bei denen die Normalapproximation versagt.
Einen p-Wert unter der Nullhypothese, dass die Regel keinen Effekt hat.
Eine Benjamini-Hochberg FDR-Korrektur über alle getesteten Regeln. FDR alpha (Standard 0,05) legt die erwartete False-Discovery-Rate fest. Regeln, die die FDR nicht überstehen, werden nicht gemeldet – genau das verhindert, dass die Suche Sie in unechten Befunden ertränkt.

5. Kausale Beurteilung

Signifikanz allein sagt Ihnen nur, dass eine Assoziation besteht. Zwei zusätzliche Signale entscheiden, ob eine Regel ein Causal-Badge erhält:

Kausalgraph-Signal – ein leichtgewichtiger bayes'scher Strukturscore, der aus den Attributen und dem Ergebnis gelernt wird. Er fragt: Liegt diese Regel im gelernten Graphen auf einem direkten Pfad zum Ergebnis oder nur auf einem indirekten Pfad über einen Confounder?
Propensity-Score-Anpassung – eine ridge-regularisierte logistische Regression modelliert die Wahrscheinlichkeit, dass jeder Fall der Regel entspricht, gegeben alle anderen Top-Treiber. Der Effekt der Regel wird anschließend nach Gewichtung mit dieser Propensity neu geschätzt. Schrumpft der Effekt auf null, war die Regel nur ein Stellvertreter für andere Treiber; bleibt er bestehen, hat sie eigenständige Erklärungskraft.

Der Beurteiler kombiniert beide Signale zu den vier oben definierten Evidenz-Badges.

6. Erzählungsgenerierung

Der letzte Schritt komponiert den verständlichen Absatz, der in der Kartenansicht erscheint. Er verwebt die Regeldefinition, die Ergebnisquoten innerhalb der Regel und der Baseline, das Risikoverhältnis und das Konfidenzintervall, den p-Wert, die Abdeckung und das Evidenz-Badge zu einer Satzstruktur, die sich für einen nicht-statistischen Leser natürlich liest.

Performance

Gemessen auf einer Entwicklungsmaschine:

Datensatz	Zeit
100.000 Fälle x 4 Spalten	unter 1 Sekunde
200.000 Fälle x 20 Spalten	unter 2 Sekunden
1.000.000 Fälle x 50 Spalten	etwa 3 Sekunden

Datensätze oberhalb der Sampling-Schwelle (Standard 2.000.000 Fälle) werden mit Floyds Kombinationsalgorithmus deterministisch gesampelt. Wenn dies geschieht, markiert die Ausgabe WasSampled = true und meldet die tatsächliche Stichprobengröße, sodass das Ergebnis reproduzierbar und das Sampling sichtbar ist.

Bekannte Einschränkungen (v1)

Nur binäre Ergebnisse. Mehrklassige Ergebnisse (z. B. schnell / mittel / langsam) werden in dieser Version nicht unterstützt. Definieren Sie Zwei-Wege-Aufteilungen als separate Analysen.
Noch keine Erklärungen pro Fall. v1 beantwortet "Was treibt dieses Ergebnis über den gesamten Datensatz hinweg?" Eine zukünftige Version wird Panels mit "Warum ging dieser spezifische Fall schief?" ergänzen.
Keine Analyse zeitlicher Drifts. Wenn sich Treiber zwischen Quartalen ändern, wird v1 sie nicht über die Zeit aufspalten. Führen Sie den Rechner in diesem Fall für jede Zeitscheibe separat aus.
Numerisches Binning ist ergebnisbewusst. Wenn Sie feste, manuell gewählte Bins möchten, bucketisieren Sie die Spalte vor dem Ausführen des Rechners mit einer Anreicherung vor.

Anwendungsfälle

Performance-Treiber

Identifizieren Sie die Attribute, die am stärksten mit Fällen verbunden sind, die einen SLA verletzen, das Budget überschreiten oder ihre erwartete Dauer überschreiten. Funktioniert gut mit einem Filter-Ergebnis auf Basis einer Dauer- oder KPI-Anreicherung.

Ergebnisanalyse

Vergleichen Sie erfolgreiche Fälle mit fehlgeschlagenen oder abgebrochenen. Verwenden Sie ein Filter-Ergebnis auf einem Status- oder Ergebnisattribut, um zu sehen, welche vorgelagerten Attribute welches Ergebnis vorhersagen.

Risiko und Compliance

Richten Sie den Rechner auf Fälle aus, die von einer Konformitäts- oder Kontrollanreicherung markiert wurden, um zu erfahren, welche Kontextfaktoren mit Compliance-Fehlern korrelieren.

Top-Performer-Analyse

Nutzen Sie den Top-N-%-Modus, um zu erklären, was Ihre besten Fälle, Teams oder Kunden vom Rest unterscheidet. Fließen Sie die Erkenntnisse in die Prozessgestaltung oder Schulung zurück.

Tipps

Einfach beginnen. Ein gut gewählter Filter mit zwei oder drei Bedingungen plus automatisch ausgewählten Eingaben erzeugt meist die klarsten Ergebnisse.
Beobachten Sie den Preview-Prozentsatz. Wenn die Ergebnisgruppe weniger als ~2 % oder mehr als ~50 % des Datensatzes umfasst, wird die Analyse schwerer zu interpretieren. Passen Sie den Filter an, bis die Gruppe eine sinnvolle Minderheit ist.
Iterieren Sie über Eingabespalten. Entfernen Sie Spalten, deren Präsenz die Ergebnisse ohne Einsicht dominiert (IDs, Zeitstempel, die das Ergebnis verraten), und führen Sie den Rechner erneut aus.
Benennen Sie Ergebnisse konkret. Long Cases schlägt Outcome 1, wenn Sie Ergebnisse mit Stakeholdern teilen oder in Berichte einfließen lassen.
Kombinieren Sie mit dem Entscheidungsbaum-Rechner für eine zweite Sicht auf dieselbe Frage. Der Entscheidungsbaum zeigt die Verzweigungsstruktur; AI Causal Analysis bewertet den Gesamteinfluss der Merkmale.

Feedback geben

AI Causal Analysis ist eine Alpha-Funktion und Ihr Input beeinflusst direkt, wie sie sich entwickelt:

E-Mail: support@mindzie.com
Betreff: Einschließen Alpha Feedback: AI Causal Analysis
Inhalt: die verwendete Ergebnis-Definition, die Eingabespalten, was Sie erwartet haben und was Sie bekommen haben