Attribute Kopiëren

Overzicht

De Copy Attribute verrijking maakt een duplicaat van een bestaande attribuut met een nieuwe naam, waarmee je originele data kunt behouden terwijl je transformaties uitvoert, backup-kopieën maakt vóór aanpassingen, of meerdere versies van dezelfde data creëert voor verschillende analytische doeleinden. Deze fundamentele data-manipulatie-operator werkt naadloos met zowel case- als event-attributen, detecteert automatisch het attribuutniveau en creëert de kopie op de juiste plaats in je datasetstructuur.

In process mining is het vermogen om attributen te kopiëren essentieel voor databehoud, attribuutversiebeheer en het creëren van werkbare kopieën voor latere transformaties. De Copy Attribute verrijking voert een volledige replicatie uit van het bronattribuut, inclusief het datatype, weergaveformaat en alle waarden. In combinatie met filters kun je selectief attribuutwaarden kopiëren alleen voor specifieke cases, waarbij het nieuwe attribuut leeg blijft voor cases die niet aan de filtercriteria voldoen. Deze selectieve kopieermogelijkheid maakt de verrijking bijzonder waardevol voor datasegmentatie, conditionele datapreparatie en het creëren van attribuutvarianten voor verschillende analytische scenario’s.

De verrijking verwerkt intelligent alle attribuuttypes - tekst, numeriek, boolean en datetime - en behoudt het exacte datatype en de opmaak van het bronattribuut. Dit typebehoud zorgt ervoor dat downstream berekeningen, filters en visualisaties met de gekopieerde attribuut kunnen werken zoals met het origineel, waarbij de dataintegriteit in je analytische workflows wordt behouden.

Veelvoorkomende Toepassingen

  • Backup-kopieën maken van attributen vóór het toepassen van transformaties of verrijkingen
  • Originele waarden behouden terwijl gewijzigde versies worden gemaakt voor vergelijkende analyses
  • Attributen dupliceren voor verschillende analytische contexten (wekelijks versus maandelijks rapporteren)
  • Werkbare kopieën van attributen creëren voor iteratieve kwaliteitsverbeteringen van data
  • Baseline-versies van attributen vaststellen vóór het toepassen van conditionele updates
  • Attributen selectief kopiëren op basis van filtercriteria voor gesegmenteerde analyses
  • Attribuutvarianten genereren met verschillende weergavenamen voor zakelijke versus technische doelgroepen

Instellingen

Column Name: Selecteer het bronattribuut dat je wilt kopiëren. Dit kan elk bestaand case- of eventattribuut in je dataset zijn. De verrijking detecteert automatisch of het attribuut op case- of eventniveau is en creëert de kopie op hetzelfde niveau. Alle datatypes worden ondersteund, inclusief tekst, numeriek, boolean en datetime attributen. Het weergaveformaat en datatype van het bronattribuut worden behouden in de kopie.

New Attribute Name: Specificeer de naam voor het nieuwe gekopieerde attribuut. Kies een beschrijvende naam die duidelijk het doel van de kopie of de relatie met het origineel aangeeft. Gebruik bijvoorbeeld "Original_Amount" bij het maken van een backup vóór transformaties, of "Baseline_Status" bij het behouden van initiële waarden. De naam moet uniek zijn en mag niet conflicteren met bestaande attributen in je dataset.

Filter (Optioneel): Pas filters toe om te bepalen welke cases de gekopieerde waarden ontvangen. Wanneer filters zijn opgegeven, zullen alleen cases die aan de filtercriteria voldoen waarden krijgen gekopieerd naar het nieuwe attribuut. Cases die niet aan de filter voldoen, krijgen het nieuwe attribuut aangemaakt maar blijft leeg (null). Deze selectieve kopie is handig voor het creëren van attribuutvarianten die slechts op specifieke processegmenten, tijdsperioden of casecategorieën van toepassing zijn. De filter werkt op case-niveau, ook bij het kopiëren van eventattributen.

Voorbeelden

Voorbeeld 1: Baseline Status Creëren voor Vergelijking

Scenario: In een orderverwerkingsproces moet je de initiële orderstatus bij aanmaak bewaren om deze te vergelijken met de huidige status en om statuswijzigingen gedurende de proceslevenscyclus te volgen.

Instellingen:

  • Column Name: Order_Status
  • New Attribute Name: Initial_Order_Status
  • Filter: Geen (kopieer voor alle cases)

Output: Maakt een nieuw case-attribuut "Initial_Order_Status" aan dat een exacte kopie bevat van de Order_Status waarden. Voor cases met:

  • Order_Status: "Pending Approval"

Zal Initial_Order_Status ook zijn: "Pending Approval"

Later in je analyse kun je Initial_Order_Status vergelijken met de huidige Order_Status om te identificeren welke orders van status zijn veranderd, wat analyse van statusprogressiepatronen mogelijk maakt en cases die vastzitten in bepaalde staten identificeert.

Inzichten: Deze baseline-kopie maakt veranderingstracering mogelijk, helpt knelpunten in het proces identificeren waar statussen niet vooruitgaan zoals verwacht, en biedt een referentiepunt om de process evolutie in de tijd te meten.

Voorbeeld 2: Originele Kosten Behouden Voor Valutakoersconversie

Scenario: In een wereldwijd inkoopproces moet je alle kosten omrekenen naar een basisvaluta (USD) voor geconsolideerde rapportage, maar wil je de oorspronkelijke kostenwaarden in hun eigen valuta’s bewaren voor audit- en reconciliatiedoeleinden.

Instellingen:

  • Column Name: Invoice_Amount
  • New Attribute Name: Original_Invoice_Amount
  • Filter: Geen

Output: Maakt een nieuw case-attribuut "Original_Invoice_Amount" aan met een exacte kopie van de Invoice_Amount waarden. Voor cases met:

  • Invoice_Amount: 45000.00 (in diverse valuta’s)
  • Currency: "EUR"

Zal Original_Invoice_Amount zijn: 45000.00

Na het kopiëren kun je valutaomrekeningsverrijkingen toepassen op Invoice_Amount terwijl Original_Invoice_Amount ongewijzigd blijft, waardoor de brondata behouden blijft voor audit trails en afwijkingsanalyses.

Inzichten: Deze behoudsaanpak bewaart data lineage, maakt auditreconciliatie tussen originele en geconverteerde bedragen mogelijk, en biedt transparantie in multi-valuta rapportagescenario’s.

Voorbeeld 3: Regionale Varianten Creëren voor Verschillende Analysecontexten

Scenario: In een verkoopproces dat meerdere regio’s omvat, wil je aparte kopieën maken van het verkoopbedrag attribuut voor verschillende regionale teams, elk met waarden alleen voor hun eigen regio om regio-specifieke analyse te vereenvoudigen.

Instellingen:

  • Column Name: Sales_Amount
  • New Attribute Name: North_America_Sales
  • Filter: Region = "North America"

Output: Maakt een nieuw case-attribuut "North_America_Sales" aan dat verkoopbedragen bevat alleen voor Noord-Amerikaanse cases. Voor een Noord-Amerikaanse case met:

  • Sales_Amount: 125000.00
  • Region: "North America"

Zal North_America_Sales zijn: 125000.00

Voor cases uit andere regio’s:

  • Sales_Amount: 85000.00
  • Region: "Europe"

Zal North_America_Sales leeg zijn (null)

Inzichten: Deze selectieve kopie maakt regio-specifieke dashboards en rapportages mogelijk zonder steeds filters te hoeven toepassen, vereenvoudigt variantieanalyse tussen regio’s, en stelt verschillende teams in staat zich op hun relevante datasegment te richten.

Voorbeeld 4: Werkbare Kopie Vaststellen voor Iteratieve Datakwaliteit

Scenario: In een klantenserviceproces moet je productcategorienamen schoonmaken en standaardiseren, maar wil je de originele ruwe waarden bewaren voor kwaliteitsborging en om de omvang van datacleaning te volgen.

Instellingen:

  • Column Name: Product_Category
  • New Attribute Name: Product_Category_Original
  • Filter: Geen

Output: Maakt een nieuw case-attribuut "Product_Category_Original" met exacte kopieën van alle Product_Category waarden. Voor cases met:

  • Product_Category: "Laptop Computer - 15in"

Zal Product_Category_Original zijn: "Laptop Computer - 15in"

Na het kopiëren kun je tekstvervangingen, groeperingen en standaardiseringsverrijkingen toepassen op Product_Category terwijl Product_Category_Original ongewijzigd blijft, zodat je kunt:

  • Schoongemaakte versus originele waarden vergelijken om kwaliteitsverbeteringen te meten
  • Meest voorkomende ruwe variaties identificeren die standaardisatie vereisten
  • Een audit trail van alle datatransformaties bijhouden

Inzichten: Deze werkbare kopie maakt transparantie in datakwaliteitsprocessen mogelijk, biedt vergelijkingsmogelijkheden voor en na schoonmaak, en bewaart de traceerbaarheid van alle toegepaste transformaties op je data.

Voorbeeld 5: Tijdgebaseerde Snapshots Creëren voor Trendanalyse

Scenario: In een projectmanagementproces wil je het voltooiingspercentage van het project vastleggen op specifieke mijlpalen om te analyseren hoe schattingen in de tijd veranderen en patronen in projectvooruitgang te identificeren.

Instellingen:

  • Column Name: Completion_Percentage
  • New Attribute Name: Completion_At_Midpoint
  • Filter: Milestone = "Project Midpoint Review"

Output: Maakt een nieuw case-attribuut "Completion_At_Midpoint" dat het voltooiingspercentage alleen vastlegt voor cases die de midpoint review hebben bereikt. Voor een case op midpoint met:

  • Completion_Percentage: 45
  • Milestone: "Project Midpoint Review"

Zal Completion_At_Midpoint zijn: 45

Voor cases die nog niet bij midpoint zijn:

  • Completion_Percentage: 25
  • Milestone: "Initial Planning"

Zal Completion_At_Midpoint leeg zijn (null)

Later, terwijl Completion_Percentage blijft veranderen, kun je de midpoint snapshot vergelijken met de uiteindelijke voltooiing om de nauwkeurigheid van schattingen te analyseren en projecten te identificeren die significant afweken van midpointvoorspellingen.

Inzichten: Deze temporele snapshots maken trendanalyse over projectlevenscycli mogelijk, helpen systematische schattingsbias in verschillende projectfasen te herkennen, en bieden baseline metrics om toekomstige projectplanning te verbeteren.

Output

De Copy Attribute verrijking creëert een nieuw attribuut op hetzelfde niveau (case of event) als het bronattribuut. Het nieuwe attribuut is een exacte kopie van het bronattribuut en behoudt:

  • Datatype: Het gekopieerde attribuut behoudt hetzelfde datatype als het origineel (tekst, integer, decimaal, boolean of datetime)
  • Weergaveformaat: Elke opmaak van het bronattribuut (valutasymbolen, decimalen, datumformaten) wordt behouden in de kopie
  • Waarden: Alle niet-null waarden van het bronattribuut worden exact gekopieerd naar het nieuwe attribuut

Het nieuwe attribuut verschijnt in je dataset naast het originele attribuut en kan in alle mindzieStudio functies worden gebruikt, waaronder filters, calculaties, visualisaties en latere verrijkingen. Wanneer geen filter wordt toegepast, heeft het nieuwe attribuut waarden voor alle cases of events (overeenkomend met de volledigheid van het bronattribuut). Bij toepassing van een filter, worden alleen cases of events die aan de filtercriteria voldoen ingevuld; niet-overeenkomende cases hebben het attribuut wel, maar met null-waarde.

Het gekopieerde attribuut wordt gemarkeerd als een afgeleid attribuut in de datasetmetadata, wat aangeeft dat het via verrijking is gemaakt en niet onderdeel is van de brondata. De afhankelijkheden van het attribuut verwijzen naar het originele bronattribuut, waarmee data lineage wordt vastgelegd voor auditing en inzicht in datatransformaties.

Voor eventattributen wordt de kopieerbewerking op eventniveau uitgevoerd, wat betekent dat elk individueel event een kopie van zijn attribuutwaarde krijgt. Voor caseattributen vindt de kopie op case-niveau plaats, waarbij de enkele case-niveau waarde wordt gedupliceerd naar het nieuwe attribuut.


Deze documentatie is onderdeel van het mindzie Studio process mining platform.