Follows Graphs

Not: Bu, test ve veri kalitesi analizi için tasarlanmış yalnızca yöneticiye özel bir hesaplayıcıdır. Çoğu kullanıcı görsel süreç analizi için Process Map hesaplayıcısını kullanmalıdır.

Genel Bakış

Follows Graphs hesaplayıcısı, süreçte aktivitelerin birbirleriyle nasıl ilişkili olduğunu gösteren ayrıntılı veriler üretir. İki tür ilişkiyi hesaplar: bir aktivitenin hemen ardından gelen doğrudan takip ilişkileri ve bir aktivitenin diğerinden herhangi bir noktada önce gerçekleştiği nihai takip ilişkileri.

Etkileşimli görselleştirmeler sunan Process Map hesaplayıcısının aksine, Follows Graphs tam grafik hesaplamaları yapar ve ayrıntılı analiz, test, performans kıyaslaması ve veri kalitesi doğrulaması için uygun yapılandırılmış veri tabloları çıktılar. Bu hesaplayıcı, ham grafik verilerine erişme gereksinimi olan yöneticiler ve süreç madenciliği analistleri tarafından teknik analiz veya dış araçlara aktarma için kullanılır.

Yaygın Kullanımlar

  • Grafik hesaplama algoritmalarının doğruluğunu ve performansını test etmek ve doğrulamak
  • Farklı veri seti boyutları ve karmaşıklıkları arasında performans kıyaslaması yapmak
  • Aynı zaman damgasına sahip olaylarda veri kalitesi sorunlarını tanımlamak
  • R, Python veya Gephi gibi araçlarda dış analiz için ayrıntılı grafik verilerini dışa aktarmak
  • Belirli aktivite çiftleri için süre dağılımlarını ayrıntılı şekilde analiz etmek
  • Süreç madenciliği algoritmalarını geliştirme ve regresyon testleri sırasında doğrulamak

Ayarlar

Bu hesaplayıcının yapılandırılabilir ayarı yoktur. Her çalıştırıldığında tüm vakaları ve olayları işleyerek eksiksiz grafik verisi üretir.

Örnekler

Örnek 1: Aynı Zaman Damgasına Sahip Olaylarda Veri Kalitesi Sorunlarını Tanımlama

Senaryo: Olay kaydınızda birden fazla aktivitenin aynı zaman damgasına sahip olduğu ve doğru sıranın belirlenmesinin imkansız olduğu zaman damgası hassasiyet sorunlarından şüpheleniyorsunuz. Hangi aktivite çiftlerinin etkilendiğini ve bu durumun ne sıklıkta ortaya çıktığını belirlemek istiyorsunuz.

Ayarlar:

Ayar gerekmez.

Çıktı:

Hesaplayıcı beş veri tablosu oluşturur. Tablolar 2 ve 3, olayların aynı zaman damgasına sahip olduğu belirsiz çiftleri gösterir:

DirectlyFollows-Indeterminate tablosu:

  • Create Invoice ve Send Invoice: 127 kez
  • Receive Payment ve Record Payment: 89 kez
  • Approve Request ve Notify Approver: 45 kez

EventuallyFollows-Indeterminate tablosunda aynı çiftler ve sıfır süreli ek nihai takip ilişkileri gösterilir.

İstatistikler tablosu gösterir:

  • Hesaplama Süresi: 2.347 milisaniye
  • Tabloların Doldurulması Süresi: 156 milisaniye
  • Toplam Hesaplamalar: 1.247.893

Analiz: Yüksek sayıda belirsiz çift, olay kaydınızda önemli zaman damgası hassasiyet sorunları olduğunu gösterir. En yaygın sorun, Create Invoice ve Send Invoice aktivitelerinin tam olarak aynı anda gerçekleştiği 127 vakadır. Bu, bu olayların yalnızca tarih hassasiyetinde kaydedildiğini veya kaynak sistem tarafından eş zamanlı olarak zaman damgalandığını gösterir. Bu aktivitelerin gerçekten aynı anda gerçekleşip gerçekleşmediğini veya veri çıkarma sürecinizin zaman bilgisi kaybedip kaybetmediğini araştırmalısınız. Bu veri kalitesi sorunu süreç analiz doğruluğunu etkileyebilir ve kaynak verinin zaman damgası hassasiyetinin iyileştirilmesiyle çözülmelidir.

Örnek 2: Veri Seti Boyutlarına Göre Performans Kıyaslaması

Senaryo: Süreç madenciliği altyapınızı optimize ediyorsunuz ve grafik hesaplama performansının veri seti büyüklüğüne göre nasıl değiştiğini anlamak istiyorsunuz. Kaynak tahsisi planlamak için farklı veri hacimlerinde hesaplama sürelerini ölçmek istiyorsunuz.

Ayarlar:

Ayar gerekmez.

Çıktı:

Artan veri setlerinde hesaplayıcıyı çalıştırıp İstatistikler tablosuna bakmak:

10.000 vaka veri seti:

  • Hesaplama Süresi: 847 milisaniye
  • Toplam Hesaplamalar: 186.234

50.000 vaka veri seti:

  • Hesaplama Süresi: 4.521 milisaniye
  • Toplam Hesaplamalar: 931.170

100.000 vaka veri seti:

  • Hesaplama Süresi: 9.234 milisaniye
  • Toplam Hesaplamalar: 1.862.340

DirectlyFollows tablosunda 156 eşsiz aktivite çifti bulunurken EventuallyFollows tablosunda 2.847 çift vardır, bu da nihai takip ilişkilerinin kapsamlı doğasını gösterir.

Analiz: Hesaplama süresi, vaka sayısı arttıkça yaklaşık lineer olarak artar; bu veri setinde vakaların ortalama olay sayısı tutarlıdır. Ancak toplam hesaplama sayısı, algoritmanın kuadratik karmaşıklığı nedeniyle nihai takip grafik hesaplamasının doğrudan takipten çok daha maliyetli olduğunu gösterir. 100.000 vakayı aşan veri setlerinde, bu hesaplayıcıyı çalıştırmadan önce en alakalı vakalara filtre uygulamayı veya daha fazla hesaplama kaynağı ayırmayı düşünmelisiniz. Tabloların doldurulma süresi ise tüm veri seti boyutlarında tutarlı şekilde düşük kalarak tablo dönüşümünün darboğaz olmadığını gösterir.

Örnek 3: Dış Araştırma Analizi İçin Süreç Verisini Dışa Aktarma

Senaryo: Bir üniversite araştırma ekibi ile süreç optimizasyon algoritmalarını incelemek üzere iş birliği yapıyorsunuz. Yeni analiz yaklaşımlarını test etmek için standart bir formatta ham süreç grafik verisine ihtiyaçları var. Süreç ilişkilerinizi eksiksiz süre istatistikleri ile dışa aktarmak istiyorsunuz.

Ayarlar:

Ayar gerekmez.

Çıktı:

Hesaplayıcı, 243 eşsiz aktivite çiftinden oluşan DirectlyFollows tablosu üretir:

DirectlyFollows tablosundan örnek satırlar:

  • Submit Claim -> Validate Documents: Sayı=1.847, Ortalama=2.3 gün, Medyan=1.8 gün, StdSapma=3.2 gün
  • Validate Documents -> Approve Claim: Sayı=1.245, Ortalama=4.7 gün, Medyan=3.1 gün, StdSapma=6.8 gün
  • Validate Documents -> Request Additional Info: Sayı=602, Ortalama=1.2 gün, Medyan=0.9 gün, StdSapma=2.1 gün

EventuallyFollows tablosu 4.892 çift içererek ardışık olmayan tüm olası aktivite ilişkilerini gösterir.

Analiz: DirectlyFollows tablosu CSV formatında dışa aktarılabilir ve araştırma ekibine sunulabilir. Tablo, süreç madenciliğinde gerekli tüm bilgileri içerir: aktivite isimleri, ilişki sıklıkları ve ortalama, medyan, standart sapma, minimum ve maksimum sürelere kadar kapsamlı süre istatistikleri. EventuallyFollows tablosu süreçlerde uzun mesafeli bağımlılıkları inceleyen araştırmacılar için çok daha kapsamlı bir aktif ilişki görünümü sağlar. Yapılandırılmış çıktı formatı, R veya Python gibi istatistiksel modelleme araçlarına kolayca aktarımı mümkün kılar.

Örnek 4: Süreç Madenciliği Algoritması Değişikliklerinin Doğrulanması

Senaryo: Geliştirme ekibiniz grafik hesaplama algoritmasını performansı artırmak için değiştirdi. Değişikliklerin öncekilerle tamamen aynı sonuçları verdiğini, herhangi bir regresyon olmadığını doğrulamanız gerekiyor.

Ayarlar:

Ayar gerekmez.

Çıktı:

Her iki algoritmanın 5 vaka ve 11 olaydan oluşan bilinen test veri setinde çalıştırılması:

DirectlyFollows tablosu (her iki sürüm):

  • 8 eşsiz aktivite çifti
  • Her çift için eşit sayımlar
  • Her ikisi için eşit süre istatistikleri

EventuallyFollows tablosu (her iki sürüm):

  • 28 eşsiz aktivite çifti
  • Tüm sayımlar tam eşleşmekte
  • Tüm süre istatistikleri kayan nokta hassasiyeti kapsamında eşleşmekte

İstatistikler tablosu karşılaştırması:

  • Eski algoritma: 89 milisaniye
  • Yeni algoritma: 42 milisaniye
  • Her ikisi toplam: 138 hesaplama

Analiz: Doğrulama, algoritma optimizasyonunun hesaplama süresini %53 oranında düşürdüğünü ve çıktı değerlerinde hiçbir değişiklik olmadığını doğruladı. Tüm aktivite çiftleri, sayımlar ve süre istatistikleri iki sürüm arasında tamamen örtüşmekte ve algoritmanın aynı olay çiftlerini işlediği tutarlı hesaplama sayısı ile kanıtlanmakta. Performans iyileştirmeleri yapılırken doğruluğun korunmasını sağlamak için bu tür doğrulamalar şarttır. Artık optimize edilmiş algoritmayı güvenle üretime alabilirsiniz.

Örnek 5: Belirli Aktivite Çiftleri İçin Süre Değişkenliğinin Analizi

Senaryo: Operasyon ekibiniz belge doğrulama ile onay aktiviteleri arasındaki işlem sürelerinin tutarsız olduğunu raporladı. Bu spesifik aktivite çifti için ayrıntılı süre istatistikleri ile değişkenliği anlamak ve farklı desenlerin olup olmadığını tespit etmek istiyorsunuz.

Ayarlar:

Ayar gerekmez.

Çıktı:

DirectlyFollows tablosunda "Validate Documents -> Approve" çifti inceleniyor:

Aktivite1: Validate Documents Aktivite2: Approve Sayı: 3.247 kez Ortalama Süre: 5.8 gün Medyan Süre: 2.3 gün Standart Sapma: 12.4 gün Minimum Süre: 0.2 gün Maksimum Süre: 87.3 gün

Ortalama ile medyan arasındaki büyük fark, sağa çarpık bir dağılım ve uç değerlerin varlığını gösterir. Yüksek standart sapma önemli değişkenliği işaret eder.

Analiz: Medyan süre 2.3 gün iken ortalama 5.8 gün olması, çoğu vakanın nispeten hızlı işlendiğini, ancak bir alt kümenin çok daha uzun sürdüğünü ve ortalamayı yükselttiğini gösterir. Maksimum 87.3 günlük süre aşırı uç değerlerin varlığını bildirir ve araştırılmalıdır. Minimum 0.2 gün ise bazı vakaların hızlı ilerlediğini gösterir. Bu değişkenlik deseni, hızlı, normal ve yavaş işlemleri ayırt etmek için vaka segmentasyonu yapmanız gerektiğini gösterir. Ham olay çifti verisine inerek aşırı süreye sahip vakaları belirleyip özelliklerini inceleyebilirsiniz.

Çıktı

Follows Graphs hesaplayıcısı, kapsamlı süreç grafik bilgisi içeren beş yapılandırılmış veri tablosu üretir:

Tablo 0: DirectlyFollows

Bir aktivitenin hemen ardından araya başka aktivite girmeden gelen doğrudan takip ilişkilerini gösterir.

Sütunlar: Key (aktivite çifti tanımlayıcısı), Activity1 (birinci aktivite), Activity2 (ikinci aktivite), Count (frekans), MeanDuration, MedianDuration, StdevDuration, MinDuration, MaxDuration

Bu tablo genellikle EventuallyFollows tablosundan daha az ilişki içerir çünkü sadece ardışık çiftler yer alır.

Tablo 1: EventuallyFollows

Bir aktivitenin diğerinden vakadaki herhangi bir noktada önce geldiği tüm nihai takip ilişkilerini gösterir.

Sütunlar: DirectlyFollows tablosu ile aynı yapı

Bu tablo çok daha büyüktür çünkü araya diğer aktiviteler gelse bile tüm olası çiftleri kapsar. 10 olaylı bir vakada 45 çift yakalanırken sadece 9 doğrudan takip çifti olur.

Tablo 2: DirectlyFollows-Indeterminate

Aynı zaman damgasına sahip olaylarda sıralamanın belirsiz olduğu doğrudan takip çiftlerini belirler.

Sütunlar: Key (yönsüz çift tanımlayıcısı), Activity1, Activity2, Count

Doğru ve hassas zaman damgasına sahip iyi yapılandırılmış verilerde belirsiz çift sayısı çok az olmalıdır. Yüksek sayılar veri kalitesi sorununa işaret eder.

Tablo 3: EventuallyFollows-Indeterminate

Aynı zaman damgasına sahip nihai takip çiftlerini belirtir.

Sütunlar: DirectlyFollows-Indeterminate tablosu ile aynı yapı

Genellikle DirectlyFollows-Indeterminate tablosundaki çiftlerle aynıdır çünkü zaman damgası sorunları her iki ilişki türünü etkiler.

Tablo 4: Stats

Hesaplama performans metriklerini içerir.

Sütunlar: CalculationTime (grafiklerin hesaplanma süresi, milisaniye), FillTablesTime (tabloların dönüştürülme süresi, milisaniye), Calculations (toplam olay çifti karşılaştırması)

Bu tablo performansı takip etmek ve veri setlerinin işlenebilir büyüklük sınırlarını anlamak için kullanılır.

Veri Dışa Aktarım Seçenekleri:

Tüm tablolar CSV veya Excel formatlarında dışa aktarılabilir ve dış araçlarda ileri analizlere hazır hale gelir. Yapılandırılmış format istatistiksel yazılımlar, grafik görselleştirme araçları veya özel analiz betiklerine kolayca aktarım sağlar.


Bu dokümantasyon mindzieStudio süreç madenciliği platformunun bir parçasıdır.