Değer Sıklığı

Genel Bakış

Değer Sıklığı filtresi, öznitelik değerlerinin tüm veri kümesi genelinde ne sıklıkta göründüğüne göre durumları seçer. Bu durum seviyesi filtre, belirtilen bir öznitelikteki değerlerine göre durumları gruplar, her değerin kaç kez ortaya çıktığını sayar ve sıklığın belirttiğiniz eşik değerini karşılayıp karşılamadığına bağlı olarak durumları dahil eder veya hariç tutar. Eşik değerleri, mutlak sayılarla (ör. "en az 5 kez") veya yüzde olarak (ör. "en az %20 oranında") belirleyebilirsiniz.

Bu filtre, yaygın kalıpları belirlemek, nadir aykırı değerleri tespit etmek, yüksek hacimli kategorilere odaklanmak veya analiz sonuçlarını saptırabilecek seyrek uç durumları filtrelemek için özellikle faydalıdır.

Yaygın Kullanımlar

Büyük Kategorilere Odaklanma: Öznitelik değerlerinin istatistiksel olarak anlamlı olacak kadar sık ortaya çıktığı durumları tutarak nadir aykırı değerleri elersiniz.
Aykırı Değer Tespiti: Veri kümesinde nadiren görünen öznitelik değerlerini filtreleyerek sıra dışı veya nadir durumları bulun.
Veri Kalitesi Analizi: Sadece bir kez görünen değerleri belirleyerek veri giriş hataları veya tekrar eden kayıtlar gibi potansiyel sorunları tespit edin.
Yüksek Hacimli Analiz: Sıklıkla görülen bölgeler, ürünler veya müşteri segmentlerini filtreleyerek analizi en yaygın örneklere yoğunlaştırın.
Gürültü Azaltma: Anlamlı içgörü sağlamayan nadir varyantları ve uç durumları kaldırarak karmaşıklığı azaltın.
Kalıp Tanıma: Belirli sıklıklarla ortaya çıkan değerleri (örneğin tam olarak iki kez, sistematik çoğaltmayı işaret eder) bularak sistematik sorunları keşfedin.

Ayarlar

Sütun Adı: Değer sıklığı için analiz edilecek özniteliği seçin. Filtre, tam sayı ve metin özniteliklerini destekler. Gizli sütunlar ve durum ID sütunları kullanılamaz.

Karşılaştırma Yöntemi: Sıklığı eşik değerinize karşı nasıl karşılaştıracağınızı seçin:

Eşit: Değerlerin tam olarak belirtilen sayıda göründüğü durumları tut
Büyük: Değerlerin eşikten daha fazla göründüğü durumları tut
Büyük veya Eşit: Değerlerin en az belirtilen sayıda göründüğü durumları tut
Küçük: Değerlerin eşikten daha az göründüğü durumları tut
Küçük veya Eşit: Değerlerin en fazla belirtilen sayıda göründüğü durumları tut
Eşit Değil: Değerlerin tam olarak belirtilen sayıda görülmediği durumları tut

Eşik Türü: Eşiğin ne tür bir değer olduğunu belirtin:

Sayı: Mutlak görülen olay sayısı
Yüzde: Toplam durumların ondalık yüzdesi (0.0 ile 1.0 arasında)

Eşik Değeri: Sayısal eşik değerini girin. Sayı modunda bu, görülen olay sayısıdır. Yüzde modunda, bir ondalık sayı girin (ör. %40 için 0.4).

Örnekler

Örnek 1: Büyük Bölgeler Üzerine Odaklanma

Durum: Sürecinizde 15 farklı bölgeden gelen durumlar var ancak analiz sadece önemli hacmi temsil eden bölgeler üzerinde odaklanmak istiyorsunuz. Tüm durumların en az %10’unu temsil eden bölgeleri tutmaya karar verdiniz.

Ayarlar:

Sütun Adı: Region
Karşılaştırma Yöntemi: Büyük veya Eşit
Eşik Türü: Yüzde
Eşik Değeri: 0.1

Sonuç: Filtre, veri kümesinin %10 veya daha fazlasında ortaya çıkan bölgelerin durumlarını tutar. Örneğin, 1.000 durum varsa, en az 100 durumu olan bölgeler dahil edilir, küçük bölgeler filtrelenir.

İçgörüler: Bu, analizinizin büyük bölgelere odaklanmasını sağlar ve az faaliyetli küçük bölge ofislerinin yol açtığı gürültüyü kaldırarak kalıp ve eğilimlerin daha kolay tanımlanmasını sağlar.

Örnek 2: Benzersiz Durumları Belirleme

Durum: Bazı durumların benzersiz öznitelik değerlerine sahip olduğunu ve bunun veri kalitesi sorunlarına veya özel işlemlere işaret edebileceğini düşünüyorsunuz. Tüm veri kümesinde yalnızca bir kez görülen değerleri bulmak istiyorsunuz.

Ayarlar:

Sütun Adı: Customer ID
Karşılaştırma Yöntemi: Eşit
Eşik Türü: Sayı
Eşik Değeri: 1.0

Sonuç: Filtre, Customer ID'nin tüm durumlar arasında tam olarak bir kez göründüğü durumları döndürür.

İçgörüler: Bu benzersiz müşteriler şunları temsil edebilir:

Bir kere alışveriş yapıp geri dönmeyen müşteriler
Yazım hataları içeren veri giriş hataları
Kaldırılması gereken test durumları
Özel ilgi gerektiren VIP müşteriler

Örnek 3: Yüksek Sıklıklı Ürünleri Bulma

Durum: En çok satan ve en az 50 kez görünen ürünlerin analiz edilerek başarılı ürün kalıplarını anlamak istiyorsunuz.

Ayarlar:

Sütun Adı: Product Name
Karşılaştırma Yöntemi: Büyük veya Eşit
Eşik Türü: Sayı
Eşik Değeri: 50.0

Sonuç: Filtre, veri kümesinde en az 50 kez sipariş edilen ürünlerin durumlarını tutar.

İçgörüler: Yüksek hacimli ürünlere odaklanarak başarılı ürün süreç kalıplarını, yaygın darboğazları ve iş üzerinde en büyük etkisi olacak optimizasyon fırsatlarını belirleyebilirsiniz.

Örnek 4: Nadir Süreç Varyantlarını Hariç Tutma

Durum: Sürecinizde birçok nadir varyant var ve bu süreç haritasını karmaşık hale getiriyor. Başlangıç aktivitesi nadiren görünen (tüm durumların %5’inden azında) durumları kaldırmak istiyorsunuz.

Ayarlar:

Sütun Adı: _calcStartActivity
Karşılaştırma Yöntemi: Küçük
Eşik Türü: Yüzde
Eşik Değeri: 0.05

Sonuç: Filtre, başlangıç aktivitesinin tüm durumların %5’inden azında göründüğü durumları tutar, yani nadir varyantları seçer.

İçgörüler: Bu, istisnaları, hataları veya standart olmayan iş akışlarını işaret eden olağandışı süreç giriş noktalarını ortaya çıkarır.

Örnek 5: Çift Kayıtları Tespit Etme

Durum: Sistematik kopyalama sorunlarını işaret edebilecek, belirli öznitelik değerlerinin tam olarak iki kez göründüğü durumları bulmak istiyorsunuz.

Ayarlar:

Sütun Adı: Order Number
Karşılaştırma Yöntemi: Eşit
Eşik Türü: Sayı
Eşik Değeri: 2.0

Sonuç: Filtre, Order Number’ın veri kümesinde tam olarak iki kez göründüğü durumları döndürür.

İçgörüler: Bu durum çiftleri şunları gösterebilir:

Çift sipariş oluşturma hataları
Aynı sipariş için bölünmüş gönderimler
Sipariş değişiklikleri veya revizyonlar
Birden fazla sistemden gelen veri bütünleştirme sorunları

Örnek 6: Düşük Frekanslı Aykırı Değerleri Hariç Tutma

Durum: Veri kümenizi, toplam hacmin %2’sinden daha azını temsil eden kategorilerden gelen durumları kaldırarak temizlemek istiyorsunuz çünkü bunlar muhtemel uç durumlar.

Ayarlar:

Sütun Adı: Department
Karşılaştırma Yöntemi: Büyük veya Eşit
Eşik Türü: Yüzde
Eşik Değeri: 0.02

Sonuç: Filtre, tüm durumların en az %2’sini işleyen departmanların durumlarını tutar.

İçgörüler: Bu, tipik süreç davranışını temsil etmeyen küçük veya test departmanlarını filtreleyerek işin çekirdeğine odaklanan daha temiz bir veri kümesi oluşturur.

Çıktı

Filtre, seçilen öznitelik için belirtilen sıklık kriterlerini karşılayan durumları içeren yeni bir veri kümesi döndürür. Aynı öznitelik değerine sahip tüm durumlar bir grup olarak ele alınır - ya tüm grup dahil edilir ya da o değeri paylaşan tüm durumlar hariç tutulur.

Örneğin, "Region A" 100 durumda görünüyorsa ve eşik değeri karşılıyorsa, "Region A" olan tüm 100 durum da dahil edilir. Filtre dahil edilen durumlar için tüm olayları ve öznitelikleri korur.

Teknik Notlar

Filtre Türü: Durum seviyesi filtre (öznitelik değer sıklığına göre tüm durumları kaldırır)
Gruplama Mantığı: Tüm durumlar belirtilen öznitelikteki değerlerine göre gruplandırılır ve her grubun sıklığı eşiğe göre karşılaştırılır
Null (Boş) Değerler: Null değerler ayrı bir grup olarak ele alınır ve diğer değerler gibi sayılır
Desteklenen Veri Tipleri: Tam sayı (Int32, Int64) ve metin (String) öznitelikleri
Eşik Dönüşümü: Yüzde modunda, yüzde değeri toplam durum sayısı ile çarpılarak mutlak sayıya otomatik çevrilir
Doğrulama: Yanlış öznitelik adı girildiğinde benzer sütun adları önerilir

Bu dokümantasyon mindzieStudio süreç madenciliği platformunun bir parçasıdır.