Değer Sıklığı
Genel Bakış
Değer Sıklığı filtresi, öznitelik değerlerinin tüm veri kümesi genelinde ne sıklıkta göründüğüne göre durumları seçer. Bu durum seviyesi filtre, belirtilen bir öznitelikteki değerlerine göre durumları gruplar, her değerin kaç kez ortaya çıktığını sayar ve sıklığın belirttiğiniz eşik değerini karşılayıp karşılamadığına bağlı olarak durumları dahil eder veya hariç tutar. Eşik değerleri, mutlak sayılarla (ör. "en az 5 kez") veya yüzde olarak (ör. "en az %20 oranında") belirleyebilirsiniz.
Bu filtre, yaygın kalıpları belirlemek, nadir aykırı değerleri tespit etmek, yüksek hacimli kategorilere odaklanmak veya analiz sonuçlarını saptırabilecek seyrek uç durumları filtrelemek için özellikle faydalıdır.
Yaygın Kullanımlar
- Büyük Kategorilere Odaklanma: Öznitelik değerlerinin istatistiksel olarak anlamlı olacak kadar sık ortaya çıktığı durumları tutarak nadir aykırı değerleri elersiniz.
- Aykırı Değer Tespiti: Veri kümesinde nadiren görünen öznitelik değerlerini filtreleyerek sıra dışı veya nadir durumları bulun.
- Veri Kalitesi Analizi: Sadece bir kez görünen değerleri belirleyerek veri giriş hataları veya tekrar eden kayıtlar gibi potansiyel sorunları tespit edin.
- Yüksek Hacimli Analiz: Sıklıkla görülen bölgeler, ürünler veya müşteri segmentlerini filtreleyerek analizi en yaygın örneklere yoğunlaştırın.
- Gürültü Azaltma: Anlamlı içgörü sağlamayan nadir varyantları ve uç durumları kaldırarak karmaşıklığı azaltın.
- Kalıp Tanıma: Belirli sıklıklarla ortaya çıkan değerleri (örneğin tam olarak iki kez, sistematik çoğaltmayı işaret eder) bularak sistematik sorunları keşfedin.
Ayarlar
Sütun Adı: Değer sıklığı için analiz edilecek özniteliği seçin. Filtre, tam sayı ve metin özniteliklerini destekler. Gizli sütunlar ve durum ID sütunları kullanılamaz.
Karşılaştırma Yöntemi: Sıklığı eşik değerinize karşı nasıl karşılaştıracağınızı seçin:
- Eşit: Değerlerin tam olarak belirtilen sayıda göründüğü durumları tut
- Büyük: Değerlerin eşikten daha fazla göründüğü durumları tut
- Büyük veya Eşit: Değerlerin en az belirtilen sayıda göründüğü durumları tut
- Küçük: Değerlerin eşikten daha az göründüğü durumları tut
- Küçük veya Eşit: Değerlerin en fazla belirtilen sayıda göründüğü durumları tut
- Eşit Değil: Değerlerin tam olarak belirtilen sayıda görülmediği durumları tut
Eşik Türü: Eşiğin ne tür bir değer olduğunu belirtin:
- Sayı: Mutlak görülen olay sayısı
- Yüzde: Toplam durumların ondalık yüzdesi (0.0 ile 1.0 arasında)
Eşik Değeri: Sayısal eşik değerini girin. Sayı modunda bu, görülen olay sayısıdır. Yüzde modunda, bir ondalık sayı girin (ör. %40 için 0.4).
Örnekler
Örnek 1: Büyük Bölgeler Üzerine Odaklanma
Durum: Sürecinizde 15 farklı bölgeden gelen durumlar var ancak analiz sadece önemli hacmi temsil eden bölgeler üzerinde odaklanmak istiyorsunuz. Tüm durumların en az %10’unu temsil eden bölgeleri tutmaya karar verdiniz.
Ayarlar:
- Sütun Adı: Region
- Karşılaştırma Yöntemi: Büyük veya Eşit
- Eşik Türü: Yüzde
- Eşik Değeri: 0.1
Sonuç: Filtre, veri kümesinin %10 veya daha fazlasında ortaya çıkan bölgelerin durumlarını tutar. Örneğin, 1.000 durum varsa, en az 100 durumu olan bölgeler dahil edilir, küçük bölgeler filtrelenir.
İçgörüler: Bu, analizinizin büyük bölgelere odaklanmasını sağlar ve az faaliyetli küçük bölge ofislerinin yol açtığı gürültüyü kaldırarak kalıp ve eğilimlerin daha kolay tanımlanmasını sağlar.
Örnek 2: Benzersiz Durumları Belirleme
Durum: Bazı durumların benzersiz öznitelik değerlerine sahip olduğunu ve bunun veri kalitesi sorunlarına veya özel işlemlere işaret edebileceğini düşünüyorsunuz. Tüm veri kümesinde yalnızca bir kez görülen değerleri bulmak istiyorsunuz.
Ayarlar:
- Sütun Adı: Customer ID
- Karşılaştırma Yöntemi: Eşit
- Eşik Türü: Sayı
- Eşik Değeri: 1.0
Sonuç: Filtre, Customer ID'nin tüm durumlar arasında tam olarak bir kez göründüğü durumları döndürür.
İçgörüler: Bu benzersiz müşteriler şunları temsil edebilir:
- Bir kere alışveriş yapıp geri dönmeyen müşteriler
- Yazım hataları içeren veri giriş hataları
- Kaldırılması gereken test durumları
- Özel ilgi gerektiren VIP müşteriler
Örnek 3: Yüksek Sıklıklı Ürünleri Bulma
Durum: En çok satan ve en az 50 kez görünen ürünlerin analiz edilerek başarılı ürün kalıplarını anlamak istiyorsunuz.
Ayarlar:
- Sütun Adı: Product Name
- Karşılaştırma Yöntemi: Büyük veya Eşit
- Eşik Türü: Sayı
- Eşik Değeri: 50.0
Sonuç: Filtre, veri kümesinde en az 50 kez sipariş edilen ürünlerin durumlarını tutar.
İçgörüler: Yüksek hacimli ürünlere odaklanarak başarılı ürün süreç kalıplarını, yaygın darboğazları ve iş üzerinde en büyük etkisi olacak optimizasyon fırsatlarını belirleyebilirsiniz.
Örnek 4: Nadir Süreç Varyantlarını Hariç Tutma
Durum: Sürecinizde birçok nadir varyant var ve bu süreç haritasını karmaşık hale getiriyor. Başlangıç aktivitesi nadiren görünen (tüm durumların %5’inden azında) durumları kaldırmak istiyorsunuz.
Ayarlar:
- Sütun Adı: calcStartActivity
- Karşılaştırma Yöntemi: Küçük
- Eşik Türü: Yüzde
- Eşik Değeri: 0.05
Sonuç: Filtre, başlangıç aktivitesinin tüm durumların %5’inden azında göründüğü durumları tutar, yani nadir varyantları seçer.
İçgörüler: Bu, istisnaları, hataları veya standart olmayan iş akışlarını işaret eden olağandışı süreç giriş noktalarını ortaya çıkarır.
Örnek 5: Çift Kayıtları Tespit Etme
Durum: Sistematik kopyalama sorunlarını işaret edebilecek, belirli öznitelik değerlerinin tam olarak iki kez göründüğü durumları bulmak istiyorsunuz.
Ayarlar:
- Sütun Adı: Order Number
- Karşılaştırma Yöntemi: Eşit
- Eşik Türü: Sayı
- Eşik Değeri: 2.0
Sonuç: Filtre, Order Number’ın veri kümesinde tam olarak iki kez göründüğü durumları döndürür.
İçgörüler: Bu durum çiftleri şunları gösterebilir:
- Çift sipariş oluşturma hataları
- Aynı sipariş için bölünmüş gönderimler
- Sipariş değişiklikleri veya revizyonlar
- Birden fazla sistemden gelen veri bütünleştirme sorunları
Örnek 6: Düşük Frekanslı Aykırı Değerleri Hariç Tutma
Durum: Veri kümenizi, toplam hacmin %2’sinden daha azını temsil eden kategorilerden gelen durumları kaldırarak temizlemek istiyorsunuz çünkü bunlar muhtemel uç durumlar.
Ayarlar:
- Sütun Adı: Department
- Karşılaştırma Yöntemi: Büyük veya Eşit
- Eşik Türü: Yüzde
- Eşik Değeri: 0.02
Sonuç: Filtre, tüm durumların en az %2’sini işleyen departmanların durumlarını tutar.
İçgörüler: Bu, tipik süreç davranışını temsil etmeyen küçük veya test departmanlarını filtreleyerek işin çekirdeğine odaklanan daha temiz bir veri kümesi oluşturur.
Çıktı
Filtre, seçilen öznitelik için belirtilen sıklık kriterlerini karşılayan durumları içeren yeni bir veri kümesi döndürür. Aynı öznitelik değerine sahip tüm durumlar bir grup olarak ele alınır - ya tüm grup dahil edilir ya da o değeri paylaşan tüm durumlar hariç tutulur.
Örneğin, "Region A" 100 durumda görünüyorsa ve eşik değeri karşılıyorsa, "Region A" olan tüm 100 durum da dahil edilir. Filtre dahil edilen durumlar için tüm olayları ve öznitelikleri korur.
Teknik Notlar
- Filtre Türü: Durum seviyesi filtre (öznitelik değer sıklığına göre tüm durumları kaldırır)
- Gruplama Mantığı: Tüm durumlar belirtilen öznitelikteki değerlerine göre gruplandırılır ve her grubun sıklığı eşiğe göre karşılaştırılır
- Null (Boş) Değerler: Null değerler ayrı bir grup olarak ele alınır ve diğer değerler gibi sayılır
- Desteklenen Veri Tipleri: Tam sayı (Int32, Int64) ve metin (String) öznitelikleri
- Eşik Dönüşümü: Yüzde modunda, yüzde değeri toplam durum sayısı ile çarpılarak mutlak sayıya otomatik çevrilir
- Doğrulama: Yanlış öznitelik adı girildiğinde benzer sütun adları önerilir
Bu dokümantasyon mindzieStudio süreç madenciliği platformunun bir parçasıdır.