Değer Tahmini

Genel Bakış

Değer Tahmini zenginleştirmesi, süreç verilerinizdeki geçmiş desenlere dayanarak sayısal öznitelik değerlerini tahmin etmek için gelişmiş regresyon tekniklerini kullanır. Bu güçlü istatistiksel operatör, sonuçları bilinen tamamlanmış vakaları analiz ederek, devam eden veya yeni vakalar için değerleri tahmin edebilen öngörü modelleri oluşturur. Girdi öznitelikleri ile bağımlı değişkenler arasındaki ilişkileri inceleyerek desenleri tanımlar ve bunları gelecekteki değerler hakkında veri odaklı tahminlerde bulunmak için uygular.

Bu zenginleştirme, süreç madenciliği senaryolarında tahmin ve planlama için özellikle değerlidir. Organizasyonların süreç sonuçlarını tamamlanmadan önce tahmin etmelerini, erken göstergelere dayanarak finansal etkileri hesaplamalarını ve olası gelecekteki değerlere göre öngörülü kararlar almalarını sağlar. Yapılandırılabilir toplama fonksiyonları ve geçmiş vaka analizini kullanarak yalnızca tahminler değil, aynı zamanda güven skorları da sunar; bu sayede kullanıcılar her tahminin güvenilirliğini anlayabilir. Operatör, minimum değer kısıtlamaları ve yedek hesaplamalar gibi karmaşık senaryoları işleyebilir ve geçmiş veriler sınırlı olsa bile sağlam tahminler sağlar.

Yaygın Kullanımlar

  • Sipariş özellikleri ve müşteri konumuna göre teslimat sürelerini tahmin etmek
  • Başlangıç satın alma siparişi detaylarından nihai fatura tutarlarını tahmin etmek
  • Girdi malzemeleri ve süreç parametrelerine dayanarak üretim çıktısını tahmin etmek
  • Erken etkileşim göstergelerinden müşteri memnuniyeti puanlarını tahmin etmek
  • İlk kilometre taşlarına göre proje tamamlanma tarihlerini tahmin etmek
  • Süreç özniteliklerine göre kaynak tüketimini tahmin etmek
  • Üretim hattı parametrelerinden kalite skorlarını tahmin etmek

Ayarlar

Yeni Öznitelik Adı: Tahmin edilen değeri saklayacak yeni öznitelik için isim belirtin. Bu öznitelik, her vaka için sayısal tahmini içerecektir. "Predicted_Delivery_Days" veya "Estimated_Final_Cost" gibi tahmin edilen değeri açıkça belirten açıklayıcı bir isim seçin.

Algoritma Adı (Opsiyonel): Tahmin algoritması için özel bir isim sağlayın. Bu isim, tahmin ve güven skoru ile birlikte saklanan yardımcı bir öznitelikte tutulacak ve her tahmin için hangi yöntemin kullanıldığını takip etmeye yardımcı olacaktır. Farklı tahmin yapılandırmaları test edilirken veya birden çok tahmin zenginleştirmesi uygulanırken faydalıdır.

Girdi Öznitelik İsimleri: Tahmin için vakaları gruplamak üzere kullanılacak bir veya daha fazla metin öznitelik seçin. Bu özniteliklerdeki eşleşen değerlere sahip vakalar benzer kabul edilip birlikte tahmin için kullanılacaktır. Örneğin, "Customer_Region" ve "Product_Category" seçilirse, tahminler aynı bölge ve ürün kategorisindeki geçmiş vakalara dayanacaktır. Öznitelik seçilmezse, bağımlı değişkeni içeren tüm vakalar tahminlerde kullanılacaktır.

Bağımlı Öznitelik Adı: Tahmin etmek istediğiniz sayısal özniteliği seçin. Bu, bazı tamamlanmış vakalarda var olan ancak devam eden vakalarda eksik olabilecek tam sayısal (tamsayı veya ondalık) bir alan olmalıdır. Zenginleştirme, bu özniteliğin geçmiş değerlerini analiz ederek henüz mevcut olmayan vakalar için tahminler yapacaktır.

Minimum Değer Öznitelik Adı (Opsiyonel): Tahminler için minimum eşik sağlayan sayısal bir öznitelik seçin. Belirtildiğinde, tahminler hiçbir zaman bu değerin altına düşmez. Bu, "tahmini teslimat süresi mevcut geçen süreden az olamaz" veya "tahmini maliyet malzeme maliyetinin altında olamaz" gibi iş kuralları için kullanışlıdır. Bu öznitelik bağımlı öznitelikten farklı olmalıdır.

Filtre (Opsiyonel): Tahmin modeli oluşturmak için hangi geçmiş vakaların kullanılacağını sınırlamak üzere filtre uygulayın. Bu sayede aykırı veriler hariç tutulabilir, sadece son veriler seçilebilir veya yalnızca yüksek kaliteli vakalar kullanılabilir. Örneğin, sadece son 6 ay içindeki vakalar veya veri kalitesi sorunları olan vakalar hariç tutulabilir.

Toplama Fonksiyonu: Geçmiş değerleri bir tahmine dönüştürmek için kullanılacak istatistiksel fonksiyonu seçin:

  • Ortalama: Geçmiş değerlerin ortalamasını kullanır (varsayılan, tüm gözlemleri dengeler)
  • Medyan: Ortadaki değeri kullanır (aykırılara karşı dayanıklı)
  • Maksimum: En yüksek geçmiş değeri kullanır (üst sınırlar için temkinli)
  • Minimum: En düşük geçmiş değeri kullanır (alt sınırlar için temkinli)

Minimum Vaka Sayısı: Tahmin yapmak için gereken minimum geçmiş vaka sayısını ayarlayın. Varsayılan 2'dir. Daha az eşleşen vaka varsa, minimum değer kısıtlaması tarafından sağlanan yedek bir tahmin olmadıkça tahmin yapılmaz. Daha yüksek değerler tahmin güvenilirliğini artırır ancak daha az tahmine yol açabilir.

Maksimum Vaka Sayısı: Tahmin için kullanılacak maksimum son vaka sayısını ayarlayın. Varsayılan 10'dur. Zenginleştirme, bu limite kadar en son vakaları kullanarak tahminleri mevcut desenlere uygun hale getirir. Daha düşük değerler tahminlerin son değişikliklere daha duyarlı olmasını sağlar.

Minimum Değer Sabiti: Minimum değer kısıtlamaları kullanıldığında, bu sabit minimum değere eklenerek yedek bir tahmin oluşturulur. Varsayılan 0'dır. Örneğin, minimum değer 100 ve sabit 10 ise yedek tahmin 110 olur. Bu, tarihsel veri yetersiz olduğunda bile tahminlerin iş gereksinimlerini karşılamasını sağlar.

Minimum Değer Katsayısı: Minimum değer kısıtlamaları kullanıldığında, bu katsayı yedek hesaplamada minimum değere çarpılır. Varsayılan 1.0'dır. Örneğin minimum değer 100 ve katsayı 1.2 ise yedek tahmin 120 olur. Bu, minimum eşik bazında orantısal ayarlamalara izin verir.

Örnekler

Örnek 1: E-ticarette Teslimat Sürelerinin Tahmini

Senaryo: Bir online perakendeci, müşteri konumu ve gönderim yöntemi dikkate alınarak geçmiş teslimat desenlerine dayanarak yeni siparişlerin teslimat sürelerini tahmin etmek ve müşteri beklentilerini doğru belirlemek istiyor.

Ayarlar:

  • Yeni Öznitelik Adı: Predicted_Delivery_Days
  • Algoritma Adı: Regional_Shipping_Model
  • Girdi Öznitelik İsimleri: Customer_Region, Shipping_Method
  • Bağımlı Öznitelik Adı: Actual_Delivery_Days
  • Minimum Değer Öznitelik Adı: Current_Days_In_Transit
  • Filtre: Order_Date > 30 gün önce
  • Toplama Fonksiyonu: Average
  • Minimum Vaka Sayısı: 5
  • Maksimum Vaka Sayısı: 20
  • Minimum Değer Sabiti: 1
  • Minimum Değer Katsayısı: 1.1

Çıktı: Üç yeni vaka özniteliği oluşturur:

  • Predicted_Delivery_Days: Teslimat için tahmini gün sayısı (ör. 5.3 gün)
  • Predicted_Delivery_Days - Confidence: 0 ile 1 arasında güven skoru (ör. 0.75)
  • Predicted_Delivery_Days - Algorithm: Kullanılan algoritma ("Regional_Shipping_Model" veya yedek için "Fixed")

Örneğin, Express_Shipping ile Region_West'ten yeni bir sipariş için, zenginleştirme benzer 15 geçmiş siparişi ortalama 3.2 günle bulur ve 0.75 güvenle 3.2 gün tahmini yapar.

Bilgiler: Tahmin, gerçekçi teslimat beklentileri belirlemeye, gecikmesi muhtemel siparişleri tanımlamaya ve tahmini ile vaat edilen teslimat sürelerine göre gönderim yöntemi seçiminde optimizasyona yardımcı olur.

Örnek 2: Satın Alma Faturası Tutarlarının Tahmini

Senaryo: Satın alma departmanı, bütçe planlamasını iyileştirmek ve potansiyel maliyet aşımlarını erken tespit etmek için başlangıç satın alma talebi detaylarına dayanarak nihai fatura tutarlarını tahmin etmek istiyor.

Ayarlar:

  • Yeni Öznitelik Adı: Predicted_Invoice_Amount
  • Girdi Öznitelik İsimleri: Vendor_Name, Material_Category
  • Bağımlı Öznitelik Adı: Final_Invoice_Amount
  • Minimum Değer Öznitelik Adı: Initial_PO_Amount
  • Toplama Fonksiyonu: Median
  • Minimum Vaka Sayısı: 3
  • Maksimum Vaka Sayısı: 15
  • Minimum Değer Sabiti: 0
  • Minimum Değer Katsayısı: 1.05

Çıktı: Tahmini nihai fatura tutarını gösteren öznitelikler oluşturur. Örneğin Vendor_A'dan 10.000$’lık yeni bir satın alma siparişi için:

  • Predicted_Invoice_Amount: 10.750$ (PO tutarının %7.5 üzerinde geçmiş medyan bazında)
  • Confidence: 0.6 (9 geçmiş vaka kullanılarak)
  • Algorithm: Medyan tabanlı tahmin

Bilgiler: Proaktif bütçe yönetimi sağlar, sürekli aşım yapan tedarikçilerin erken tespiti ve finansal planlamada doğruluğu artırır.

Örnek 3: Üretim Kalite Skorlarının Tahmini

Senaryo: Bir üretim tesisi, erken süreç parametrelerine göre hâlihazırda üretimde olan ürünler için kalite skorlarını tahmin ederek olası kalite sorunlarına erken müdahale sağlamak istiyor.

Ayarlar:

  • Yeni Öznitelik Adı: Predicted_Quality_Score
  • Girdi Öznitelik İsimleri: Production_Line, Product_Type, Shift
  • Bağımlı Öznitelik Adı: Final_Quality_Score
  • Filtre: Production_Date > 60 gün önce VE Quality_Score NULL değil
  • Toplama Fonksiyonu: Average
  • Minimum Vaka Sayısı: 10
  • Maksimum Vaka Sayısı: 30

Çıktı: Gündüz vardiyasında Line_A üzerinde üretim yapan Product_Type_X için:

  • Predicted_Quality_Score: 92.5 (0-100 ölçeği)
  • Confidence: 0.87 (benzer 26 geçmiş vaka bazında)
  • Algorithm: Standart tahmin

Bilgiler: Kalite ekiplerinin düşük tahminli ürünlere odaklanmasını sağlar, süreç parametrelerini proaktif olarak ayarlamaya ve kaliteyle ilgili yeniden işleme maliyetlerini azaltmaya yardımcı olur.

Örnek 4: Sağlıkta Hasta Kalış Süresinin Tahmini

Senaryo: Bir hastane, yatak yönetimi ve kaynak tahsisini optimize etmek için kabul tanısı ve ilk değerlendirme verilerine göre hasta kalış süresini tahmin etmek istiyor.

Ayarlar:

  • Yeni Öznitelik Adı: Predicted_LOS_Days
  • Girdi Öznitelik İsimleri: Admission_Diagnosis, Patient_Age_Group, Admission_Type
  • Bağımlı Öznitelik Adı: Actual_LOS_Days
  • Minimum Değer Öznitelik Adı: Current_LOS_Days
  • Toplama Fonksiyonu: Median
  • Minimum Vaka Sayısı: 8
  • Maksimum Vaka Sayısı: 25
  • Minimum Değer Sabiti: 1
  • Minimum Değer Katsayısı: 1.0

Çıktı: Acil kabulü ile zatürreli yeni yaşlı bir hasta, şu anda 2. gününde:

  • Predicted_LOS_Days: 7 gün (benzer vakaların medyanı)
  • Confidence: 0.72
  • Algorithm: Minimum vaka yoksa yedek olarak "Fixed" (güncel LOS + 1 gün)

Bilgiler: Daha iyi yatak kapasite planlaması sağlar, uzun kalması muhtemel hastaların erken belirlenmesine ve taburculuk planlama süreçlerinin iyileştirilmesine yardımcı olur.

Örnek 5: İnşaatta Proje Maliyetlerinin Tahmini

Senaryo: Bir inşaat şirketi, ilk proje özelliklerine dayanarak nihai proje maliyetlerini tahmin etmek ve teklif doğruluğunu artırmak, maliyet aşımı riski olan projeleri erken tespit etmek istiyor.

Ayarlar:

  • Yeni Öznitelik Adı: Predicted_Total_Cost
  • Girdi Öznitelik İsimleri: Project_Type, Client_Industry, Project_Region
  • Bağımlı Öznitelik Adı: Final_Project_Cost
  • Minimum Değer Öznitelik Adı: Current_Spent_Amount
  • Filtre: Project_Start_Date > 365 gün önce
  • Toplama Fonksiyonu: Average
  • Minimum Vaka Sayısı: 4
  • Maksimum Vaka Sayısı: 12
  • Minimum Değer Sabiti: 50000
  • Minimum Değer Katsayısı: 1.15

Çıktı: Region_North bölgesinde perakende müşterisi için yeni bir ticari bina projesi, halihazırda 2M$ harcanmış:

  • Predicted_Total_Cost: 3.500.000$ (benzer 8 geçmiş proje bazında)
  • Confidence: 0.67
  • Algorithm: Kullanılan hesaplama yöntemini gösterir

Geçmiş veri yetersizse yedek hesaplama: 2.000.000 × 1.15 + 50.000 = 2.350.000$

Bilgiler: Doğru maliyet tahmini ile proje karlılığını artırır, bütçe aşımı riski olan projelerde erken müdahaleye olanak tanır ve daha rekabetçi, gerçekçi teklifler hazırlamayı destekler.

Çıktı

Değer Tahmini zenginleştirmesi, kapsamlı tahmin bilgisi sağlamak için birlikte çalışan üç ilişkili vaka özniteliği oluşturur:

Birincil Tahmin Özniteliği: "Yeni Öznitelik Adı" ayarınıza göre adlandırılır, tahmin edilen sayısal değeri içerir. Veri tipi her zaman Double (ondalıklı sayı) olup hassas tahminleri destekler. Değerler, geçmiş desenlere veya geçerli ise minimum değer kısıtlamalarına dayanarak hesaplanır.

Güven Skoru Özniteliği: Otomatik olarak "[Yeni Öznitelik Adı] - Confidence" formatında oluşturulur ve tahmin güvenilirliğini gösteren 0 ile 1 arasında bir güven skoru içerir. Daha yüksek değerler, tahmin için daha fazla geçmiş vaka kullanıldığını gösterir. Güven skoru şu şekilde hesaplanır: (kullanılan vaka sayısı) / (maksimum vaka sayısı + 1).

Algoritma Takip Özniteliği: Otomatik olarak "[Yeni Öznitelik Adı] - Algorithm" formatında oluşturulur ve her tahmin için hangi yöntemin kullanıldığını içeren metin tipi bir özniteliktir. Standart tahminler için özel algoritma adınızı veya minimum değer dayalı yedek hesaplamalar için "Fixed" değerini içerir.

Bu öznitelikler, mindzieStudio'nun diğer özellikleriyle sorunsuz entegre olur — yüksek güven skorlu tahminleri filtrelerde belirlemek, hesaplayıcılarda tahmin edilen ile gerçek değerleri karşılaştırmak veya görselleştirmelerde tahmin doğruluğu desenlerini analiz etmek için kullanabilirsiniz.

Ayrıca Bakınız


Bu dokümantasyon mindzie Studio süreç madenciliği platformunun bir parçasıdır.