Metin Başlangıcı
Genel Bakış
Text Start zenginleştirme, bir metin öznitelik değerinin başından belirtilen sayıda karakter çıkararak, çıkarılan önek içeren yeni bir öznitelik oluşturur. Bu güçlü zenginleştirme, ürün kodları, departman tanımlayıcıları, konum önekleri veya öznitelik değerlerinin başında görünen diğer anlamlı metin desenleri gibi metin verilerinin öncü kısımlarını sistematik olarak çıkarmanızı ve analiz etmenizi sağlar.
Süreç madenciliğinde, Text Start metin öneklerine dayalı veri standartlaştırma ve kategorize etme için çok değerlidir. Örneğin, fatura numaralarının ilk üç karakterini çıkararak bölgesel ofisleri tanımlayabilir, çalışan kimliklerinden departman kodlarını çekebilir veya SKU'lardan ürün hattı tanımlayıcılarını çıkarabilirsiniz. Bu çıkarılan öneklerle yeni öznitelikler oluşturarak daha ayrıntılı analiz yapabilir, anlamlı gruplamalar oluşturabilir ve uzun metin dizilerinde gizli kalmış desenleri ortaya çıkarabilirsiniz. Bu zenginleştirme, hem vaka seviyesi hem de olay seviyesi özniteliklerle çalışarak süreç verilerinizi yapılandırma ve analiz etme konusunda esneklik sağlar.
Yaygın Kullanımlar
- Çalışan kimliklerinden departman kodlarını çıkarma (örneğin, "FIN-12345" → "FIN")
- Fatura numaralarından veya sipariş kodlarından bölgesel tanımlayıcıları belirleme
- Envanter analizi için SKU kodlarından ürün kategori öneklerini çekme
- Coğrafi analiz için telefon numaralarından alan kodlarını çıkarma
- Belge adlandırma kurallarına göre belge tiplerini belge kimliklerinden tanımlama
- Referans numaralarında standartlaştırılmış öneklere dayalı gruplamalar oluşturma
- Tarih bazlı metin kodlarından yıl veya ay tanımlayıcılarını çıkarma
Ayarlar
Yeni Öznitelik Adı: Çıkarılan metin öneğini saklamak için oluşturulacak yeni öznitelik adı. Bu, özniteliğin içereceği bilgiyi açıkça belirten açıklayıcı bir ad olmalıdır. Örneğin, çalışan kimliklerinden departman kodları çıkarılıyorsa, "DepartmentCode" veya "EmployeeDept" olarak adlandırılabilir. Yeni öznitelik, kaynak öznitelikle aynı seviyede (vaka veya olay) oluşturulacaktır.
Sütun Adı: Başındaki karakterleri çıkarmak istediğiniz kaynak metin özniteliği. Bu açılır liste, veri kümenizde gizli olmayan tüm kullanılabilir metin özniteliklerini listeler. Zenginleştirme, bu sütundaki her bir değeri işleyerek baştan belirtilen sayıda karakter çıkarır. Eğer değer belirtilen uzunluktan kısaysa, tüm değer kullanılır.
Uzunluk: Metin değerinin başından çıkarılacak karakter sayısı. Bu, pozitif bir tam sayı (1 veya daha fazla) olmalıdır. Örneğin, 3 olarak ayarlanırsa ilk üç karakter çıkarılır, 5 olarak ayarlanırsa ilk beş karakter çıkarılır. Kaynak metin belirtilen uzunluktan kısaysa, zenginleştirme mevcut tüm metni boşluk doldurma veya hata olmadan kullanır.
Örnekler
Örnek 1: Çalışan Kimliklerinden Departman Kodu Çıkarma
Senaryo: Bir sağlık kuruluşu, çalışan kimliklerinin departman kodlarıyla başladığı ID'ler kullanıyor (örneğin, hemşirelik için "NUR-45678", yönetim için "ADM-12345", laboratuvar için "LAB-98765"). Süreç performansını departmana göre analiz etmek istiyorlar.
Ayarlar:
- Yeni Öznitelik Adı: DepartmentCode
- Sütun Adı: EmployeeID
- Uzunluk: 3
Çıktı: Zenginleştirme, yeni bir vaka özniteliği "DepartmentCode" oluşturur ve değerleri şunlardır:
- Çalışan "NUR-45678" → DepartmentCode: "NUR"
- Çalışan "ADM-12345" → DepartmentCode: "ADM"
- Çalışan "LAB-98765" → DepartmentCode: "LAB"
- Çalışan "IT-5432" → DepartmentCode: "IT-" (ilk 3 karakter olarak tire dahil)
İçgörüler: Çıkarılan departman kodlarıyla kuruluş, süreçleri departmana göre filtreleyebilir, departmanlar arasındaki döngü sürelerini karşılaştırabilir ve departman bazlı darboğaz veya uyumluluk sorunlarını tespit edebilir.
Örnek 2: Fatura Numaralarından Bölgesel Ofis Tanımlama
Senaryo: Çok uluslu bir şirket, fatura numaralarının ilk iki karakterinin bölgesel ofisi temsil ettiği bir yapı kullanıyor (örneğin, Amerika Birleşik Devletleri için "US-INV-2024-0001", Avrupa için "EU-INV-2024-0002", Asya Pasifik için "AP-INV-2024-0003").
Ayarlar:
- Yeni Öznitelik Adı: RegionalOffice
- Sütun Adı: InvoiceNumber
- Uzunluk: 2
Çıktı: Zenginleştirme, yeni bir vaka özniteliği "RegionalOffice" oluşturur ve değerleri şunlardır:
- Fatura "US-INV-2024-0001" → RegionalOffice: "US"
- Fatura "EU-INV-2024-0002" → RegionalOffice: "EU"
- Fatura "AP-INV-2024-0003" → RegionalOffice: "AP"
- Fatura "UK-INV-2024-0004" → RegionalOffice: "UK"
İçgörüler: Şirket, fatura işleme sürelerini bölgeye göre analiz edebilir, onay iş akışlarında bölgesel farklılıkları belirleyebilir ve farklı ofisler arası performansı karşılaştırarak en iyi uygulamaları standartlaştırabilir.
Örnek 3: SKU Kodlarından Ürün Hattı Çıkarma
Senaryo: Bir üretim şirketi, SKU kodlarında ilk dört karakterin ürün hattını belirttiği bir yapı kullanıyor (örneğin, elektronik için "ELEC-TV-55-BLK", mobilya için "FURN-CHR-WD-01", oyuncak için "TOYS-DOL-12-PNK").
Ayarlar:
- Yeni Öznitelik Adı: ProductLine
- Sütun Adı: SKUCode
- Uzunluk: 4
Çıktı: Zenginleştirme, yeni bir olay özniteliği "ProductLine" oluşturur ve değerleri şunlardır:
- SKU "ELEC-TV-55-BLK" → ProductLine: "ELEC"
- SKU "FURN-CHR-WD-01" → ProductLine: "FURN"
- SKU "TOYS-DOL-12-PNK" → ProductLine: "TOYS"
- SKU "APP-SHT-L-BLU" → ProductLine: "APP-" (daha kısa kod, ilk 4 karakter tire dahil)
İçgörüler: Üretici, sipariş karşılama süreçlerini ürün hattına göre analiz edebilir, hangi ürün hatlarının daha uzun teslim sürelerine sahip olduğunu belirleyebilir ve depo operasyonlarını ürün hattı özelliklerine göre optimize edebilir.
Örnek 4: Satın Alma Sürecinde Belge Türü Sınıflandırması
Senaryo: Bir satın alma sistemi, belge kimliklerinin belge türünü gösteren üç harfli kodlarla başladığı ID'ler kullanıyor (örneğin, satın alma siparişleri için "POR-2024-0001", teklif talepleri için "RFQ-2024-0002", sözleşmeler için "CON-2024-0003").
Ayarlar:
- Yeni Öznitelik Adı: DocumentType
- Sütun Adı: DocumentID
- Uzunluk: 3
Çıktı: Zenginleştirme, yeni bir vaka özniteliği "DocumentType" oluşturur ve değerleri şunlardır:
- Belge "POR-2024-0001" → DocumentType: "POR"
- Belge "RFQ-2024-0002" → DocumentType: "RFQ"
- Belge "CON-2024-0003" → DocumentType: "CON"
- Belge "INV-2024-0004" → DocumentType: "INV"
İçgörüler: Satın alma ekibi, belge türüne göre işlem sürelerini takip edebilir, farklı belge türleri için uygun onay iş akışlarının uygulandığından emin olabilir ve en çok gecikme veya yeniden çalışma yaşanan belge türlerini tespit edebilir.
Örnek 5: Tarih Bazlı Referans Numaralarından Yıl Çıkarma
Senaryo: Bir finansal hizmetler şirketi, referans numaralarının yıl ile başladığı yapılar kullanıyor (örneğin, "2024-FIN-00123", "2023-FIN-98765"). Yıla göre trendleri ve hacimleri analiz etmek istiyorlar.
Ayarlar:
- Yeni Öznitelik Adı: ReferenceYear
- Sütun Adı: ReferenceNumber
- Uzunluk: 4
Çıktı: Zenginleştirme, yeni bir vaka özniteliği "ReferenceYear" oluşturur ve değerleri şunlardır:
- Referans "2024-FIN-00123" → ReferenceYear: "2024"
- Referans "2023-FIN-98765" → ReferenceYear: "2023"
- Referans "2022-FIN-45678" → ReferenceYear: "2022"
- Referans "2021-FIN-12345" → ReferenceYear: "2021"
İçgörüler: Şirket, işlem hacimlerini yıla göre izleyebilir, yıl bazında süreç iyileştirmelerini analiz edebilir, mevsimsel desenleri tespit edebilir ve belirli yıllarda uygulanan süreç değişikliklerinin etkisini ölçebilir.
Çıktı
Text Start zenginleştirme, çıkarılan metin önekini içeren yeni bir öznitelik oluşturur (vaka ya da olay seviyesi, kaynak özniteliğin seviyesiyle eşleşir). Yeni öznitelik her zaman String türünde olur ve kaynak sütundaki her bir değerin ilk N karakterini içerir; burada N belirtilen uzunluktur.
Zenginleştirme çeşitli senaryoları sorunsuz şekilde işler:
- Kaynak metin belirtilen uzunluktan uzunsa, tam olarak belirtilen karakter sayısı çıkarılır
- Kaynak metin belirtilen uzunluğa eşit veya kısaysa, tüm metin değeri kullanılır
- Kaynak değer null veya boşsa, ilgili satır için yeni öznitelik de null olur
- Özel karakterler, boşluklar ve noktalama işaretleri normal karakter olarak değerlendirilir ve belirtilen uzunluk içinde kalırlarsa çıkarılır
Yeni öznitelik, sonraki zenginleştirmelerde, filtrelerde ve hesaplayıcılarda hemen kullanılabilir. Yaygın takip analizleri arasında çıkarılan öneklerin Group Attribute Values zenginleştirmesinde kategoriler oluşturmak için kullanılması, belirli öneklere odaklanan filtrelerin uygulanması veya uygun kodlama standartlarının takip edilmesi için uyumluluk kontrollerinde öneklerin kullanılması yer alır.
Bu dokümantasyon mindzie Studio süreç madenciliği platformunun bir parçasıdır.