Metin Sonu
Genel Bakış
Text End zenginleştirmesi, metin öznitelik değerlerinin sonundan belirli sayıda karakter çıkararak, çıkarılan son eki içeren yeni bir öznitelik oluşturur. Bu güçlü metin manipülasyon operatörü, genellikle kritik tanımlayıcı bilgiler, sınıflandırma kodları veya standart ekler içeren metin alanlarının son kısımlarını izole etmek ve analiz etmek için kullanılır. Metin değerlerinin sağdan başlayarak karakterlerine odaklanarak, iş tanımlayıcılarının sonuna yaygın olarak eklenen anlamlı desenler ve kategoriler çıkarılabilir.
Süreç madenciliğinde, Text End zenginleştirmesi, son kısmı belirli bir anlam taşıyan yapılandırılmış kodlar ve tanımlayıcılarla çalışırken özellikle değerlidir. Birçok iş sistemi, kategorileri, bölgeleri, ürün tiplerini veya durum göstergelerini belirtmek için ekler kullanır. Örneğin, fatura numaraları ülke kodlarıyla bitebilir, ürün SKU'ları kategori ekleri içerebilir veya vaka kimlikleri departman tanımlayıcıları içerebilir. Bu zenginleştirme, bu anlamlı sonları analiz, filtreleme ve süreç varyantı tespiti için çıkarma olanağı sağlar. Operatör, hem vaka öznitelikleri hem de etkinlik öznitelikleriyle çalışarak, süreç verilerinizde metin desenlerini çıkarmada ve analiz etmede esneklik sağlar.
Yaygın Kullanım Alanları
- Dosya uzantılarını belge isimlerinden çıkararak onay süreçlerinde belge türlerini analiz etmek
- Müşteri veya tedarikçi tanımlayıcılarının sonundaki ülke veya bölge kodlarını izole etmek
- Vaka kimliklerinden departman veya ekip eklerini çıkarmak ve organizasyon analizi yapmak
- SKU numaralarının sonundaki ürün kategori kodlarını envanter analizi için almak
- Belge referanslarının sonundaki sürüm numaraları veya revizyon kodlarını tanımlamak
- İşlem kodlarına eklenmiş durum göstergeleri veya bayraklarını çıkarmak
- Finansal referans numaralarından yıl veya dönem göstergelerini izole etmek
Ayarlar
Yeni Öznitelik Adı: Çıkarılan metin sonunu depolayacak yeni özniteliğin adını belirtin. Kaynak metinden hangi bilginin çıkarıldığını açıkça gösteren açıklayıcı bir ad seçin. Örneğin, dosya türlerini çıkarırken "File_Extension", konum tanımlayıcılarını çıkarırken "Country_Code" veya sınıflandırma kodlarını çıkarırken "Category_Suffix" kullanabilirsiniz. Ad benzersiz olmalı ve veri kümenizdeki mevcut özniteliklerle çakışmamalıdır.
Sütun Adı: Sondan karakterlerini çıkarmak istediğiniz metin özniteliğini seçin. Bu açılır liste, hem vaka hem de etkinlik seviyelerindeki tüm kullanılabilir metin özniteliklerini gösterir. Zenginleştirme, seçilen özniteliğin vaka mı yoksa etkinlik özniteliği mi olduğunu otomatik olarak algılar ve yeni özniteliği aynı seviyede oluşturur. Sadece gizli olmayan metin (string) türündeki öznitelikler seçilebilir.
Uzunluk: Metin değerinin sonundan çıkarılacak karakter sayısını belirtin. Bu pozitif bir tam sayı olmalı (minimum değer 1). Belirtilen uzunluk, metin değerinin gerçek uzunluğunu aşarsa, tüm değer döndürülür. Örneğin, uzunluk 3 olarak belirtilmişse ve değer yalnızca 2 karakter uzunluğundaysa, tam 2 karakter çıkarılır. Gereksiz karakterlerin yakalanmasını önlemek için çıkarmak istediğiniz son ekin maksimum beklenen uzunluğunu düşünün.
Örnekler
Örnek 1: Belge İsimlerinden Dosya Uzantılarının Çıkarılması
Senaryo: Bir belge onay sürecinde, en çok hangi belge türlerinin sunulduğunu ve işlenme sürelerini analiz etmeniz gerekiyor. Belge isimleri dosya uzantılarıyla birlikte saklanır ve bu uzantıları kategorize etmek için çıkarmak istersiniz.
Ayarlar:
- Yeni Öznitelik Adı: Document_Type
- Sütun Adı: Document_Name
- Uzunluk: 4
Çıktı: Her belge adının son 4 karakterini içeren "Document_Type" adlı yeni bir öznitelik oluşturur. Belge adları için:
- "Q3_Report_2024.pdf" → ".pdf"
- "Contract_Amendment.docx" → "docx"
- "Invoice_10245.xlsx" → "xlsx"
- "Presentation.ppt" → ".ppt"
İçgörüler: Dosya uzantıları çıkarılarak, hangi belge türlerinin daha uzun onay süreleri gerektirdiği analiz edilebilir, belirli dosya formatlarıyla çalışan departmanlar tanımlanabilir ve yetkisiz dosya türleriyle ilgili uyum sorunları tespit edilebilir.
Örnek 2: Tedarikçi Kimliklerinden Ülke Kodlarının İzole Edilmesi
Senaryo: Küresel bir tedarik sürecinde, tedarikçi kimlikleri sonlarında iki harfli ülke kodları içerir. Bu kodları çıkarmanız, ülkeye göre tedarik desenlerini analiz etmeniz ve bölgesel tedarik politikalarına uyumu sağlamanız için gereklidir.
Ayarlar:
- Yeni Öznitelik Adı: Supplier_Country
- Sütun Adı: Supplier_ID
- Uzunluk: 2
Çıktı: Her tedarikçi için ülke kodunu içeren yeni bir vaka özniteliği "Supplier_Country" oluşturur. Örnekler:
- "SUP-2024-0145-US" → "US"
- "SUP-2024-0892-DE" → "DE"
- "SUP-2024-0234-CN" → "CN"
- "SUP-2024-0567-BR" → "BR"
İçgörüler: Bu çıkarım, tedarikçi dağılımının coğrafi analizine, bölgesel tedarik metriklerinin hesaplanmasına ve yerel tedarik gereksinimlerine uyumun belirlenmesine olanak tanır.
Örnek 3: Vaka Kimliklerinden Departman Kodlarının Çıkarılması
Senaryo: Bir sağlık hasta kayıt sisteminde, vaka kimliklerinin sonunda üç karakterlik bir departman kodu bulunur. Bu kodları çıkararak, farklı departmanlar arasındaki hasta akışını analiz etmek ve darboğazları tespit etmek istersiniz.
Ayarlar:
- Yeni Öznitelik Adı: Department_Code
- Sütun Adı: Case_ID
- Uzunluk: 3
Çıktı: Departman tanımlayıcılarını içeren "Department_Code" adlı yeni bir öznitelik oluşturur. Vaka kimlikleri için:
- "PAT-2024-10523-EMR" → "EMR" (Acil)
- "PAT-2024-10524-RAD" → "RAD" (Radyoloji)
- "PAT-2024-10525-LAB" → "LAB" (Laboratuvar)
- "PAT-2024-10526-SUR" → "SUR" (Ameliyat)
İçgörüler: Departman kodlarının çıkarılması, hasta yönlendirme desenlerinin analizine, departmana özgü gecikmelerin tespitine ve farklı tıbbi birimlerin işleme sürelerinin karşılaştırılmasına imkan verir.
Örnek 4: SKU Numaralarından Ürün Kategorilerinin Alınması
Senaryo: Perakende envanter yönetimi sürecinde, ürün SKU’larının sonunda iki karakterlik kategori kodu bulunur. Bu kodları çıkararak, ürün kategori bazında stok devir hızını analiz etmek ve stok seviyelerini optimize etmek istersiniz.
Ayarlar:
- Yeni Öznitelik Adı: Product_Category
- Sütun Adı: SKU_Number
- Uzunluk: 2
Çıktı: Kategori kodlarını içeren "Product_Category" adlı yeni bir öznitelik oluşturur. SKU örnekleri:
- "PROD-854621-EL" → "EL" (Elektronik)
- "PROD-854622-CL" → "CL" (Giyim)
- "PROD-854623-FD" → "FD" (Gıda)
- "PROD-854624-TY" → "TY" (Oyuncaklar)
İçgörüler: Kategori çıkarımı, kategoriye özgü envanter desenlerinin analizine, yavaş hareket eden ürün tiplerinin belirlenmesine ve ürün kategorisi bazında yeniden sipariş noktalarının optimize edilmesine olanak tanır.
Örnek 5: Finansal Referanslardan Yıl Göstergelerinin Çıkarılması
Senaryo: Hesap ödemeleri sürecinde, fatura numaraları dört haneli yıl ile biter. Ödemeleri zaman içinde analiz etmek ve yaşlanan faturaları tespit etmek için yılı çıkarmanız gerekir.
Ayarlar:
- Yeni Öznitelik Adı: Invoice_Year
- Sütun Adı: Invoice_Number
- Uzunluk: 4
Çıktı: Yılı içeren "Invoice_Year" adlı yeni bir öznitelik oluşturur. Fatura numaraları için:
- "INV-US-054321-2024" → "2024"
- "INV-EU-098765-2023" → "2023"
- "INV-AP-012345-2024" → "2024"
- "INV-LA-067890-2022" → "2022"
İçgörüler: Yıl çıkarımı, fatura işleme sürelerinin trend analizine, ödenmemiş eski faturaların tespitine ve yıllar bazında ödeme performans metriklerinin karşılaştırılmasına imkan sağlar.
Çıktı
Text End zenginleştirmesi, orijinal değerlerin sonundan çıkarılan metni içeren yeni bir öznitelik (vaka ya da etkinlik seviyesi, kaynak özniteliğe uygun olarak) oluşturur. Yeni öznitelik her zaman string veri tipindedir, çıkarılan içeriğin neyi temsil ettiğine bakılmaksızın. Öznitelik, uygun tabloya (vaka ya da etkinlik) otomatik olarak eklenir ve filtrelerde, hesaplayıcılarda ve diğer zenginleştirmelerde hemen kullanılabilir hale gelir.
Vaka özniteliklerinde, çıkarım vaka başına bir kez yapılır ve sonuç vaka seviyesine kaydedilir. Etkinlik özniteliklerinde ise çıkarım her etkinlik için yapılır; bu sayede son eklerin süreçteki farklı aktiviteler arasında nasıl değiştiği analiz edilebilir. Kaynak değer null veya boş ise, yeni öznitelik o vaka veya etkinlik için null olur.
Çıkarılan metin, kaynak dizenin sonundaki karakterleri tam olarak korur; özel karakterler, sayılar veya noktalama işaretleri dahil. Bu, dosya uzantıları (nokta dahil) veya bileşik kodlar gibi anlamlı eklerin doğru şekilde yakalanmasını sağlar. Zenginleştirme, değişken uzunluktaki kaynak metinleri sorunsuz işler – kaynak değer belirtilen çıkarım uzunluğundan kısa ise, hata yerine tüm değer döndürülür.
Bu dokümantasyon mindzie Studio süreç madenciliği platformunun bir parçasıdır.