डेटा गवर्नेंस 101: एक व्यावसायिक शब्दावली का निर्माण कैसे करें

एक व्यावसायिक शब्दावली एक महत्वपूर्ण कलाकृति है जो एक डेटा गवर्नेंस प्रोग्राम प्रदर्शित करता है कि संगठन के पास प्रमुख व्यावसायिक अवधारणाओं, व्यवसाय की शर्तों और उनके बीच संबंधों की सहमति है। इसका उपयोग डेटा नीतियों और नियमों के पालन को प्रदर्शित करने के लिए भी किया जाता है।

ऑडिट आवश्यकताओं से परे, व्यावसायिक शब्दावली एक केंद्रीकृत ज्ञान के रूप में काम करने के लिए है जो दस्तावेजों को निर्धारित करता है:

  1. व्यापार की विभिन्न रेखाओं के बीच व्यापार शब्द की परिभाषा और उपयोग,
  2. आधिकारिक स्रोत सहित डेटा की भौतिक तात्कालिकता,
  3. व्यापार की शर्तों को मापने के लिए स्वीकार्य डेटा गुणवत्ता नियम
  4. और मालिक और साझेदार शब्द के उपयोग को बनाने और परिभाषित करने के लिए जिम्मेदार हैं।

एक व्यावसायिक शब्दावली के निर्माण की चुनौतियाँ

एक व्यवसायिक शब्दावली का निर्माण - एक औपचारिक डेटा गवर्नेंस प्रोग्राम की शुरुआत - अभी भी एक पारंपरिक रूप से श्रम-गहन कार्य है जिसमें विषय वस्तु विशेषज्ञों को एक केंद्रीकृत स्प्रेडशीट में अपनी परिभाषाओं को दस्तावेज़ और इनपुट करने के लिए पूछना शामिल है।

प्रौद्योगिकी मालिकों और ऑपरेशन टीमों ने भी व्यावसायिक शब्दावली में व्यापार शब्द की अपनी समझ का योगदान दिया है। यह तब तक दोहराया जाता है जब तक कि सभी हितधारक अंतिम परिभाषा और उपयोग में वजन नहीं कर सकते और सहमत नहीं हो सकते हैं - एक बड़ी अक्षमता, डेटा तत्वों की बड़ी संख्या को देखते हुए, जिन्हें व्यावसायिक शब्दावली में शामिल किया जाना चाहिए।

व्यवसाय शब्द का वर्णन करने वाले विभिन्न मेटाडेटा के मैनुअल प्रलेखन को संबोधित करने के बाद, व्यवसाय शब्दावली बनाने के लिए अगली सबसे बड़ी चुनौती यह है कि अंतिम जानकारी पर सहमति के लिए एक प्रक्रिया की बातचीत और बातचीत की जा रही है जिसे शब्दावली में दस्तावेज किया जाना चाहिए। इनपुट प्रदान करने, समीक्षा करने और यह सुनिश्चित करने के लिए लोगों की कई परतें हैं कि यह सुनिश्चित किया जाए कि व्यवसायिक अवधि के सभी बिंदुओं पर कब्जा कर लिया गया है। परिभाषा के आधार पर समीक्षा और साइन-ऑफ करने के लिए स्टीयरिंग समितियों सहित कई पुनरावृत्तियों से गुजरना व्यावसायिक शर्तों के लिए सामान्य है।

व्यवसाय शब्दावली बनाने के लिए लंबे समय तक और मैन्युअल रूप से गहन प्रयास के साथ, यह जल्दी से पुरानी जानकारी के साथ बासी हो सकता है: जैसा कि डेटा की अतिरिक्त प्रतियां बनाई जाती हैं, व्यवसाय की शर्तों की भौतिक तात्कालिकताएं सभी मैन्युअल रूप से घुमावदार व्यावसायिक शब्दावली में कैप्चर नहीं की जाती हैं। न ही सभी प्रासंगिक व्यवसाय डेटा गुणवत्ता नियम हैं। डेटा गोपनीयता और नियमों के सामने आने और केंद्र की व्यावसायिक प्राथमिकताओं को प्रभावित करने के साथ, एक समय पर और व्यापक डेटा प्रशासन कार्यक्रम पहले से कहीं अधिक महत्वपूर्ण है।

क्यों व्यापार शब्दावली अधिक सामान्य नहीं हैं

यहां तक ​​कि जिन कंपनियों ने एक मुख्य डेटा अधिकारी के तहत डेटा गवर्नेंस प्रोग्राम को औपचारिक रूप नहीं दिया है, उनके पास व्यावसायिक शब्दावली का एक समूह होगा जो संगठन के बीच केंद्रीकृत है या डेटाबेस से एकत्र किए गए प्रबंधित डेटा तत्वों की एक सूची है। परंपरागत रूप से वित्तीय सेवा कंपनियों में, प्रौद्योगिकी समूहों ने अपने डेटा मॉडल प्रलेखन का उपयोग करके एक व्यावसायिक शब्दावली का प्रमाण प्रदान किया है जिसमें कॉलम नाम, परिभाषा और डेटा प्रकार शामिल हो सकते हैं। यह अक्सर व्यावसायिक शब्दावली की अल्पविकसित शुरुआत होती है।

निर्माण और व्यवसाय शब्दावली को बनाए रखना इतना मुश्किल क्यों है? यदि आप किसी भी S & P 500 कंपनी से पूछते हैं, तो आपको कुछ सामान्य प्रतिक्रियाएँ सुनने को मिलेंगी:

सबसे पहले, एक व्यावसायिक शब्दकोष बनाने का ज्ञान व्यवसाय में और आईटी पेशेवरों के बीच कई व्यक्तियों के दिमाग में रहता है। दूसरे, यह ऐतिहासिक रूप से जानकारी इकट्ठा करने, क्यूरेट करने और बनाए रखने का एक मैन्युअल प्रयास रहा है। संगठन द्वारा पूर्ण परिभाषाओं, आधिकारिक स्रोतों, डेटा गुणवत्ता नियमों और नमूना डेटा के साथ प्रभावशाली 500 डेटा तत्व सूची बनाने के प्रयास के बाद भी, मेटाडेटा बासी हो जाता है। या इससे भी बदतर, व्यापार शब्दावली पूरी होने पर अप्रचलित हो गई है क्योंकि व्यवसाय में कोई भी वास्तव में किसी भी नए नियमों के अनुपालन के लिए इस जानकारी का उपयोग नहीं करेगा।

मैन्युअल रूप से एक व्यावसायिक शब्दावली के निर्माण के लिए 10 कदम

चूंकि डेटा गवर्नेंस प्रोग्राम के अनुपालन के लिए नियामकों द्वारा प्रमाण के रूप में एक व्यावसायिक शब्दावली की आवश्यकता होती है, इसलिए व्यावसायिक शब्दावली की आवश्यकता कभी भी समाप्त नहीं होगी। आइए एक व्यापार अवधि के लिए व्यावसायिक शब्दावली में शामिल होने वाली न्यूनतम विशेषताओं को इकट्ठा करने के लिए प्रक्रिया को तोड़ दें - यह निर्धारित करने के लिए कि प्रक्रिया क्षमताएँ इसे बेहतर बनाने में मदद कर सकती हैं:

चरण 1: एंटरप्राइज़ डेटा ऑफिस एक व्यावसायिक अवधि को परिभाषित करने के लिए डेटा स्टीवर्ड से संपर्क करता है। उदाहरण के लिए, "बाजार मूल्य"

चरण 2: डेटा स्टूवर्ड शब्द को परिभाषित करता है जो व्यवसाय की उसकी लाइन और उपयोग के संदर्भ के लिए प्रासंगिक है। स्टीवर्ड परिभाषा लिखने में एक दिन बिताता है और फिर इसे वापस अनुरोधकर्ता को ईमेल करता है।

चरण 3: प्रौद्योगिकी प्रणाली मालिक एक उदाहरण प्रदान करता है जहां डेटा को डेटा प्रकार और तालिका और स्तंभ नाम के साथ संग्रहीत किया जाता है।

चरण 4: एंटरप्राइज़ डेटा कार्यालय शर्तों की समीक्षा करता है और पहचानता है कि वैकल्पिक परिभाषाएँ व्यवसाय और प्रणाली की लाइन के आधार पर संभव हैं।

चरण 5: एक डेटा प्रदान करने के लिए एंटरप्राइज़ डेटा ऑफ़िस व्यवसाय की अन्य पंक्तियों और अन्य विषय मैटर विशेषज्ञों में अतिरिक्त डेटा स्टूवर्स तक पहुंचने के लिए। ईमेल प्रतिक्रिया के लिए कुछ दिन प्रतीक्षा करें।

चरण 6: एंटरप्राइज़ डेटा कार्यालय एक परिभाषा पर अनुरोधकर्ताओं के साथ अनुवर्ती है।

चरण 7: अतिरिक्त सिस्टम मालिकों से संपर्क किया जा सकता है जिनकी प्रणाली मूल्य, मार्केट वैल्यू का भंडारण कर सकती है।

चरण 8: एंटरप्राइज़ डेटा ऑफिस को पता चलता है कि व्युत्पन्न डेटा तत्व हैं जो मार्केट वैल्यू के लिए गणना में जाते हैं। क्या इन अतिरिक्त डेटा तत्वों को व्यक्तिगत डेटा तत्वों के रूप में व्यावसायिक शब्दावली में बनाया जाना चाहिए? एंटरप्राइज़ डेटा ऑफ़िस को पता चलता है कि व्यावसायिक शब्द के पूर्ण वंश को कैप्चर करना होगा, इसलिए अतिरिक्त 3 व्यावसायिक शब्दों को परिभाषित करने की आवश्यकता है।

चरण 9: सभी डेटा स्टूवर्स, सब्जेक्ट मैटर विशेषज्ञों और प्रौद्योगिकी मालिकों के साथ एक बैठक, एक शब्द, मार्केट वैल्यू के लिए एकत्रित परिणामों की चर्चा और समीक्षा करने के लिए व्यवस्था की जाती है।

चरण 10: अगले व्यापार अवधि के लिए कुल्ला और दोहराएं।

एक बार जब व्यावसायिक शब्द को परिभाषित किया जाता है और उसे व्यावसायिक शब्दावली में शामिल किया जाता है, तो व्यापार हितधारकों और डेटा उपभोक्ताओं को यह सुनिश्चित करने की आवश्यकता होती है कि इस शब्द का उपयोग संगठन में डेटा मॉडल, रिपोर्ट, डैशबोर्ड और नए अनुप्रयोगों में लगातार किया जाता है। एंटरप्राइज डेटा ऑर्गनाइजेशन को यह सुनिश्चित करने की आवश्यकता है कि - फर्म की डेटा रणनीति के हिस्से के रूप में - व्यापार की शर्तों का उपयोग नीतियों और विनियमों, विशेष रूप से नए गोपनीयता जनादेश के साथ किया जाता है।

कैसे एक व्यावसायिक शब्दावली पॉप्युलेट करने के लिए मशीन लर्निंग का उपयोग करें

मैन्युअल रूप से क्यूरेट की गई व्यावसायिक शब्दावली में सबसे बड़ी चुनौतियों में शामिल हैं:

  1. शुरुआती समय में सहसंबद्ध होने वाले व्यावसायिक शब्दों की पूरी गुंजाइश की पहचान करना
  2. इन व्यावसायिक शर्तों से प्रभावित प्रौद्योगिकी मालिकों की संख्या जो समीक्षा प्रक्रिया में शामिल हैं, और
  3. समान या समान डेटा की नई त्वरित पहचान के लिए वर्गीकरण तकनीकों का लाभ उठाना।

नए दृष्टिकोण जो स्वचालित खोज, मेटाडेटा संग्रह और विश्लेषण का लाभ उठाते हैं, और मशीन सीखने-संचालित वर्गीकरण में मैनुअल कदमों को कम करने और व्यापार और तकनीकी हितधारकों के बीच अधिक सहज सहयोग की सुविधा का वादा है।

मशीन लर्निंग-संचालित वर्गीकरण के साथ प्रोग्रामेटिक इंटीग्रेशन के माध्यम से, डेटा गवर्नेंस टीमें पहचान किए गए डेटा निष्कर्षों के साथ अपनी शब्दावली में व्यावसायिक शब्दों को संरेखित कर सकती हैं। यह एकीकरण संगठनों को न केवल व्यापार और तकनीकी दृष्टिकोण को पाटने में मदद कर सकता है, बल्कि डेटा प्रशासन गतिविधियों की एक श्रृंखला के लिए सक्रिय मेटाडेटा का भी लाभ उठा सकता है। बिगड की डिस्कवरी-इन-डेप्थ तकनीक एक व्यापार शब्दावली को पॉप्युलेट करने में मदद कर सकती है, मैनुअल स्टेप्स (और संभावित मैनुअल एरर) को कम करने में मदद कर सकती है और एक बेहतर डेटा गवर्नेंस प्रोग्राम बनाने में मदद कर सकती है।

मूल रूप से 18 फरवरी, 2020 को https://bigid.com पर प्रकाशित।