डेटाबेस प्रबन्धन प्रणाली ( Database Management System ) क्या होती है? पूरी जानकारी

Ashok Nayak
0

डेटाबेस प्रबन्धन प्रणाली 

कम्प्यूटरीकृत डेटाबेस के निर्माण तथा रख - रखाव के लिए हमें एक विशेष प्रकार के सॉफ्टवेयर की आवश्यकता होती है , जिसे डेटाबेस प्रबन्धन प्रणाली ( DBMS ) कहा जाता है ।

मुख्यतः यह एक कम्प्यूटर आधारित रिकॉर्ड के रख रखाव की प्रणाली है अर्थात् यह एक ऐसी प्रणाली है , जिसका उद्देश्य रिकॉर्ड . . . एवं सूचनाओं को सम्भाल कर रखना है । यह उपयोगकर्ता को एक ऐसा वातावरण प्रदान करती है , जिसके माध्यम से डेटा को संग्रहीत करना तथा पुनः प्राप्त करना बहुत ही सुविधाजनक हो जाता है । MySQL , INGRES , MS ACCESS आदि इसके उदाहरण हैं ।

Table of content (toc)


DBMS की मुख्य विशेषताएँ निम्नलिखित हैं

1. डेटाबेस का निर्माण करना ।

2. नए डेटा को शामिल करना या जोड़ना ।

3. वर्तमान डेटा को सम्पादित करना ।

4. डेटा को अस्थायी एवं स्थायी रूप से मिटाना ।

5. सूचना पद्धति को ढूँढना एवं प्राप्त करना ।

6. डेटा को क्रमबद्ध रूप से व्यवस्थित करना ।

7. आकर्षक एवं अर्थपूर्ण रिपोर्ट्स को डिजाइन करना एवं प्रिन्ट करना ।

DBMS की संरचना ( Architecture of DBMS )

DBMS की संरचना तीन स्तरों से मिलकर बनी होती है , जिनका विवरण निम्नलिखित हैं

1. आन्तरिक स्तर ( Internal Level )

इस स्तर में , डेटाबेस के भौतिक संग्रहण की संरचना का वर्णन करता है । यह वर्णित करता है कि वास्तव में डेटा डेटाबेस में कैसे संग्रहीत और व्यवस्थित होता है । वह यह भी निर्धारित करता है कि कौन - सी इण्डेक्सेस मौजूद हैं , स्टोर किए गए रिकॉर्ड किस क्रम में हैं आदि । इसे भौतिक स्तर ( Physical Level ) भी कहा जाता है ।

DBMS की संरचना ( Architecture of DBMS )


2. विचार सम्बन्धी स्तर ( Conceptual Level )

इस स्तर में , पूर्ण डेटाबेस की संरचना होती है । यह स्तरों के मध्य जानकारी के रूपान्तरण की प्रक्रिया होती है । यह डेटाबेस में संग्रहीत डेटा के प्रकार को तथा डेटा के बीच सम्बन्ध को वर्णित करता है । इसे तर्कसिद्ध स्तर ( Logical Level ) भी कहा जाता है 

3. बाहरी स्तर ( External Level )

इस स्तर में डेटा व्यक्तिगत उपयोगकर्ता द्वारा उपयोग में लाया जाता है । यह डेटाबेस के उस भाग का वर्णन करता है जो उपयोगकर्ता के लिए उपयोगी होता है । यह उपयोगकर्ताओं को उनकी आवश्यकतानुसार डेटा को एक्सिस ( Access ) करने की अनुमति इस प्रकार करता है , ताकि एक ही डेटा एक ही समय पर कई उपयोगकर्ताओं ( Users ) द्वारा प्रयोग किया जा सके । यह स्तर डेटाबेस की सूची को उपयोगकर्ता से छिपाता है । यह स्तर अलग - अलग उपयोगकर्ता के लिए अलग - अलग होता है । इसे दर्शनीय स्तर ( View Level ) भी कहा जाता है ।

DBMS के लाभ ( Advantages of DBMS )

DBMS के के कई लाभ है जो निम्नलिखित है

1. डेटा के दोहराव में कमी ( Reduction in Data Repitition )

अच्छी तरह व्यवस्थित किए गए डेटाबेस में सामान्यतः डेटा का कोई दोहराव नहीं होता । समस्त डेटा को एक जगह रखे जाने के कारण हर सूचना को केवल एक बार स्टोर किया जाता है ।

2. डेटा की स्थिरता ( Data Consistency )

डेटा के एक ही स्थान पर केन्द्रित होने के कारण डेटा की स्थिरता बनी रहती है , क्योंकि उसमें एक सूचना के दो मानों की सम्भावना समाप्त हो जाती है । डेटा अस्थिर तब होता है जब डेटा दो जगह रखा गया हो ओर केवल एक जगह सुधारा गया हो ।

3. डेटा की साझेदारी ( Data Sharing )

डेटा की साझेदारी करके एक समय पर कई प्रोग्राम डेटा का प्रयोग कर सकते हैं । जिससे प्रोग्रामों को अपना डेटाबेस तैयार करने की आवश्यकता नहीं होती और बहुत - सा समय और परिश्रम बच जाता है ।

4. डेटा की सुरक्षा ( Security of Data )

डेटाबेस प्रबन्धन प्रणाली ( DBMS ) डेटा को निषिद्ध उपयोगकर्ताओं तथा अवैध परिवर्तन से बचाता है । यह केवल अधिकृत उपयोगकर्ताओं को डेटा का प्रयोग करने की अनुमति प्रदान करता है ।

5. डेटा की सम्पूर्णता ( Data Integrity )

डेटा की सम्पूर्णता , डेटा की समग्र पूर्णता ( Overall Completeness ) , सटीकता ( Accuracy ) तथा निरन्तरता ( Consistency ) को सन्दर्भित करती है।

यह एक डेटा रिकॉर्ड के दो अपडेटस ( Updates ) के बीच परिवर्तन के अभाव को दर्शाता है । यह दर्शाता है कि डेटाबेस में स्टोर डेटा बिल्कुल सही है और नवीनतम है ।


DBMS की सीमाएँ ( Limitation of DBMS )

DBMS के कई लाभ है , लेकिन साथ ही इसकी कुछ सीमाएँ भी हैं जो निम्नलिखित हैं

1. हार्डवेयर और सॉफ्टवेयर की लागत ( Cost of Hardware and Software )

सॉफ्टवेयर को चलाने के लिए डेटा को तीव्र गति से प्रोसेस करने वाले प्रोसेसर ( Processor ) और अधिक क्षमता वाली मैमोरी ( Memory ) की आवश्यकता होती है , जिनकी लागत अधिक होती हैं।

2. कठिनता ( Complexity )

एक डेटाबेस प्रबन्धन प्रणाली ( DBMS ) के अच्छे कार्य करने की क्षमता की पूर्व - कल्पना करना उस DBMS सॉफ्टवेयर को कठिन बना देती है । डेटाबेस प्रबन्धन प्रणाली को समझने की विफलता एक संगठन Organisation के लिए गम्भीर परिणामों का कारण बन सकती है ।

3. कर्मचारियों के प्रशिक्षण की लागत ( Cost of Staff Training )

अधिकतर DBMS सॉफ्टवेयर अत्यन्त जटिल होते हैं , इसलिए उपयोगकर्ताओं को डेटाबेस का प्रयोग करने के लिए एक प्रशिक्षण देने की आवश्यकता होती है । इस प्रकार , DBMS सॉफ्टवेयर चलाने के लिए संगठन को कर्मचारियों के प्रशिक्षण के लिए एक बड़ी राशि का भुगतान करना पड़ता है । टेक्निकल स्टॉफ की नियुक्ति ( Appointing Technical Staff ) एक संगठन में डेटाबेस के लिए प्रशिक्षित टेक्निकल पर्सन ( Trained Technical Staff ) जैसे कि डेटाबेस व्यवस्थापक ( Database Administrator ) , एप्लीकेशन प्रोग्रामर ( Application Programmers ) आदि की आवश्यकता होती है , जिसके लिए संगठन को इन व्यक्तियों को एक अच्छे वेतन का भुगतान करना पड़ता है जिससे प्रणाली की लागत बढ़ जाती है ।


डेटाबेस की विफलता ( Database Failure )

अधिकांश संगठन में सभी डेटा एक ही डेटाबेस में एकीकृत होता है । यदि पॉवर बन्द हो जाने के कारण डेटाबेस विफल हो जाता है या डेटाबेस स्टोरेज डिवाइस पर ही विफल ( Fail ) हो जाता है । तो हमारा सभी मूल्यवान ( Valuable ) डेटा लुप्त ( Loss ) हो सकता है या हमारी पूरी प्रणाली बन्द हो सकती है ।


रिलेशनल डेटाबेस ( Relational Database )


 रिलेशनल डेटाबेस में डेटा को द्वि - आयामी सारणियों ( 2 - Dimensional | Tables ) के रूप में संग्रहीत किया जाता है । इन सारणियों को रिलेशन ( Relation ) भी कहा जाता है । रिलेशन डेटाबेस के रख - रखाव के लिए रिलेशनल डेटाबेस प्रबन्धन प्रणाली ( Relational Database Management System - RDBMS ) की आवश्यकता होती है । RDBMS , DBMS का ही एक प्रकार है । रिलेशनल डेटाबेस की मुख्य विशेषता यह है कि एक एकल डेटाबेस में एक से अधिक सारणियों को संग्रहीत किया जा सकता है । और ये सारणियाँ आपस में सम्बन्धित होती है ।


सम्बन्धित पदावली ( Related Terminology ) 

रिलेशनल डेटाबेस की कुछ सम्बन्धित पदावली निम्नलिखित हैं 

1. रिलेशन ( Relation )

रिलेशन के अन्तर्गत एक टेबल ( Table ) तैयार की जाती है जो एक सिक्वेन्शियल फाइल को निरूपित करती है , जिसमें टेबल की पंक्तियाँ ( Rows ) फाइल के रिकॉर्ड को इंगित करती हैं । एवं स्तम्भ ( Column ) रिकॉर्ड के फील्ड को दर्शाता है । ये टेबल्स रिलेशन ही होते हैं । रिलेशन को उच्च स्तरीय फाइल्स के रूप में समझा जाता है , जिसमें

( i )प्रत्येक रिलेशन में एक ही तरह के रिकॉर्ड होते हैं ।

किसी दिए गए रिलेशन में प्रत्येक रिकॉर्ड के फील्डों की संख्या समान होती है ।

( ii )प्रत्येक रिकॉर्ड का एक अलग पहचानने वाला ( Identifier ) होता है ।

( iii )रिलेशन के अन्दर रिकॉर्ड किसी विशेष क्रम में व्यवस्थित होते हैं ।

इसके लिए निम्नलिखित उदाहरण पर विचार कीजिए

डेटाबेस प्रबन्धन प्रणाली ( Database Management System )

2. ट्यूपल ( Tuple )

रिलेशन में प्रत्येक रिकॉर्ड को ट्यूपल कहा जाता है । उदाहरण के लिए , दिए गए रिलेशन Parts में पाँच ट्यूपल है । उनमें से एक ट्यूपल ( P2 , Bolt , Green , 15 , Paris ) है जो एक Part के विषय में एक विशेष सूचना हैं ।

3. एट्रिब्यूट ( Attribute )

रिलेशन के सन्दर्भ में प्रत्येक कॉलम ( फील्ड ) को एट्रिब्यूट कहते हैं । उदाहरण के लिए , दिए गए रिलेशन Parts में पाँच एट्रिब्यूट्स ( P # , P Name , Colour , Weight , City ) हैं । जिनमें से प्रत्येक कॉलम एक Part के विषय सूचना प्रदान करता है ।

4. डोमेन ( Domain )

रिलेशन के सन्दर्भ में डोमेन मानों का एक समूह होता है जिससे किसी कॉलम में दिए गए वास्तविक मानों को व्युत्पन्न किया जा सकता है । उदाहरण के लिए , हम निम्न रिलेशन पर विचार कर सकते हैं ।

डेटाबेस प्रबन्धन प्रणाली ( Database Management System )

यहाँ SP टेबल के P # कॉलम में जो मान दिए गए हैं उन्हें P टेबल से व्युत्पन्न किया गया है एवं SP टेबल के S # कॉलम में जो मान दिए गए हैं उन्हें S टेबल से व्युत्पन्न किया गया है । अतः यहाँ टेबल P एवं टेबल S एक डोमेन के रूप में हैं , जिनसे P # एवं S # मानों को व्युत्पन्न कर एक SP टेबल तैयार किया गया है।


5. कार्डिनैलिटी ( Cardinality )

रिलेशन के सन्दर्भ में ट्यूपल ( रिकॉर्ड्स ) की कुल संख्या को कार्डिनैलिटी कहते हैं । अतः ऊपर वर्णित उदाहरण के लिए रिलेशन P की कार्डिनैलिटी 3 , S की 3 एवं SP की 5 है ।

6. डिग्री ( Degree )

रिलेशन के सन्दर्भ में एट्रिब्यूट ( फील्ड या कॉलम ) की कुल संख्या को रिलेशन की डिग्री कहते हैं । अतः ऊपर दिए गए उदाहरण में रिलेशन P की डिग्री 4 , S की 4 एवं SP की 3 है । 


की - फील्ड ( Key - Field )

सामान्यतः किसी डेटाबेस के हर रिकॉर्ड को उसकी रिकॉर्ड संख्या द्वारा पहचाना जाता हैं , लेकिन सभी रिकॉर्डों की रिकॉर्ड संख्या को याद रखना सम्भव नहीं है । इसलिए किसी रिकॉर्ड को पहचानने के लिए हम उसके एक फील्ड को मुख्य फील्ड या की - फील्ड मान लेते हैं । कई प्रकार की होती है , जो निम्नलिखित हैं


( i ) प्राइमरी की ( Primary Key )

' प्राइमरी की ' किसी रिलेशन का एक एट्रिब्यूट होता है , जिसमें विभिन्न मान होते हैं और जिनका प्रयोग उस रिलेशन के ट्यूपल को निर्धारित करने में किया जाता है । प्राइमरी की के रूप में चुना गया फील्ड NULL वैल्यू स्वीकार नहीं कर सकता ।। उदाहरण के लिए , रिलेशन P के लिए एट्रिब्यूट P # की यह विशेषता है । कि प्रत्येक ट्यूपल में एक विशिष्ट P # मान होता है एवं यह मान उस ट्यूपल को उस रिलेशन के अन्य ट्यूयल से पृथक् करता है । इस स्थिति में रिलेशन P के लिए P # को एक प्राइमरी की कहा जाता है । 


( ii ) कैन्डिडेट की ( Candidate Key )

कभी - कभी ऐसे रिलेशन भी उत्पन्न होते हैं जिनमें एक से अधिक एट्रिब्यूट का समूह होता है जिसमें विशेष निर्धारक गुण होते हैं एवं इसके | लिए एक से अधिक की ( Key ) का निर्माण करना आवश्यक हो जाता है । वह की जिस पर विशिष्ट निर्धारक गुण प्रयुक्त किए जाते हैं , कैन्डिडेट | की कहलाती है । किसी एक रिलेशन में एक या एक से अधिक कैन्डिडेट की हो सकती है । दिए गए उदाहरण में रिलेशन 5 में एट्रिब्यूट S # एवं SNAME की यह विशेषता है- प्रत्येक ट्यूपल में एक विशिष्ट S # एवं SNAME मान है । जिसका उपयोग उस ट्यूपल को उस रिलेशन में विद्यमान बाकी सभी ट्यूपल से पृथक् से करने में किया जाता है । 

( iii ) आल्टरनेट की ( Alternate Key )

आल्टरनेट की वह होती है जो प्राइमरी की नहीं होती । इसकी उपयोगिता उस रिलेशन के लिए होती है जिसमें एक से अधिक एट्रिब्यूटों का समूह होता है एवं एक से अधिक कैण्डिडेट की होते हैं । इस स्थिति में , किसी विशिष्ट गुण को निर्धारित करने के लिए जब एक से अधिक की ( Key ) के समूहों का उपयोग किया जाता है तब प्रथम की को प्राइमरी की एवं दूसरी की को आल्टरनेट की कहा जाता है । आल्टरनेट की को सेकण्डरी की भी कहा जाता है । ऊपर दिए गए उदाहरण में , S # एक प्राइमरी की है एवं SNAME एक आल्टरनेट की है ।

( iv ) फॉरेन की ( Foreign Key )

किसी रिलेशनल डेटाबेस में , फॉरेन की एक या एक से अधिक फील्डों का समूह होता है जो दो सारणियों के डेटा के बीच लिंक ( Link ) प्रदान करता है । किसी सारणी की फॉरेन की फील्ड के लिए वैल्यू उसी सारणी के प्राइमरी की फील्ड या अन्य किसी सारणी के प्राइमरी - की फील्ड की वैल्यू से व्युत्पन्न ( Derived ) की जाती है । इस प्रकार फॉरेन की दो सारणियों के बीच सम्बन्ध स्थापित करती है । किसी सारणी में एक से अधिक फॉरेन की हो सकती हैं जो उस सारणी का अलग - अलग सारणियों से सम्बन्ध स्थापित करती है ।

( v ) यूनीक की ( Unique Key )

किसी सारणी में यूनीक की एक या एक से अधिक फील्डों का समूह होती है जिनका उपयोग उस सारणी में प्रत्येक ट्यूपल को निर्धारित करने के लिए किया जाता है । एक सारणी में एक से अधिक यूनिक की हो सकती हैं । यूनीक की के लिए चुना गया फील्ड NULL वैल्यू स्वीकार कर सकता है ।


डेटाबेस की भाषाएँ ( Database Languages ) 

सैद्धान्तिक रूप से किसी दिए गए डेटा की उपभाषाएँ दो भाषाओं के समूह होती हैं

1. डेटा डेफिनिशन लैंग्वेज ( Data Definition Language - DDL )

यह भाषा डेटाबेस ऑब्जेक्ट्स ( Database objects ) की विशेषताओं को परिभाषित करती है , इसका उपयोग डेटा स्ट्रक्चर , सारणी व्यू आदि को परिभाषित करने हेतु होता हैं ।

2. डेटा मैनिपुलेशन लैंग्वेज ( Data Manipulation Language )

यह भाषा DDL के द्वारा परिभाषित ऑब्जेक्ट्स को मैनिपुलेट करती है या प्रोसेस करती है । इसका प्रयोग डेटा को जोड़ने मिटाने ( Deletion ) , सुधारने ( Modification ) सारणी से सूचना को पुनः प्राप्त ( Retrieve ) करने के लिए होता है ।


एंटिटी - रिलेशनशिप मॉडल ( Entity - Relationship Model )

एंटिटी - रिलेशनशिप मॉडल ( E - R Mode ) का प्रयोग डेटाबेस के सन्दर्भ में एंटिटीज ( Entities ) तथा उनके बीच के सम्बन्ध को ग्राफिकल ( Graphical ) रूप में प्रदर्शित करने के लिए किया जाता है । इसे एंटिटी - रिलेशनशिप डायग्राम ( E - R Diagram ) भी कहा जाता है ।

E - R मॉडल से सम्बन्धित पदों का विवरण निम्नलिखित है

1. एंटिटी ( Entity )

यह वास्तविक दुनिया की वस्तुओं को दर्शाती है । यह उन सभी वस्तुओं को सम्मिलित करती है जिनके बारे में डेटा एकत्रित किया जाना है , एंटिटी रिलेशनशिप डायग्राम मे इसे आयताकार बॉक्स के द्वारा दर्शाया जाता है । उदाहरण के लिए , Customer buys items , यहाँ पर Customer और items एंटिटी हैं।

2. एट्रिब्यूट्स ( Attributes )

यह एक एंटिटी की विशेषताओं और गुणों का वर्णन करता है । सारणी में एट्रिब्यूट्स को फील्डों द्वारा दर्शाया जाता है । E - R डायग्राम में एट्रिब्यूट्स को दीर्घ वृत्ताकार बॉक्स में दर्शाया जाता है । उदाहरण के लिए , ItemID और Price एंटिटी ITEM के एट्रिब्यूट्स हो सकते हैं ।

3. रिलेशनशिप ( Relationship )

यह एंटिटिज के मध्य परस्पर सम्बन्धों को दर्शाता है । यह E - R डायग्राम में डायमण्ड की आकृति वाले बॉक्स के द्वारा दर्शाया जाता है । उदाहरण के लिए , 

रिलेशनशिप ( Relationship )

दिए गए चित्र में , Customer और Items एंटिटी है । यहाँ पर Name तथा Address , Customer के और Itemld तथा Price , Items के एट्रिब्यूट्स है , और Buys , customer तथा Items के बीच रिलेशनशिप को दर्शा रहा है ।

एंटिटी सेट ( Entity Set )

एक ही प्रकार की विशेषताओं या गुणों वाली एंटिटीज के सेट को एंटिटी सेट कहते हैं । उदाहरण के लिए , Students डेटाबेस में उपस्थित सभी Students एंटिटीज का एक एंटिटी सेट है ।

एंटिटी सेट दो प्रकार के होते हैं


1. स्ट्रॉन्ग एंटिटी सेट ( Strong Entity Set )

ऐसा एंटिटी सेट , जिसमें प्राइमरी की फील्ड होता है , स्ट्रॉन्ग एंटिटी सेट कहलाता है ।


2. वीक एंटिटी सेट ( Weak Entity Set )

ऐसा एंटिटी सेट , जिसमें प्राइमरी की बनाने के लिए पर्याप्त नहीं होते हैं , वीक एंटिटी सेट कहलाता है । 


इन्हें भी जानें

1. डेटाबेस व्यवस्थापक ( Database Administrator ) यह एक कम्प्यूटर में प्रशिक्षित व्यक्ति होता है जो डेटाबेस के उपयोग को अधिकृत करने के लिए , समन्वित करने के लिए और इसके उपयोग को मॉनीटर ( Monitor ) करने के लिए जिम्मेदार होता है । यह सॉफ्टवेयर तथा हार्डवेयर को प्राप्त करने के लिए भी जिम्मेदार होता है । इसे DBA भी कहा जाता है 

2. स्कीमा ( Schema )

यह डेटाबेस की एक लॉजिकल संरचना ( Logical Structure ) है ।

3. इन्स्टैन्स ( Instance )

एक विशेष समय पर डेटाबेस में संग्रहीत जानकारी का संग्रह डेटाबेस का इन्स्टैन्स कहलाता है ।

4. डेटा माइनिंग ( Data Mining )

डेटा माइनिंग अलग - अलग दृष्टिकोण ( Perspective ) से डेटा का विश्लेषण करने और उपयोगी जानकारी में बदलने की प्रक्रिया है । कभी - कभी इसे Data or Knowledge Discovery भी कहा जाता है ।

डॉ . ई एफ कॉड ( Dr. E. F. codd ) ने वर्ष 1970 में रिलेशनल डेटाबेस प्रबन्धन प्रणाली के लिए 12 नियम प्रस्तुत किए थे ।

5. डेटा मॉडल ( Data Model )

यह डेटा , डेटा के बीच सम्बन्ध , बाध्यताएँ ( Constraints ) सीमेण्टिक्स ( Semantics ) आदि का वर्णन करने के लिए वैचारिक उपकरणों ( Conceptual Tools ) का एक समूह होता है ।

सामान्यतः यह तीन प्रकार का होता है ।

1. रिलेशनल डेटा मॉडल ( Relational Data Model )

2. नेटवर्क डेटा मॉडल ( Network Data Model )

3. हैरार्रिकल डेटा मॉडल ( Hierarehical Data Model )


तो दोस्तों, कैसी लगी आपको हमारी यह पोस्ट ! इसे अपने दोस्तों के साथ शेयर करना न भूलें, Sharing Button पोस्ट के निचे है। इसके अलावे अगर बिच में कोई समस्या आती है तो Comment Box में पूछने में जरा सा भी संकोच न करें। धन्यवाद !

Post a Comment

0 Comments
* Please Don't Spam Here. All the Comments are Reviewed by Admin.

If you liked the information of this article, then please share your experience by commenting. This is very helpful for us and other readers. Thank you

If you liked the information of this article, then please share your experience by commenting. This is very helpful for us and other readers. Thank you

Post a Comment (0)
!
Our website uses cookies to enhance your experience. Learn More
Accept !

Adblocker detected! Please consider reading this notice.

We've detected that you are using AdBlock Plus or some other adblocking software which is preventing the page from fully loading.

We don't have any banner, Flash, animation, obnoxious sound, or popup ad. We do not implement these annoying types of ads!

We need money to operate the site, and almost all of it comes from our online advertising.

×