मंगलवार, अप्रै 23

  •  
  •  
आप यहाँ हैं:घर परियोजनाएँ हिंदी कॉर्पोरा

हिंदी कॉर्पोरा परियोजना

सूचना प्रौद्योगिकी मंत्रालय की 'भारतीय भाषाओं में प्रौद्योगिकी विकास' संबंधित योजना के अंतर्गत केंद्रीय हिंदी संस्थान में वर्ष 1991 में "हिंदी कॉर्पोरा परियोजना" का प्रारंभ किया गया था। इस परियोजना के अंतर्गत संस्थान में वर्ष 1991 में 1991 से 1993 के बीच हिंदी के तीस लाख शब्दों का कॉर्पोरा विकसित किया गया। इस कार्य में 1980 से 1989 तक के साहित्य को आधार बनाकर विभिन्न विषयों एवं उप-विषयों की सामग्री संकलित की गई। इस कार्य में आई.आई.टी, दिल्ली का सहयोग लिया गया। तदनंतर समस्त कॉर्पोरा भारतीय भाषा संस्थान, मैसूर को अनुरक्षण एवं टैगिंग के लिए दे दिया गया। 1991 में सूचना प्रौद्योगिकी मंत्रालय ने आग्रह किया कि संस्थान हिंदी कॉर्पोरा को भारतीय भाषा संस्थान, मैसूर से लेकर टैगिंग का कार्य पूरा करे। संस्थान ने ई.आर. एण्ड डी.सी.आई., नोएडा को सहयोगी एजेंसी बनाकर यह कार्य प्रारंभ किया। विभिन्न कार्यशालाओं के आयोजन के माध्यम से हिंदी कॉर्पोरा का प्रूफ-शोधन किया गया और उसकी टैगिंग के नियम तैयार किए गए। इन नियमों का कंप्यूटरीकरण ई.आर. एण्ड डी.सी.आई., नोएडा ने किया एवं इसकी सी.डी. तैयार कर सूचना प्रौद्योगिकी मंत्रालय को प्रस्तुत की गई। इस कॉर्पोरा के आधार पर इंडैक्स, विषयानुकूल बारंबारता आधारित कॉर्पोरा को विकसित करना है।

परियोजना के दूसरे चरण में संस्थान ने अपने संसाधनों से इस कॉर्पोरा को दो करोड़ शब्दों तक ले जाने का कार्य प्रारंभ किया है। वर्तमान में यह परियोजना भारतीय भाषा संस्थान, मैसूर के सहयोग से संचालित की जा रही है। वित्तीय वर्ष 2005-06 में इस कार्य को चरणबद्ध तरीके से प्रारंभ किया गया है।

परियोजना के संचालन के लिए निम्नलिखित क्रियाविधि निर्धारित की गई हैं-

पहले चरण में पूर्व विकसित हिंदी कॉर्पोरा में अपनाए गए सिद्धांतो के परिप्रेक्ष्य में आवश्यकतानुसार संशोधन किये जाएंगे। यह कार्य संस्थान के अध्यापकों एवं कुछ बाहय विशेषज्ञों (भारतीय भाषा संस्थान, मैसूर) द्वारा कार्यशाला के आधार पर किया जाएगा ।
कॉर्पोरा के लिए सामग्री इनपुट का कार्य संस्थान में तथा बाहर से पारिश्रमिक देकर कराया जाएगा ।
इनपुट किये गये कारपोरा के शोधन का कार्य संस्थान से कराया जाएगा। ।
इस परियोजना में कार्य करने वाले 'परियोजना सहायक' कार्य करेंगे।
शोधित कॉर्पोरा के बाद कॉर्पोरा की टैगिंग का कार्य कार्यशाला पद्धति के आधार पर भाषा विशेषज्ञों एवं परियोजना सहायकों से संपन्न कराया जाएगा।
पहले लगभग 50,000 शब्दों के आधार पर टैगिंग नियमों का निर्माण किया जाएगा एवं उसका कंप्यूटीकरण किया जाएगा ।
विभिन्न विषयों के अनुसार कॉर्पोरा की सी.डी. का निर्माण एवं बारंबारता के आधार पर 20 मिलियन कारपोरा में आए शब्दों का चयन किया जाएगा।
इसके आधार पर आगे भाषा अनुप्रयोग परक कार्य किए जा सकेंगे।
यह परियोजना तीन वर्षो में छह अर्धवार्षिक चरणों में पूरी की जाएगी। परियोजना के लिए रूपये 37,92000/- संस्थान की शासी परिषद द्वारा स्वीकृत किए जा चुके हैं।