X

Bhasha Proudyogiki ka Parichay

By Dr. C. Jaya Sankar Babu   |   Pondicherry University
Learners enrolled: 109
हम आपस में विचार-विनिमय के लिए भाषा का प्रयोग करते हैं ।  मानव भाषा की कई विशिष्टताएँ हैं ।  मानव भाषा के वैज्ञानिक अध्ययन के लिए भाषाविज्ञान का विकास हुआ है ।  भाषाविज्ञान के अनुसार भाषा मानव की अर्जित संपत्ति है ।  अर्थात् भाषा को हम सप्रयास अभ्यास से सीखते हैं ।  आज हम कई कार्यों में कंप्यूटर का प्रयोग कर रहे हैं ।  कंप्यूटर की भाषिक क्षमता के विकास का कार्य भाषा-प्रौद्योगिकी के माध्यम से किया जाता है ।  यह एक अंतर्विषयी ज्ञान शाखा है ।  इसमें भाषाविज्ञान और कंप्यूटर विज्ञान के अनुप्रयोग से कंप्यूटर भाषिक क्षमता विकसित करने का प्रयास किया जाता है ।  इसे 'कंप्यूटरीय भाषाविज्ञान' भी कहा जाता है ।  कंप्यूटर की भाषिक क्षमता के विकास की प्रक्रिया को 'प्राकृतिक भाषा संसाधान' के रूप में माना जाता है ।  तकनीकी परिवेश की दृष्टि से मानव भाषा को ही 'प्राकृतिक भाषा' कहा जाता है ।  कंप्यूटर की भाषिक क्षमता के विकास का कार्य-क्षेत्र प्राकृतिक भाषा संसाधन (Natural Lanugage Processing) के रूप में माना जाता है ।  

 कंप्यूटरीय परिवेश में मानव भाषा के प्रयोग के लिए तथा कंप्यूटर को मानव भाषा के सभी दृष्टियों से प्रयोग में कुशल बनाने के लिए विकसित ज्ञान की शाखा भाषा-प्रौद्योगिकी है ।  कंप्यूटरीय भाषविज्ञान के सैद्धांतिक सूत्रों के आधार पर व्यावहारिक भाषिक मॉडल विकसित करते हैं ।  भाषा-संसाधन कार्यों को सफलतापूर्वक सुसंपन्न करने में 'प्राकृतिक भाषा संसाधन' की बड़ी भूमिका है ।  कंप्यूटर तथा वेब पर उपलब्ध भाषिक सामग्री के संसाधन के लिए हमें अपेक्षित सॉफ्टवेयर उत्पादों के विकास के लिए प्राकृतिक भाषा-संसाधन का सहारा लेने की ज़रूरत पड़ती है । 

 प्राकृतिक भाषा संसाधन भाषा-प्रौद्योगिकी आधारित कंप्यूटरीय भाषावैज्ञानिक प्रक्रिया होने की वजह से इससे कंप्यूटर की भाषिक क्षमता  विकासित करने का प्रयास किया जाता है ।  चूँकि भाषा-प्रौद्योगिकी के विकास में विभिन्न ज्ञान की शाखाओं के विशेषज्ञों की आवश्यकता है, और इन विशेषज्ञों को भाषा प्रौद्योगिकी के विकास के लिए अपेक्षित ज्ञान, कुशलताओं की भी बड़ी ज़रूरत है ।  कंप्यूटर प्रौद्योगिकी विशेषज्ञों के साथ भाषा-वैज्ञानिकों, भाषिक प्रयोग व्यवहार ज्ञान के विशेषज्ञों को काम करने की ज़रूरत है ।  विभिन्न भाषाओं के लिए भाषा प्रौद्योगिकी के विकास के लिए कुशल जनबल की ज़रूरत है जो उन भाषाओं में प्रवीण होने के साथ-साथ भाषा प्रौद्योगिकी के मूलभूत सिद्धांतों, कंप्यूटरीय भाषाविज्ञान, प्राकृतिक भाषा संसाधन की तमाम प्रक्रियाओं, उद्देश्यों, लक्ष्यों से भली-भाँति परिचित हो ।  प्राकृतिक भाषा संसाधन के कार्यों के ज्ञाता होने से वे अपनी भूमिका भली-भाँति निभा सकते  हैं ।  ऐसे कुशल जनबल को तैयार करने की दृष्टि से 'भाषा-प्रौद्योगिकी का परिचय' के शीर्षक से यह पाठ्यक्रम विकसित किया गया है ।  

 केवल सैद्धांतिक बातों तक सीमित न होकर इसमें ठोस उत्पादों, सुविधाओं की भी चर्चा शामिल है, जिसकी वजह से औसत छात्र भी इस विषय की ओर आकर्षित हो सकता है ।  भाषा-प्रौद्योगिकी संबंधी चेतना और कुशलताओं को विकसित करने के लिए उत्सुक छात्र इस पाठ्यक्रम में शामिल हो सकते हैं ।  कंप्यूटर व भाषा संबंधी सामान्य परिचय से शुरू करके हम भाषा-प्रौद्योगिकी का विषय-ज्ञान हासिल करने में आगे बढ़ेंगे ।

MOOC on BHASHA PROUDYOGIKI KA PARICHAY is developed with a motive to develop awareness of the following broad areas: 

1. कंप्यूटर – भाषा – सूचना एवं संचार प्रौद्योगिकी
2. कंप्यूटरीय भाषाविज्ञान का परिचय
3. प्राकृतिक भाषा संसाधन की भूमिका
4. कंप्यूटरीय भाषाविज्ञान के उत्पादों का सामान्य परिचय
5. हिंदी के लिए कंप्यूटरीय भाषाविज्ञान के उत्पाद

(Topics covered are specified in the Detailed Course Syllabus)

पाठ्यक्रम के उद्देश्य 

  •  भाषा-प्रौद्योगिकी की अवधारणा, उद्देश्य लक्ष्यों से अवगत कराना
  • भाषा-प्रौद्योगिकी के विकास में भाषाविज्ञान के ज्ञान की उपयोगिता की जानकारी देना
  •  भाषावैज्ञानिक सिद्धांतों के आधार पर कंप्यूटरीय परिवेश में भाषिक पहलुओं पर प्रभाव से संबंधित जानकारी देना
  • प्राकृतिक भाषा संसाधन की अवधारणा स्पष्ट करना तथा इसमें कृत्रिम बुद्धि की भूमिका को स्पष्ट करना
  • प्राकृतिक भाषा संसाधन के कार्यों, प्रक्रियाओं और उत्पादों से संबंधित तार्किक ज्ञान प्रदान करना
  •  हिंदी भाषा के लिए प्राकृतिक भाषा संसाधन के द्वारा विकसित उत्पादों, सुविधाओं की जानकारी देना
  •  हिंदी तथा अन्य भारतीय भाषाओं के भाषा-प्रौद्योगिकी उत्पादों के विकास में सरकारी तथा निजी प्रयासों के संबंध में जानकारी देना

अध्ययन के परिणाम
भाषा-प्रौद्योगिकी का परिचय पाठ्यक्रम के अध्ययन के बाद छात्र...

  • भाषाविज्ञान की अनुप्रायोगिक शाखा के रूप में कंप्यूटरीय भाषाविज्ञान के विकास की जानकारी दे पाएंगे
  • कंप्यूटरीय अनुप्रयोगों के लिए उपयुक्त भाषिक मॉडलों के विकास की प्रेरणा हासिल करेंगे
  •  कृत्रिम बुद्धि के अनुप्रयोगों की जानकारी दे पाएंगे
  •  प्राकृतिक भाषा संसाधन के क्षेत्र में अपनी भूमिका निभाने के लिए आवश्यक चेतना प्राथमिक कुशलताएँ हासिल कर पाएंगे
  • भाषा-प्रौद्योगिकी के क्षेत्र में उच्च स्तरीय ज्ञान उन्नत कुशलताएँ हासिल करने की प्रेरणा हासिल करेंगे
  • इस ज्ञान के क्षेत्र में रोज़गार के लिए प्रयास कर सकेंगे
Summary
Course Status : Upcoming
Course Type : Elective
Language for course content : Hindi
Duration : 15 weeks
Category :
  • Language
Credit Points : 5
Level : Undergraduate
Start Date : 13 Jan 2025
End Date : 30 Apr 2025
Enrollment Ends : 28 Feb 2025
Exam Date : 18 May 2025 IST
NCrF Level   : 5.5
Shift :

Shift I

Note: This exam date is subject to change based on seat availability. You can check final exam date on your hall ticket.


Page Visits



Course layout

WEEK 1         भाषा-प्रौद्योगिकी का सामान्य परिचय
                       कंप्यूटर का सामान्य परिचय
                       भाषा चिंतन 
                       सूचना एवं संचार प्रौद्योगिकी

WEEK 2  देवनागरी लिपि की  कंप्यूटरीय अनुकूलता के प्रयास
                       हिंदी भाषा का कंप्यूटरीय अनुकूलता के प्रयास
                       कंप्यूटरीय भाषाविज्ञान
                      

WEEK 3          भाषावैज्ञानिक चिंतन परंपरा 
                रूपवैज्ञानिक विश्लेषण - 1          
                रूपवैज्ञानिक विश्लेषण - 2 
                        रूपवैज्ञानिक विश्लेषण - 3            
  
WEEK 4 वाक्यगत विश्लेषण: व्याकरणिक कोटियाँ – 1
              वाक्यगत विश्लेषण: व्याकरणिक कोटियाँ – 2
                वाक्यगत विश्लेषण: व्याकरणिक कोटियाँ – 3
                        वाक्यगत विश्लेषण: व्याकरणिक कोटियाँ – 4                   
                
WEEK 5 अर्थ विज्ञान के कंप्यूटरीय पहलू – 1
                अर्थ विज्ञान के कंप्यूटरीय पहलू – 2
                अर्थ विज्ञान के कंप्यूटरीय पहलू – 3
                   
WEEK 6          प्राकृतिक भाषा संसाधन की अवधारणा – 1
                        प्राकृतिक भाषा संसाधन की अवधारणा – 2
                                     
WEEK 7 कृत्रिम बुद्धि का परिचय – 1
                        कृत्रिम बुद्धि का परिचय – 2

WEEK 8 प्राकृतिक भाषा संसाधन के सामान्य कार्य - 1 
                     प्राकृतिक भाषा संसाधन के सामान्य कार्य – 2
                        प्राकृतिक भाषा संसाधन के सामान्य कार्य - 3
                    प्रा.भा.सं. के अनुप्रयोगों का वर्गीकरण          

WEEK 9 शब्द-संसाधन प्रणालियाँ – 1                           शब्द-संसाधन प्रणालियाँ – 2      
                    
WEEK 10 पाठ विश्लेषण व अन्य प्रौद्योगिकीय प्रणालियाँ - 1
                        पाठ विश्लेषण व अन्य प्रौद्योगिकीय प्रणालियाँ - 2
                        वाक् विश्लेषण व अन्य प्रौद्योगिकीय प्रणालियाँ - 1     
                        वाक् विश्लेषण व अन्य प्रौद्योगिकीय प्रणालियाँ - 2
                         
WEEK 11 सूचना प्रत्ययन, सूचना निष्कर्षण एवं विशेषज्ञता प्रणालियाँ – 1
                        सूचना प्रत्ययन, सूचना निष्कर्षण एवं विशेषज्ञता प्रणालियाँ – 2
                        सूचना प्रत्ययन, सूचना निष्कर्षण एवं विशेषज्ञता प्रणालियाँ – 3

WEEK 12        मशीनी अनुवाद प्रणालियाँ – 1
                        मशीनी अनुवाद प्रणालियाँ – 2
                       
WEEK 13       हिंदी में भाषा-प्रौद्योगिकी के विकास में सरकारी प्रयास -1
                       हिंदी में भाषा-प्रौद्योगिकी के विकास में सरकारी प्रयास -2
                       हिंदी में भाषा-प्रौद्योगिकी के विकास में सरकारी प्रयास-3
                       हिंदी में भाषा-प्रौद्योगिकी के विकास में निजी प्रयास
                                           
WEEK 14 हिंदी में भाषा-प्रौद्योगिकी के विकास में निजी प्रयास
                        हिंदी शब्द-संसाधन प्रणालियाँ – 1
                        हिंदी शब्द-संसाधन प्रणालियाँ – 2
                        
WEEK 15       हिंदी लिप्यंतरण एवं अनुवाद प्रणालियाँ - 1
                       हिंदी लिप्यंतरण एवं अनुवाद प्रणालियाँ - 2
                       हिंदी प्राकृतिक भाषा संसाधन के औज़ार - 1
                       हिंदी प्राकृतिक भाषा संसाधन के औज़ार - 2
                       भाषा-प्रौद्योगिकी के क्षेत्र में रोज़गार की संभावनाएँ

Books and references

Books:
Alexander Clark, Chris Fox, and Shalom Lappin (Editors), The Handbook of Computational Linguistics and Natural Language Processing, A John Wiley & Sons, Ltd., Publication, 2010
Christopher Manning and Hinrich Schutze. Foundations of Statistical Natural Language Processing. MIT Press, Cambridge, MA, 1999
D. Jurafsky, J. H. Martin, and A. Kehler, Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition, MIT Press, 2008.
Igor Bolshakov, Alexander Gelbukh, Computational Linguistics: Models, Resources, Applications, Instituto Politecnico Nacional, Tresguerras, DF, 2004
Kavi Narayana Murthy, Natural Language Processing – An Information Access Perspective, Ess Ess Publications, New Delhi, 2006
Nitin Indurkhya, Fred J. Damerau (Editors), Handbook of Natural Language Processing (Second Edition), MIT, 1999
Noam Chomsky, Syntactic Structures, The Hagues, Mouton, 1957
Ralph Grishman, Computational Linguistics: An Introduction, Cambridge University Press, 1986
Ron Cole (Editor in Chief), Survey of the State of the Art in Human Language Technology, Cambridge University Press and Giardini 1997

कृष्ण कुमार गोस्वामी, अनुवाद विज्ञान की भूमिका, राजकमल प्रकाशन, नई दिल्ली 2008
जय शंकर बाबु सी., भाषा प्रौद्योगिकी, दूरस्थ शिक्षा निदेशालय, पांडिच्चेरी विश्वविद्यालय, पांडिच्चेरी, 2014
पांडेय शशिभूषण ‘शीतांशु’, अद्यतन भाषाविज्ञान, लोकभारती प्रकाशन, इलाहाबाद, 2012
पांडेय शशिभूषण ‘शीतांशु’, भाषा-विमर्श नव्य भाषावैज्ञानिक संदर्भ, वाणी प्रकाशन, नई दिल्ली, 2013
भोलानाथ तिवारी, भाषाविज्ञान, किताब महल, इलाहाबाद, 1988
रामकिशोर शर्मा, भाषा-चिंतन के नए आयाम, लोकभारती प्रकाशन, इलाहाबाद, 2010
विजय कुमार मल्होत्रा, कंप्यूटर के भाषिक अनुप्रयोग, वाणी प्रकाशन, नई दिल्ली, 1998

वेब लिंक
http://cdac.in
http://ildc.in
http://tdil.mit.gov.in
http://www.cs.nyu.edu/cs/faculty/grishman/NEtask20.book_2.html
http://alias-i.com/lingpipe/demos/tutorial/posTags/readme.html
http://www.comp.leeds.ac.uk/eric/comp3310
http://www.nltk.org

Instructor bio

Dr. C. Jaya Sankar Babu

Pondicherry University
Course Developer Dr. C. Jaya Sankar Babu is the Head of the Department of Hindi, Pondicherry University (A Central University), Puducherry. He had 16 years of University level teaching experience, besides 10 year administrative and 15 year Journalism experience. Renowned for his dedication, he has significantly advanced skill development and employment opportunities for his students. As the Founder Editor of ‘Yug Manas’ and Chief Editor of ‘Antar Bharati’, he has contributed greatly to journalism research. His Digital Literacy Mission, launched in 1999, has conducted over 1,700 workshops. Dr. Babu has been honored with the Best Teacher Award from Pondicherry University on three occasions. He is being honoured with the National Award for Teachers 2024 for his outstanding contributions to education and nation-building.  Honourable President of India, Smt. Droupadi Murmu conferred the National Award on 5th September, 2024 in New Delhi. On this occasion, The Ministry of Education, Government of India hosted a video in Social media on his contributions. Link for MoE X:   

He had written 4 text books for the Directorate of Distance Education, Pondicherry University. One among these textbooks is entitled ‘Bhasha Proudyogiki’ which forms the basis for the MOOC on ‘Bhasha Proudyogiki ka Parichay’.  He has more than 100 research articles, 25 edited books, 45 book chapters to his credit. He is the member of editorial boards of many research journals and the member board of studies of various universities.  Considering his rich contributions to Hindi language, the Honourable Union Minister of Home Affairs has nominated him as a member of the Hindi Advisory Committee of the Ministry of Home Affairs, Government of India.

He has contributed ‘Cyber Discourse’ to the contemporary new discourses in Hindi literature. He had also successfully completed one UGC - Major Research Project on ‘ICT for Development of Hindi: Using ICT for Teaching Learning Hindi Language and Literature’ and MHRD – SPARC International Collaborative Project on ‘The history of Hindi: from Apabhramsa to early modern vernacular’. He has guided 8 scholars for Ph.D. (Awarded) out these for 3 as co-guide. Guided 4 scholars for M.Phil. and for more than 40 PG Dissertations.  Topics of research are of National interest covering journalistic discourse, endangered languages, E-content development for Divyang, ICT for teaching and learning, Tribal, Dalit and Folk Literature, Environment discourses etc.  He has delivered many lectures in various futuristic research areas in UGC-MMTTCs (formerly UGC-HRDCs) of many universities.

He has been advocating the offering of education through Indian Languages.  He has floated 33 multi-disciplinary technical and job oriented courses at Higher Education level in Hindi in the Pondicherry University viz. Language Technology, New Media Studies, Multilingual Computing, Cyber Criticism, Digital Humanities etc. and wrote text books in Hindi Medium.  This is in tandem to the vision and mission of National Education Policy 2020.

MOOC on ‘Introduction to Language Technology’ developed by Dr. Babu is a multidisciplinary skill oriented introductory course covers many aspects of Language Technology, right from the linguistic discourse to NLP, Generative AI etc., including various products and its development in India particularly for Indic computing visualizes the capacity building of the knowledge and skill enhancement of the learners and aspirations for their employability and career development.  

Course certificate

Course Certificate: To obtain Course Certificate: 30 marks will be allocated for Internal Assessment, and 70 marks will be allocated for end term proctored examination. Securing 40% in both separately is mandatory to pass the course and get Credit Certificate.


MHRD logo Swayam logo

DOWNLOAD APP

Goto google play store

FOLLOW US