मशीनी लिप्यन्तरण

मुक्त ज्ञानकोश विकिपीडिया से
नेविगेशन पर जाएँ खोज पर जाएँ

कम्प्यूटर सॉफ्टवेयर की सहायता से एक भाषा या लिपि के शब्दों का किसी दूसरी भाषा या लिपि में ध्वन्यात्मक (फोनेटिक) परिवर्तन मशीनी लिप्यन्तरण (मशीन ट्रान्सलिटरेशन) कहलाता है। John को देवनागरी/हिन्दी में जॉन लिखना लिप्यन्तरण का एक उदाहरण है।

उपयोग

  • कम्प्यूटर के इस युग में मशीनी अनुवाद के साथ-साथ मशीनी लिप्यन्तरण आजकल बहुत उपयोगी हो गया है। मशीनी अनुवाद करते समय जिन शब्दों के तुल्य शब्द मशीन के शब्दकोश में नहीं मिलते (Out of vocabulary words) उनको कुछ नियमों का पालन करते हुए केवल लिप्यन्तरित कर दिया जाता है। अधिकतर लिप्यन्तरण सेवाएँ वेब आधारित हैं।
  • नामवाचक संज्ञाओं (प्रॉपर नाउन्स) का लिप्यन्तरण ही करना पड़ता है। जैसे Mc Donald को मैक डोनाल्ड लिखना पड़ता है।
  • कुछ तकनीकी शब्दों का अनुवाद करने के बजाय उन्हें केवल लिप्यन्तरित करना बेहतर माना जाता है। जैसे transistor को ट्रान्जिस्टर लिखना अधिक उचित होगा न कि transistor लिखना।
  • भारतीय भाषाओं में अधिकांश शब्द समान हैं किन्तु भिन्न लिपि में लिखे होने के कारण उन्हें पढकर समझना/सीखना कठिन होता है। इनका केवल लिप्यन्तरण कर देने से दूसरी भारतीय भाषा समझने व सीखने में बहुत अधिक सुविधा मिल जाती है।

मशीनी लिप्यन्तरण की विधियाँ

  • 1) ध्वन्यात्मक प्रतिरूपण (फोनीनिक मैपिंग)
  • 2) शब्दकोश में शब्दयुग्म देखकर
  • 3) मशीन शिक्षण द्वारा (मशीन लर्निंग बेस्ड)
  • 4) नियमाधारित (रूल-बेस्ड)

विभिन्न भारतीय भाषी लिप्यन्तरण सेवाएँ

भारतीय भाषाऔं में लिप्यन्तरण सेवा सर्वप्रथम लॅटिन कीबोर्ड से विभिन्न लिपियौं मे "ध्वन्यात्मक" कीकोड के रूप में विकास हुआ (उदाहरण "ka" दबाने पर "क" टाइप होना)। इस प्रकार के लिप्यन्तरण का विकास भारतीय युनिकोड से पूर्व ही हो चुका था। यह विकास प्राथमिक रूप में लैटिन कीबोर्ड से भारतीय ट्रेडिसनल फॉण्ट के सरल एण्ट्री के निमित्त विकसित हुआ था। भारतीय लिपियौं में अन्तर-लिप्यन्तरण इस के बाद विकसित हुआ।

सर्वप्रथम भारतीय यान्त्रिक लिप्यन्तरण का विकास किस ने किया था, इस के बारे में आधिकारिक तथ्य उपलब्ध नहीं है। परन्तु अन्तरजाल के फैलाव व भारतीय युनिकोड के विकास के बाद भारतीय यान्त्रिक लिप्यन्तरण में एक प्रकार का उर्जा निर्माण कर दिया।

अन्तर-भारतीय भाषाओं के मशीनी लिप्यन्तरण में कन्नड-प्रमुख बरह सॉफ्टवॅर नें युनिकोड सहित विभिन्न ट्रेडिसनल फन्ट में यान्त्रिक लिप्यन्तरण का सुबिधा उपलब्ध किया है। खुला स्रोत के आलोक कुमार द्वारा विभिन्न भारतीय भाषाओं के मध्य टैक्स्ट के लिप्यंतरण के लिए गिरगिट नाम से तन्त्र बनाया गया था जो बहुत प्रसिद्ध रहा। इसके पश्चात पीयूष भट्ट जी द्वारा भोमियो नामक वेबसाइट बनायी गयी जो कि किसी वेबपेज के लिपि को रियल टाइम में बदल कर दिखाता था। यह सेवा हिन्दी चिट्ठाकारों में काफी लोकप्रिय हुई। परन्तु कुछ समय बाद यह सेवा बन्द हो गई। इसके पश्चात आलोक कुमार तथा डॉ विपुल जैन ने गिरगिट का नया संस्करण बनाया जो कि टैक्स्ट के अतिरिक्त वेबपेज की लिपि भी बदल कर दिखा सकता है। नवम्बर 2009 में गूगल ने भी विभिन्न भारतीय भाषाओं के मध्य लिप्यन्तरण सेवा का आरम्भ किया जिसमें कि कई लिपियाँ सम्मिलित हैं।

बाहरी कड़ियाँ

लेख

  • MACHINE TRANSLITERATION IN JAVA - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) के बारे में विस्तृत विचार किया गया है और एक आनलाइन लिप्यन्तरण प्रोग्राम भी है।

लिप्यंतरण यन्त्र