एन-ग्राम

मुक्त ज्ञानकोश विकिपीडिया से
नेविगेशन पर जाएँ खोज पर जाएँ

कम्प्यूटेशनल भाषाविज्ञान भाषण के दिए गए नमूने से एन वस्तुओं का एक सन्निहित अनुक्रम है। आइटम एप्लिकेशन के अनुसार स्वर, शब्दांश, अक्षर, शब्द या आधार जोड़े हो सकते हैं। N -gram या भाषण कॉर्पस से एकत्र किए जाते हैं। जब आइटम शब्द होते हैं, तो n -gram को दाद भी कहा जा सकता है   । [१]

लैटिन संख्यात्मक उपसर्गों का उपयोग करते हुए, आकार 1 के एन -ग्राम को "यूनीग्राम" कहा जाता है; आकार 2उपसर्ग, इस तरह के "मोनोमर", "डिमर", "trimer", "टेट्रामर" के रूप में "पेंटामेर", आदि, या अंग्रेजी कार्डिनल संख्या, "एक-मेर", "दो-मेर", "तीन-मेर", आदि।

  1. Broder, Andrei Z.; Glassman, Steven C.; Manasse, Mark S.; Zweig, Geoffrey (1997). "Syntactic clustering of the web". Computer Networks and ISDN Systems. 29 (8): 1157–1166. doi:10.1016/s0169-7552(97)00031-7.