एन-ग्राम

मुक्त ज्ञानकोश विकिपीडिया से
नेविगेशन पर जाएँ खोज पर जाएँ
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

कम्प्यूटेशनल भाषाविज्ञान भाषण के दिए गए नमूने से एन वस्तुओं का एक सन्निहित अनुक्रम है। आइटम एप्लिकेशन के अनुसार स्वर, शब्दांश, अक्षर, शब्द या आधार जोड़े हो सकते हैं। N -gram या भाषण कॉर्पस से एकत्र किए जाते हैं। जब आइटम शब्द होते हैं, तो n -gram को दाद भी कहा जा सकता है   । [१]

लैटिन संख्यात्मक उपसर्गों का उपयोग करते हुए, आकार 1 के एन -ग्राम को "यूनीग्राम" कहा जाता है; आकार 2उपसर्ग, इस तरह के "मोनोमर", "डिमर", "trimer", "टेट्रामर" के रूप में "पेंटामेर", आदि, या अंग्रेजी कार्डिनल संख्या, "एक-मेर", "दो-मेर", "तीन-मेर", आदि।

  1. Broder, Andrei Z.; Glassman, Steven C.; Manasse, Mark S.; Zweig, Geoffrey (1997). "Syntactic clustering of the web". Computer Networks and ISDN Systems. 29 (8): 1157–1166. doi:10.1016/s0169-7552(97)00031-7.