N-gram berarti urutan N kata. Jadi misalnya, "Blog sedang" adalah 2 gram (bigram), "Pos blog sedang" adalah 4 gram, dan "Tulis di Media" adalah 3 gram (trigram). Yah, itu tidak terlalu menarik atau mengasyikkan.
Berapa ukuran n gram??
Di bidang linguistik komputasi dan probabilitas, n-gram adalah urutan n item yang berdekatan dari sampel teks atau ucapan yang diberikan. ... Menggunakan awalan numerik Latin, n-gram ukuran 1 disebut sebagai "unigram"; ukuran 2 adalah "bigram" (atau, lebih jarang, "digram"); ukuran 3 adalah "trigram".
Apa itu vektor n-gram?
n-gram digunakan untuk menggambarkan objek sebagai vektor. ... Misalnya, salah satu kegunaan yang paling umum adalah untuk mendefinisikan ukuran kesamaan antara dokumen tekstual berdasarkan penerapan fungsi matematika untuk representasi vektor dokumen.
Apa itu karakter n-gram??
Karakter n-gram ditemukan dalam dokumen teks dengan merepresentasikan dokumen sebagai urutan karakter. N-gram ini kemudian diekstraksi dari urutan ini dan model dilatih. Ada sejumlah model berbeda untuk ini, tetapi model standar sangat mirip dengan model bag-of-words yang telah kita gunakan sebelumnya.