Mavzu: Muddatli vazn va vektor makon modeli
Reja:
Term chastotasi (TF) vateskari chastota (IDF)
1. Parametrik va zona indekslari
Xulosa
9.31M

Muddatli vazn va vektorli makon

1. Mavzu: Muddatli vazn va vektor makon modeli

Eshniyazova Nodira

2. Reja:

1.Parametrik va zona indekslari
2.Terminning chastotasi va vazni
3.TF-IDF vazni
4.Vektor Fazo Modeli

3. Term chastotasi (TF) vateskari chastota (IDF)

TF
so‘z hujjatda
necha marta
uchragani.
IDF
so‘z boshqa
hujjatlarda
qanchalik kam
uchrashi.
TF-IDF
so‘zning
ahamiyatini
o‘lchaydi
• Axborot izlash tizimlarida hujjatlarni tegishlilik darajasi bo‘yicha baholash.
• Maqsad – aniq va tez qidiruvni ta’minlash.

4. 1. Parametrik va zona indekslari

Parametrik indekslar (Parametric
Indexes) hujjatga tegishli
strukturali meta-ma‘lumotlarni
(muallif, nashr yili, hujjat turi, til)
indekslaydi. Bu qiymatlar so‘rovga
mos kelishini tekshirish uchun
ishlatiladi.
Masalan, foydalanuvchi “Muallif:
AlisherNavoiy VA Nashr yili: 1980 dan
katta” deb so‘rov berishi mumkin. Zona
indekslari (Zone Indexes) hujjatning
matnli qismlarini (“Sarlavha”,
“Abstrakt”, “Asosiy matn”, “Ilovalar”)
alohida indekslaydi, har bir zona uchun
alohida e‘lonlar ro‘yxati yaratiladi.

5.

Og‘irlangan zona reytingi (Weighted Zone
Scoring) zona ahamiyatiga qarab vazn
beradi.
Masalan, sarlavhadagi so'z
English     Русский Правила