Kolokacije

Funkcijo Kolokacije uporabimo za izdelavo seznama besed, katerih frekvenca pojavljanja v okolici iskanega niza je statistično pomembna.

Za izdelavo seznama izberemo enega od atributov:

  • beseda (privzeto)
  • oznaka (oblikoskladenjska oznaka besede v korpusu)
  • število (ednina, dvojina, množina, nedoločeno)
  • sklon (imenovalnik, rodilnik …)
  • lema-besedna_vrsta (npr. krona-s pomeni, da gre za samostalnik krona)
  • lema (osnovna oblika besede)
  • lema-z_malo (osnovna oblika besede, zapisana z malo začetnico)
  • z_malo (beseda, napisana z malo začetnico)

Z razponom določimo širino okolice, v kateri se iščejo kolokacijski kandidati. Privzeta nastavitev je -5 (5 pojavnic pred iskanim nizov) do 5 (5 pojavnic za iskanim nizom).

Zadetke lahko omejimo z določitvijo:

  • minimalne frekvence kolokacije v korpusu; in
  • minimalne frekvence kolokacije v danem razponu.

Nadalje lahko izberemo različne statistike za izpis ter statistiko, po kateri naj bodo rezultati razvrščeni.


Primer:
Zanimajo nas vsi kolokacijski kandidati, ki se pojavljajo takoj za pridevnikom dober.

  1. Izberemo atribut “lempos” (oziroma “lema-besedna_vrsta”). Tako bo vsaki kolokaciji pripisana tudi besedna vrsta.
  2. Določimo razpon 0 do 1.
  3. Pustimo privzeti nastavitvi za minimalne frekvence in privzete nastavitve za statistiko.
  4. Kliknemo na Izdelaj seznam.
  5. Zadetki so odvisni od korpusa, ampak na seznamu v korpusu FidaPLUS so besede oz. samostalniki jutro, volja, rezultat, prijatelj ipd.