Seznami

V vrstici pod glavnim menijem imamo dve možnosti:

    • Vse besede: izdela frekvenčni seznam besed v korpusu.
    • Vse leme: izdela frekvenčni seznam lem (osnovnih oblik besed) v korpusu.

Pod Možnosti seznamov besed lahko izberemo dodatne kriterije za izdelavo seznama:

  • Podkorpus (na voljo samo pri nekaterih korpusih): izberemo ali izdelamo podkorpus, na podlagi katerega bomo izdelali seznam.
  • Išči atribut: določimo enega od pozicijskih atributov ali lastnosti besedil za izdelavo seznama.

Primer (korpus Šolar):
Želimo pridobiti seznam števila različnih tipov napak:

  1. Pri opciji Išči atribut izberemo “Tip napake” in kliknemo na Izdelaj seznam.
  2. Dobimo seznam, kjer so tipi napak razvrščeni po frekvenci.


Možnosti filtriranja

Uporabimo, ko želimo določiti dodatne pogoje za besede oz. ostale atribute na seznamu:

  • RE vzorec: (regularni izraz): Namesto poljubnega niza črk lahko uporabimo niz znakov .* (pika zvezdica).
    • Primerregularni izraz anti.* vrne seznam besed z zadetki antičen, antibiotik, antiteza …           
  • Minimalna frekvenca: določimo minimalno frekvenco besed na seznamu.
  • Poišči besede: naložimo seznam vnaprej izbranih besed, za katere želimo izvedeti frekvenco v korpusu.
  • Izloči besede: naložimo seznam besed, ki jih ne želimo na izpisanem seznamu.
  • če obkljukamo kvadratek Upoštevaj nebesede, bo seznam vključeval ločila, simbole ipd.


Možnosti izpisa

Pri možnosti Frekvenčne vrednosti lahko spremenimo mersko enoto seznama. Izbiramo lahko med številom besed, številom besedil in povprečno reducirano frekvenco. Povprečna reducirana frekvenca zmanjša pomembnost besede, če se beseda pojavlja večkrat v določenem obsegu, npr. v enem dokumentu.

Na voljo so trije Načini izpisa:

  • Enostavno (privzeta nastavitev)
  • Ključne besede: za izdelavo seznama ključnih besed na podlagi primerjave korpusa z referenčnim korpusom ali podkorpusom.
  • Večnivojsko: če želimo imeti v seznamu dodatne informacije za glavni atribut (npr. za besede lahko izberemo še podatek o lemi).

Primer (korpus Šolar):
Želimo pridobiti seznam števila besedil po regijah:

  1. Pri opciji Išči atribut izberemo “Regija”.
  2. Pri opciji Frekvenčne vrednosti izberemo “Število besedil”
  3.  Kliknemo na Izdelaj seznam.
  4. Dobimo seznam regij, razvrščenih po številu besedil (od tiste z največ besedile do tiste z najmanj).