Naslov (hrvatski) | Hrvatska valencijska baza |
Naslov (engleski) | Valence Database of Croatian |
Autor | Anita Peti Stantić Filozofski fakultet Sveučilišta u Zagrebu Faculty of Humanities and Social Sciences, University of Zagreb |
Autor | Mirjana Tonković Filozofski fakultet Sveučilišta u Zagrebu Faculty of Humanities and Social Sciences, University of Zagreb |
Autor | Mateusz-Milan Stanojević Filozofski fakultet Sveučilišta u Zagrebu Faculty of Humanities and Social Sciences, University of Zagreb |
Autor | Jelena Tušek Filozofski fakultet Sveučilišta u Zagrebu Faculty of Humanities and Social Sciences, University of Zagreb |
Znanstveno / umjetničko područje, polje i grana | HUMANISTIČKE ZNANOSTI Filologija Opće jezikoslovlje (lingvistika) |
Sažetak (hrvatski) | Hrvatska valencijska baza je skup od ukupno 1000 riječi hrvatskoga jezika, i to imenica, glagola i pridjeva. Ta je baza podskup Hrvatske psiholingvističke baze objavljene u okviru projekta Modeliranje mentalne gramatike hrvatskoga: ograničenja informacijske strukture.
Riječi je moguće pretraživati na temelju objektivnih uvjeta kao što su vrsta riječi, duljina riječi, rod i živost imenica, čestoće riječi u internetskom korpusu hrvatskoga jezika hrWaC, kao i na temelju psiholingvističkih karakteristika – konkretnosti, predočivosti, dobi usvajanja i subjektivnoj čestoći. Uz to, riječi u ovoj bazi je moguće pretraživati i na temelju procijenjene valencije i pobuđenosti. Hrvatska valencijska baza nastala je kao rezultat sveučilišne potpore Modeliranje psiholingvističkih mjera valencije i pobuđenosti u hrvatskom jeziku dodijeljene na Filozofskom fakultetu Sveučilišta u Zagrebu (https://www.croris.hr/projekti/projekt/11421). |
Sažetak (engleski) | The Valence Database of Croatian consists of 1000 nouns, verbs and adjectives of Croatian. It is a subset of the Croatian Psycholinguistic Database, which was published within the project entitled The Building Blocks of Croatian Mental Grammar: Constraints of Information Structure. Words can be searched based on objective characteristics such as word class, word length, grammatical gender, animacy, frequency in the hrWaC corpus of Croatian, as well as based on psycholinguistic characteristics – concreteness, imageability, age of acquisition and subjective frequency. The Valence Database of Croatian adds valence and arousal to these characteristics. The database is an outcome of the project Modeling psycholinguistic measures of valence and arousal in the Croatian language financed by the Faculty of Humanities and Social Sciences, University of Zagreb (https://www.croris.hr/projekti/projekt/11421). |
Metodologija (hrvatski) | Zbirka od 1000 imenica, glagola i pridjeva u Hrvatskoj valencijskoj bazi sastavljena je ekscerpiranjem riječi iz Hrvatske psiholingvističke baze te su preneseni objektivni podaci iz te baze. Leksemi su odabrani tako da je po čestoći uzeto prvih 200 imenica, glagola i pridjeva iz HPB-a, čime je oblikovan skup od 600 riječi kojem je, također iz HPB-a dodan razmjeran broj imenica, glagola i pridjeva odabran prema kriteriju vjerojatnosti da te riječi u psiholingvističkom ispitivanju budu označene kao riječi više valencije i pobuđenosti.
Šifre: vrsta rijeci – vrsta riječi (1 – imenice; 2 – glagoli; 3 – pridjevi); rod – rod (1 – muški; 2 – ženski; 3 – srednji); zivost – živost (0 – neživo; 1 – živo); broj.slova – broj slova; frek – čestoća iz hrWaC-a; frek.log – logaritmirana čestoća iz hrWaC-a; k.M - konkretnost (M); k.SD – konkretnost (SD); č.M – subjektivna čestoća (M); č.SD – subjektivna čestoća (SD); p.M – predočivost (M); p.SD – predočivost (SD); d.M - dob usvajanja (M); d.SD - dob usvajanja (SD); val.M – valencija (M); val.SD – valencija (SD); val.N – valencija (N); pob.M – pobuđenost (M); pob.SD – pobuđenost (SD); pob.N – pobuđenost (N); M – aritmetička sredina; SD – standardna devijacija; N – broj procjena |
Metodologija (engleski) | The 1000 nouns, verbs and adjectives in the Valence Database of Croatian were excerpted from the Croatian Psycholinguistic Database. All the objective characteristics were also transferred from the Croatian Psycholinguistic Database. A subset of 600 lexemes were selected by extracting the first most frequent 200 nouns, verbs and adjectives respectively. The remaining proportional number of nouns, verbs and adjectives were selected based on their potential to be estimated as higher in valence and/or arousal.
Codes: vrsta rijeci – word class (1 – nouns; 2 – verbs; 3 – adjectives); rod – grammatical gender (1 – masculine; 2 – feminine; 3 – neuter); zivost – animacy (0 – inanimate; 1 – animate); broj.slova – number of letters; frek – frequency in hrWaC; frek.log – logarithm of frequency in hrWaC; k.M – concreteness (M); k.SD – concreteness (SD); č.M – subjective frequency (M); č.SD – subjective frequency (SD); p.M – imageability (M); p.SD - imageability (SD); d.M – age of acquisition (M); d.SD - age of acquisition (SD); val.M – valence (M); val.SD – valence (SD); val.N – valence (N); pob.M – arousal (M); pob.SD – arousal; (SD) pob.N – arousal (N); M – mean; SD – standard deviation; N – number of estimates |
Jezik | hrvatski |
DOI | https://doi.org/10.17234/megahr.2025.hvb |
URN:NBN | urn:nbn:hr:131:053258 |
Datum objave | 2025 |
Projekt | Šifra: 11-935-1048 Naziv (hrvatski): Modeliranje psiholingvističkih mjera valencije i pobuđenosti u hrvatskom jeziku Naziv (engleski): Modeling psycholinguistic measures of valence and arousal in the Croatian language Kratica: VALE Voditelj: Anita Peti-Stantić Pravna nadležnost: Hrvatska Financijer: Filozofski fakultet u Zagrebu |
Izdavač | Filozofski fakultet Sveučilišta u Zagrebu University of Zagreb Faculty of Humanities and Social Sciences |
Prava pristupa | Otvoreni pristup |
Uvjeti korištenja | |
Datum i vrijeme pohrane | 2025-01-10 12:06:44 |