Ebben a cikkben a Szókincsméretek összehasonlító listája izgalmas világába fogunk beleásni. Az eredetétől napjainkig minden olyan releváns szempontot megvizsgálunk, amelyek a Szókincsméretek összehasonlító listája fejlődését az idők során meghatározták. Elemezzük a társadalomra gyakorolt hatását, a különböző területekre gyakorolt hatását és a témával kapcsolatos különböző perspektívákat. Elmerülünk a sok oldalában, igyekszünk megérteni valódi lényegét és az életünkben betöltött szerepét. Csatlakozzon hozzánk ezen a felfedező és elmélkedő utazáson a Szókincsméretek összehasonlító listája-ről.
Ez a szócikk általános és speciális szótárak, valamint anyanyelvi és idegen nyelvi beszélők szókincsének méretét veti össze a lexémákat tekintve. (Nem kerülnek be tehát ide azok az adatok, amelyek a webkorpuszok méretét jelölik, azaz hogy hány szót dolgoztak fel, csak az, hogy hányféle szót találtak, nem számítva egy szó különböző előfordulásait és különböző alakjait.)
Ahol a szókincs értelme nincs megadva, ott az ún. aktív szókincset jelöli (tehát amit a beszélő nemcsak felismer, hanem használ is). A szótáraknál legalább hat tényező van, amelyek döntően befolyásolják az eredményt:
Ezek fényében az egyes adatok tényleges jelentése számottevően eltérhet.
1000 alatt | |
15 | Egy szöveg leggyakoribb szavai közül ennyi adja ki annak 25%-át.[1] |
100 | Egy szöveg leggyakoribb szavai közül ennyi adja ki annak 60%-át.[1] |
300 | Kb. egy 2 éves gyerek szókincse[2] |
500 | Kb. egy 2,5 éves gyerek szókincse[2] |
A Közös Európai Referenciakeret A1-es fokozatának, az ún. minimumszintnek megfelelő szókincs.[3] | |
850 | Az Ogden-féle egyszerű angol nyelv (Basic English) szókincse[4] |
920 | Kb. ennyi szógyököt tartalmazott az eszperantónak a Zamenhof által kidolgozott alapszókincse, amelyből több tízezer további szó képezhető (pl. a ’jó’ szóból ’rossz’, ’jóság’, ’javulni’ stb.).[5] |
1000 – 10 000 | |
1000 | Kb. egy 3 éves gyerek szókincse[2] |
Az 1000 leggyakoribb szó adja ki egy szöveg szavainak 85%-át.[1] | |
Az 1000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 64%-át fedi le.[6] | |
A Közös Európai Referenciakeret A2-es fokozatának, az ún. alapszintnek megfelelő szókincs (ez a B1-nek megfeleltetett alapfokú nyelvtudásnál eggyel alacsonyabb szint).[3][7] | |
1500 | Kb. egy 4 éves gyerek szókincse[2] Ez hátrányos helyzetű családok négyéves gyerekeinél csupán 600 is lehet, míg diplomás szülők azonos korú gyerekeinél a 2100-at is elérheti,[8] tehát a gyerekek szókincsére vonatkozó adatok csak tájékoztató jellegű középértékek, amelyek erősen függenek a családi körülményektől. |
2000 | Kb. egy 5 éves gyerek szókincse[2] |
Ennyi szót használnak az első osztályosok olvasástanításában.[9] | |
Az élő-aktív szókincs legszerényebb alsó határa épelméjű felnőtt embereknél[10] | |
A Longman Dictionary of Contemporary English angol egynyelvű szótár ennyi szót használ fel szótári definícióiban.[11] | |
A 2000 leggyakoribb szóval egy szöveg 90%-át megértjük; ekkora szókinccsel és a tulajdonnevek ismeretével pedig 93,7%-ot.[12] | |
A 2000 leggyakoribb szóval egy átlagos szöveg 80%-át értjük meg; a források szerint ennyire van szükség egy szöveg lényegének megértéséhez.[7] | |
A 2000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 72%-át fedi le.[6] | |
A Közös Európai Referenciakeret B1-es fokozatának, az ún. küszöbszintnek megfelelő szókincs; ez a magyarországi rendszerben az alapfokú nyelvtudásnak felel meg.[3][7] | |
2100-2300 | B2-es szintű nyelvtanulók szókincse olaszból, ill. németből vagy angolból[13] |
2500 | Kb. egy 6 éves gyerek szókincse[2] |
Egy szöveg leggyakoribb szavai közül ennyivel (pontosabban 2600-zal) szavainak 96%-át megértjük.[12] | |
3000 | Kb. egy 7 éves gyerek szókincse[2] |
A 3000 leggyakoribb szóval egy szöveg 95%-át megértjük, s ez az arány szükséges ahhoz, hogy a kontextusból a többire is következtetni tudjunk.[12] | |
A 3000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 77%-át fedi le.[6] | |
Megközelítőleg Katona József Bánk bán c. művének szókincse (egész pontosan: 2882).[9] | |
Arany János Toldi c. művében felhasznált szókincse (egész pontosan: 3059).[9] | |
Jean Racine összes tragédiáját állítólag ennyi szó felhasználásával írta.[14][15] | |
3000– 5000 |
Az átlagember aktív szókincse (élő-aktív és szunnyadó-aktív)[10] |
3500– 3900 |
A Közös Európai Referenciakeret által Görögországban és Magyarországon B2-ként értékelt, az ún. középszintnek megfelelő szókincs; ez a magyarországi rendszerben a középfokú nyelvtudásnak felel meg.[7] |
3762– 5576 |
Agatha Christie egy regényének szókincse (15 műve alapján)[16] |
4000 | Kb. egy 9 éves gyerek szókincse[2] |
A 4000 leggyakoribb szó adja ki egy szöveg szavainak 97,5%-át.[1] | |
4353[17][18] 4735[18] |
Balassi Bálint műveiből kimutatható szókincse |
5000 | Kb. egy 11 éves gyerek szókincse[2] |
Az 5000 leggyakoribb szóval egy szöveg 98,5%-át megértjük.[12] | |
Az 5000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 82%-át fedi le.[6] | |
5000– 10 000 |
Az átlagember passzív szókincse[10] |
6000 | Ennyi szóval a Shreket 95%-ban megértjük.[19] |
6000– 8000 |
A leggyakoribb szavak közül ennyivel egy átlagos szöveg 95-98%-át értjük meg; a források szerint ennyire van szükség egy szöveg lényegében teljes megértéséhez.[7] |
6882[9] 7824[18] |
Zrínyi Miklós összes műveiből kimutatható szókincse |
8000– 9000 |
Ennyi szó szükséges a 20. századi angol próza megértéséhez.[19] |
8000– 10 000 |
A klasszikus vagy bibliai héber nyelv szókincse, a gyökök számolásától függően.[20] |
9812 | Csokonai Vitéz Mihály színműveiből kimutatható szókincse[21] |
10 000 – 100 000 | |
10-12 ezer | Ennyi szóval a tankönyveket 95%-ban megértjük[19] |
10-20 ezer | Az egyes nyelvek beszélői legfeljebb ennyi szót használnak[22] |
10-30 ezer | Egy kétnyelvű kisszótár terjedelme (címszók),[23] Magay Tamás szerint kb. 20 000[24] |
11 606 | Juhász Gyula verseiből kimutatható szókincse[22] |
16 000 | Arany János műveiben használt egyedi szótövek száma – megelőzve Vörösmartyt (12e), Babitsot (11e), Adyt (10,4e), Petőfit (9,6e) és József Attilát (8,2e)[25] |
Az ókori egyiptomi nyelv legteljesebb szótárának, a Wörterbuch der ägyptischen Sprachénak a terjedelme | |
A 18 éves korukig vagy tovább az oktatásban részt vevő angol anyanyelvű beszélők legalább ennyi szócsaládot (szótövet) ismernek[26] | |
18 és 25 ezer között | Shakespeare (műveiben felhasznált) szókincsét ennyire becsülik (a konkrét érték attól függ, melyik kutató mit számít önálló szótári szónak; a kiindulás 29 066 különböző szóalak)[27] |
22 719[9] 23 ezernél több[17][18] |
Petőfi Sándor verseiből kimutatható szókincse |
25 ezer | Arany János (műveiben felhasznált) szókincsét kb. ekkorára becslik[17][28] |
25-30 ezer | Egy átlag értelmiségi egyévi beszédét gondolatban rögzítve kb. ennyiféle szó fordulna elő.[29] |
30-40 ezer | „az igen választékosan fogalmazó, nyelvi leleményekkel is megáldott írók 30-40 ezer szót használnak”[30] |
35-80 ezer | Egy kétnyelvű kéziszótár terjedelme (címszók)[31] |
40-45 ezer | Jókai Mór (műveiben felhasznált) szókincsének becsült mérete[17][18] |
45 ezer | Ennyi szó fordul elő a 100 millió szavas Brit Nemzeti Korpuszban; a ritkábbak már vagy archaikusak, vagy szakkifejezések.[32] |
50-60 ezer | Igen művelt embereknél a passzív szókincs nagysága[10] |
60 ezer | Kb. ennyi címszót tartalmaz egy középszótár Magay Tamás szerint[24] |
60-100 ezer | Kb. ennyi mai magyar szót tartanak számon.[29] |
75 ezer | Ennyi szó jelentését magyarázza meg az új Magyar értelmező kéziszótár (ezek között már szakszavak és rétegnyelvi szavak is szerepelnek).[22][33] |
87 000 | A Grand Larousse terjedelme (címszók, 2005-ös kiadás)[34] |
88 431 | A Spanyol Királyi Akadémia hivatalos értelmező szótára 22. kiadásának terjedelme (címszók).[35] |
100 000 – 1 000 000 | |
100 ezer | A francia Trésor de la langue française informatisé terjedelme (címszók)[36] |
Egy nagyszótár címszóanyagának alsó határa Magay Tamás szerint[24] | |
110 ezer | A 18 kötetesre tervezett A magyar nyelv nagyszótára tervezett terjedelme (címszók)[37] |
120 ezer[22][38] 130 ezer[39] 135 ezer[40] 190 ezer[41] |
Egy kétnyelvű nagyszótár terjedelme (címszók) |
171 476 | A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásából (1989) a ma is használt szavak száma[42] |
291 500 | A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásának (1989) terjedelme (címszók)[43] |
350 ezer | A 33 kötetes Deutsches Wörterbuch terjedelme (1960-as kiadás, címszók)[44] |
több mint 450 000 | A Webster’s Third New International Dictionary, Unabridged terjedelme (címszók)[45] |
mintegy 600 000,[46] ill. 750[47]–800[48] ezer |
Az 1772 és 2000 közötti időszak magyarul publikált szókészlete, amelynek szűréséből A magyar nyelv nagyszótára 110 ezer szavas anyagát összeállítják. |
615 100 | A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásának (1989) terjedelme (definiált szóalakok száma)[43] |
1 000 000 és fölötte | |
1 millió | Ennyi angol szót tartanak számon[49][50] |
2 millió | A magyar nyelvben kb. ennyi szó (lexéma!) van (túlnyomórészt elavult vagy rendkívül speciális szavak)[22] |
7,2 millió | Az 1,48 milliárd szövegszót (v. szóelőfordulást) tartalmazó magyar webkorpusz 4%-os hibatűréssel készült metszetéből kinyert szókincs mérete (lexémák, ill. szótári szavak), kézi ellenőrzés nélkül[51] |