TEORIO
DE INFORMACIO
KAJ MEZURADO DE LINGVA
MALFACILECO
I
La celo de tiu chi
ellaborajho estas pli ekzakte montri la diferencojn,
pro kiuj iuj lingvoj estas pli malfacilaj kaj iuj pli
facilaj por lerni. Pri tio ekzistas diversaj opinioj
de chiutagaj laikaj ghis fakaj, sed ankorau ne
efektivighis esploroj, kiuj tion pruvus au sugestus
al ni metodon, per kiu eblus fari tion, krom kelkiu
eksperimento de paralela lernado de diversaj lingvoj.
Chi tiuj eksperimentoj observis grupojn da lernantoj
kaj post iom da lernotempo per testoj kontrolis la
diferencojn rilate la sciojn pri du au pli da
lingvoj. Oni konstatis diferencojn, sed ne gravajn.
Samtempe ekzistas che la lingvistoj opinioj diversaj
de tiuj, kiuj agnoskas grandajn diferencojn ghis
tiuj, kiuj trovas, ke la diferencoj entute ne
ekzistas.
Nuntempe la nura
teorio, kiu ebligas al ni apliki matematikon en
lingvaj esploroj estas la teorio de informacio. Ghi
fiksis iujn bazajn leghojn, lau kiuj oni difinas la
nocion "informacio" kaj montras la
matematikan manieron kalkuli kvanton da informoj en
teksto au en iu ajn mesagho de iu ajn kodo. Necesas
do memorigi, ke - plej simple dirite - informacio
estas probableco de aperado de unuopaj
mesaghelementoj. Alivorte, informacio estas tio, kio
estas novajho, ghis nun nekonata mesaghero. Se iu
mesagho aperas pli ofte (ties probableco de apero
estas pli granda), la informkvanto estas malgranda.
Se ion ni ekscias la duan, trian au dekan fojon, tio
vere ne plu estas informo por ni. Problemo ekestas en
la momento, kiam oni starigas la demandon pri
lingvoelementoj, kiuj enhavas plenan informacion?
Nuntempe oni opinias, ke tio estas vorto, kaj tial
oni plej ofte nombras vortkvanton en iu teksto
(frekvencon) kaj tiel kalkulas informkvanton, kiun
entenas unuopa vorto. Shajnas, ke en tio kushas la
chefa manko de la apliko de la informaciteorio en
lingvistiko. Char tiamaniere kalkulante la
informkvanton (en la vortoj) oni atingas absurdajn
konkludojn, ke la plej frekvencaj vortoj estas la
plej malinformaj, el kio sekvas, ke necesas lernante
fremdajn lingvojn antau chio lerni maloftajn
vortojn. Ja ili estas pli informaci-plenaj, dum la
oftajn (chiutagajn) oni traktu kun malpli da intereso
(vidu lit. 1).
La tezo, kiun mi chi
tie prezentas estas, ke la baza mesaghelemento
portanta informacion ne estas la vorto, sed la frazo
(au "frazemo" lau la difino en lit. 2.,
lau kiu frazemo povas esti kaj ununura vorto kaj
pluraj). La ofteco de la apero de vortoj, morfemoj
au fonemoj ne havas influon al la informkvanto en iu
mesagho, char temas simple nur pri elementoj, partoj,
per kiuj oni konstruas la informacion, do ili estas
brikoj el kiuj konsistas frazemo kiel elementa
informacio. Nur ofta aperado de sama frazo (frazemo)
prezentas ripetadon de malnova informo. Ni montru
tion per ekzemplo: Se ni uzas lauvice la jenajn du
frazojn:
a) En la skatolo estas
taso.
b) En la taso estas
skatolo.
ni vidas ke chi tie ni
uzis tute samajn vortojn kaj morfemojn, nur iom
alimaniere distribuitajn. Se la informkvanto
trovighus en vortoj au morfemoj, la dua frazo estus
ripeto, do ne enhavus informon: 1 = 0, char aperas la
samaj vortoj refoje. Sed se kiel elementon de
informacio ni konsideras la frazon, tiukaze la dua
frazo estas komplete nova informacio.
Informacio do ne estas
malofteco (nerekonebleco) de figuroj, sed malofteco
(noveco) de kombinoj inter la laueble konataj kaj
fikse difinitaj figuroj. Informplena estas tio, kion
oni eksplikas per laueble konataj, kiel eble plej
fikse interkonsentitaj rimedoj (signoj), sed per
reguloj, kiuj permesas maksimume grandan kvanton
dakombinoj inter tiuj signoj (ebligas maksimume
grandan nombron da neatenditaj, novaj rilatoj):
Do, se la informacion
de teksto oni povas mezuri nur lau la probableco de
aperado de frazoj, tiam estas klare, ke principe
ekzistas tre malmulta seninforma materialo en
tekstoj, char tute samaj frazoj malofte aperas.
Krome, mezuri kaj kalkuli informkvanton je tiu chi
maniero eblus nur en ege granda teksto, kio estas tre
malfacila tasko. Sed en chi tiu studo mi uzos chi
tiun komprenon de informacio kiel aksiomon por apliki
la teorion kaj por montri, kiom iu signosistemo estas
kapabla generi lingvajn frazojn kaj chu por atingi la
saman efekton (informkvanton) estas necesa pli au
malpli granda strecho de la cerbo.
II
Lingvo kiel kodo estas
aro da reguloj, lau kiuj oni produktas frazemojn kaj
ili portas iun informkvanton.
Reguloj, kiuj havas
limigojn (esceptojn) igas la kodon (lingvon) malpli
kapabla por senlima kombinado kaj tio signifas:
ebligas havante la saman nombron da konstruelementoj
(vortoj, kiuj plu konsistas el morfemoj) malpli
grandan kvanton da frazemoj ol reguloj sen esceptoj.
Lingvoj kun multegaj regulesceptoj (kun t.n.
malfacila gramatiko) estas pli malekonomiecaj, car
por konstrui certan nombron da pleninformaj frazemoj
ili bezonas pli da konstruelementoj kaj pli da
reguloj ol tiuj, kiuj havas regulojn kun malpli da
esceptoj. Ni provu montri tion matematike:
A-sistemo: konsistas
el 4 konstruelementoj: A, B, C, D.
Regulo: Chiu
konstruelemento (vorto) estas signo por unu
informacio (frazemo).
Ni prenu nun hazardan
vicon el 16 frazemoj:
A:B:C:A:C:B:D:D:A:A:A:B:D:D:A:B:
Informacio (au
informkvanto) en tiu chi frazemo estas kalkulata lau
la formulo:
H = -N S p1 log2 p1
P1 = pA + pB + pC + pD
pA =
0,371 IIog2(6/16)I =
0,37 (4 - 2,45) = 0,5735
pB =
0,25Ilog2(l/4)I =
0,25 x 2 = 0,5
pC =
0,125I log,(l/8) I = 0,125 x 3 = 0,375
PD = PB = 0,5
S p1 =
0,5735 + 0,5 + 0,375 = 0,5 + 1,9485
H= 16 x 1,9485 =
31,176 bitoj
Se ni deziras
elkalkuli maksimuman informkvanton, kiun povas doni
la sumo de 16 konstruelementoj en tiu chi sistemo, ni
devas uzi la jenan formulon:
Hmax =
N log2 n (N = nombro da frazemoj; n =
nombro da konstruelementoj)
Hmax
=16 log2 4 = 16 x 2 = 32 bitoj.
Tiu chi sistemo estas
maksimume eluzita, char oni aplikas la regulon sen
esceptoj, sed maksimuma informkvanto estas malgranda
pro la malgranda kvanto da konstruelementoj.
B-sistemo: konsistas
el kvar konstruelementoj: A, B, C, D.
Regulo: Po 2
konstruelementoj inter si kombinataj prezentas unu
frazemon (informacion).
Se ni denove prenas
hazardan vicon el 16 frazemoj kiel ekz:
AB; CA; CB; DD; AA;
AB; DD; AB; BA; CA; BD; BD; DA; AB; CA; CC;
ni havos informkvanton
de 46,81 bitoj, dum la maksimuma ebla informkvanto
estos por tiu chi sistemo 64 bitoj.
C-sistemo: konsistas
el 4 konstruelementoj: A, B, C, D.
Regulo: Informacio
(frazemo) konsistas chiam el du vortoj kaj chiu el la
vortoj el po du konstruelementoj. Hazarda vico el 16
frazemoj en tiu chi sistemo kiel ekz:
BA AB; BB AA; BA BD;
AB DA; AB CC; DD BA; CC DD; AA CC; DABA; DD BA; BD
DA; DA DA; CC BA;AACC; CB DA; AACB;
enhavas informkvaton
kun 68 bitoj dum la maksimuma kvanto estas 128 bitoj.
Se ni daurigus
plivastigadi la sistemon, la informkvanto por la sama
nombro da frazemoj (16) estus chiam pli granda. Chiuj
prezentitaj sistemoj havas la ekonomiecon maksimuman,
char ili ne havas esceptojn de la reguloj kaj chiuj
kombinebloj estas permesitaj. Se ni dezirus por la
sistemo C elkalkuli kompletan informacion de la tuta
sistemo (do, se ni unu apud la alia vicigus chiujn
kombineblecojn sen unu nura ripeto, la rezulto estus,
ke tiu chi vico da frazemoj (entute 1.439.988) havus
informkvanton de 30.987.472 bitoj (2 x 16 x log2 (2 x 16 x log2 (2
x 16)).
Se al la sistemo C ni
almetas nur unu limigan regulon ekz: "Vortoj kun
du samaj konstruelementoj ne povas esti
uzatataj" (ekz. AA, BB, CC...), ni tuj havos
signifan malpligrandigon de eblaj kombinoj kaj tio
reflektighos al la totaleco de la sistemo tiel, ke
nun la maksimuma nombro da malsamaj frazemoj estus
49.152 kaj la kompleta informkvanto de tiuj frazemoj
chirkau 730.000 bitoj, t.s. ghi malpligrandighus al
nur 2,36% de la antauaj 100%. Chiu nova limigo ege
malrichigas kombineblecojn kaj la potencialon de
generado de grandaj informkvantoj.
Se per tia sistemo kun
limigoj ni deziras realigi la samajn kombineblecojn
kiel en tiu sen limigoj, ni devas aldoni
a) novajn regulojn por
plialtigo de la informkvanto au
b) pli da
konstruelementoj (vortoj kaj morfemoj).
Ekz. nova plia regulo
povus teksti: "Oni povas uzi ankau vortojn el
nur unu konstruelemento" (do nur A, B, C, D). En
tia okazo la informpotencialo de la tuta sistemo
refarighas same granda kiel antaue. Sekve: la saman
rezulton oni povas atingi nur per unu regulo (sen
esceptoj) au per tri reguloj: I baza regulo, II
escepta regulo, III aldona regulo. Estas evidente, ke
la unuan sistemon ni povas nomi pli ekonomieca kaj la
duan pli malekonomieca.
Kial en la t.n.
naturaj lingvoj (popolaj) ekestas esceptoj, t.e.
limigoj grandkvante? La kauzo estas ilia arbitra
t.e. neplana evoluo. Pro ekesto de novaj reguloj kaj
novaj vortoj okazas semantikaj kolizioj, t.e. aperas
formoj, kiuj ekhavas du au pli da diversaj signifoj,
kaj ne plu estas distingaj (Esperanta ekzemplo: unue
ekzistis "cigaro", sekve
"cigareto" estis eta cigaro. Poste oni
ekproduktis ion alian similan, kio ne estis eta
cigaro, sed ricevis la nomon cigareto kaj nun tiu
vorto havas du signifojn. Oni enkondukas novan
vorton, au esceptan afikson "cigaredo".
Ekzemplo en la kroata: Malnova vorto "kost"
= osto en instrumentalo havas la formon
"kostima" = kun ostoj. Poste envenas la
lingvon latina vorto "kostim" = kostumo,
kies genitivo estas "kostima" = de
kostumo(j) kaj jen la formo "kostima" havas
tute du diversajn signifojn, kvankam ambau konstruas
siajn morfologiajn formojn tute lau normalaj
gramatikaj reguloj. Se tiuj du formoj praktike neniam
aperas en frazo unu apud la alia, kio kauzus
neklarecon, oni ne faras shanghon. Alikaze oni
enkondukus regulescepton: la normala genitiva finajho
"a" shanghighus al io alia. En la slovena
lingvo trovighas interesa ekzemplo: la formoj
"moram" = "mi devas" kaj
"morem" = "mi povas" estas en la
elparolo tiel similaj, ke oni ofte miskomprenis. Pro
tio oni enkondukis esceptan sistemon che la verbo
povi: en pozitiva prezenco oni ne plu diras
"morem" (mi povas"), sed oni uzas
adverbon "lahko" = "facile" plus
alia verbo en prezenco. Ekz. "Lahko kupim = Mi
facile achetas = Mi povas acheti", sed negativa
prezenco restas senshangha: "Ne morem." =
Mi ne povas. ). Por ke ne suferu la chefa lingva
funkcio: la komunika, la distinga, unu el la reguloj
devas ricevi esceptan subregulon au oni devas
enkonduki novan vorton. Planlingvo povas tion
grandparte eviti.
Se chion tion ni
provas apliki nur je hazardaj ekzemploj komparante po
du lingvojn, ni ricevos ekz.:
Ekzemplo A-1:
a) angla:
Regulo: Ekzistas
substantivoj kaj adjektivoj samformaj
Limigo: Por scii, kio
estas substantivo kaj kio adjektivo estas fiksita
vortordo tiel, ke la unua vorto chiam estas
adjektivo.
Eblecoj: Per 100
adjektivoj kaj 100 substantivoj (t. e. 200 morfemoj)
eblas konstrui 10.000 stilkombinojn.
b) Esperanto:
Regulo: La sama radiko
havas en la kazo de adjektivo finajhon A kaj en la
kazo de substantivo la finajhon O.
Limigo: Ne ekzistas.
Eblecoj: Per 98
radikoj kaj 2 finajhoj (t.e. 100 morfemoj) eblas
konstrui 39.644 stilkombinojn.
Ekzemplo A-2:
Analizo de prezenco
por 48 verboj, kiuj apartenas al la plej fekvencaj en
la kroata kaj Esperanto:
a) kroata :
Elektitaj verboj
estas: biti (esti), dati (doni), vidjeti (vidi), ichi
(iri), imati (havi), mochi (povi), raditi (labori,
fari), morati (devi), htjeti (voli), dochi (veni),
zeljeti (deziri), razumijeti (kompreni), trebati
(bezoni), izgledati (aspekti, shajni), znati (scii),
gledati (rigardi), govoriti (paroli), kretati (movi),
pomochi (helpi), dozvoliti (permesi), predlagati
(proponi), pocheti (komenci), zavrshiti (fini),
ostati (resti), vjerovati (kredi), misliti (pensi),
gurati (pushi), nachi (trovi), zhaliti (bedauri),
baviti se (okupighi), bojati se (timi), primiti
(akcepti, preni), odluchiti (decidi), slati (sendi),
nadati se (esperi), dogoditi se (okazi), jesti
(manghi), kazati (diri), spavati (dormi), padati
(fali), smjeti (rajti), kupovati (acheti), sjediti
(sidi), trazhiti (serchi), slijediti (sekvi), uchiti
(lerni), stajati (stari), pisati (skribi).
REGULOJ:
(Por preciza analizo
de la nombro de necesaj reguloj plej bone konvenus la
metodo de transforma gramatiko efektivigante per
derivadoj kaj transformadoj algoritmojn, sed chi tie
mi ne uzos ghin, sed la pli simplan priskriban
analizon, kiu tamen parte konsideras la principojn de
la transforma gramatiko - char tiel ni ricevos pli
travideblan kaj mallongan superrigardon, sufichan por
la ilustro)
1. Divido de chiuj
verboj je tiuj kun 2 gramatikaj aspektoj (finita kaj
infinita) kaj je tiuj, kiuj tion ne havas. Tiu
disdividregulo havas 21 algoritmojn (subregulojn), char
oni devas lerni aparte 21 verbojn, kiuj havas du
aspektojn, sekve la aliaj 27 ne havas tion.
2. Verboj kun
I-finajho en prezenco:
vid-im, rad-im, zhel-im,
govor-im, misl-im, zhal-im, bav-im se, boj-im se,
sjed-im, trazh-im, stoj-im, slijed-im, nalaz-im,
uch-im, dogod-im se, (do kun 15 subalgoritmoj
lernendaj)
3. Verboj, kiuj havas
E-finajhojn:
id-em, daj-em, dod-em,
razumij-em, krech-em, pomazh-em, pochinj-em,
ostaj-em, vjeruj-em, nad-em, odluchuj-em, shalj-em,
smij-em, kazh-em, jed-em, kupuj-em, pish-em (17
subalgoritmoj)
4. Verboj kun
A-finajhoj:
im-am, mor-am,
treb-am, izgled-am, zn-am, gled-am, dozvoljav-am,
zavrshav-am, gur-am, prim-am, pad-am, nad-am se,
spav-am (13 subalgoritmoj).
5. sam (mi estas)
6. hochu (mi volas)
7. mogu (mi povas)
8. unua persono de singularo ricevas finajhon M
9. dua persono de singularo ricevas finajhon SH
10. tria persono de singularo ne ricevas finajhon
11. unua persono de pluralo ricevas la finajhon MO
12. dua persono de pluralo ricevas la fmajhon TE
13. tria persono de pluralo de verboj kun I-finajhoj
ricevas la finajhon E
14. tria persono de pluralo de verboj kun E-finajho
ricevas la finajhon U
15. tria persono de pluralo de verboj kun A-finajho
ricevas la finajhon JU
16. SI (vi estas)
17. JE (li/shi/ghi estas)
18. SMO (ni estas)
19. STE (vi estas)
20. SU (ili estas)
21. HOCHESH (vi volas)
22. HOCHE (li, shi, ghi volas)
23. Pluralo de "voli" lau la reguloj 11,
12 kaj 14
24. MOZHESH (vi povas)
25. MOZHE (li, shi, ghi povas)
26. pluralo de "povi" lau la reguloj 11
kaj 12.
27. MOGU (ili povas)
28. Konstruado de la prezenca bazo: vidjeti kaj zheljeti
- oni forigas JE (2 subalgoritmoj)
29. Konstruado de la prezenca bazo: oni forigas I che
raditi, govoriti, misliti, zhaliti, baviti se,
sjediti, trazhiti, nalaziti, slijediti, uchiti,
dogoditi se (11 subalgoritmoj)
30. Konstruado de prezenca bazo: oni forigas A- che
bojati se
31. Konstruado de prezenca bazo: oni forigas A kaj
shanghas la radikon che stajati al STOJ
32. Konstruado de prezenca bazo: oni enmetas J che
ostati kaj dati (2 subalgoritmoj)
33.Konstruado de prezenca bazo: G transformighas al ZH
kaj oni forigas A che pomagati kaj predlagati (2
subalgoritmoj)
34. Konstruado de prezenca bazo: ICHI trasformighas
al ID
35 Konstruado de prezenca bazo: oni aldonas D che
dochi kaj nachi (2 subalgoritmoj)
36. Konstruado de prezenca bazo: restas neshanghita
che razumijeti
37. Konstruado de prezenca bazo: che kretati
tranformighas al KRECH
38 Konstruado de prezenca bazo: pocheti al POCHINJ
39. Konstruado de prezenca bazo: oni forigas OV kaj
anstatauigas ghin per UJ che vjerovati kaj kupovati
(2 subalgoritmoj)
40. Konstruado de prezenca bazo: odluchiti al ODLUCHUJ
41. Konstruado de prezenca bazo: slati al SHALJ
42. Konstruado de prezenca bazo: smjeti al SMIJ
43. Konstruado de prezenca bazo: kazati al KAZ
44. Konstruado de prezenca bazo: jesti al JED
45. Konstruado de prezenca bazo: pisati al PISH
46. Konstruado de prezenca bazo: che chiuj verboj kun
finajho A oni forigas el la infinitivo ATI
47. Al verboj bojati, baviti, nadati, dogoditi oni
aldonas en chiuj formoj kroman vorteton SE. (4
subalgoritmoj)
En la kazo, ke oni
volas lerni ankau la duan verban aspekton che
verboj, kiuj ghin havas necesus aldoni pliajn 30-40
regulojn. Do, por plene regi nur la prezencon de la
menciitaj 48 verboj en la kroata estas necese
komputile aranghi minimume 80 bazajn algoritmojn
(regulojn) kaj pliajn minimume 100 subalgoritmojn.
b) Esperanto
Ekzistas nur unu
regulo por chiuj verboj (ne nur por 48 elektitaj): la
finajho AS. Do, se oni volas lerni prezencon de chiuj
verboj en Esperanto necesas lerni nur unu regulon.
Ekzemplo A-3:
Komparo de konstruado
de chiuj verbaj tempoj en la kroata kaj Esperanto:
Char la intenco de chi
tiu laborajho estas nur ilustri la diferencojn, mi ne
klopodos nun montri detalojn, char por tio necesus
tuta libro, sed simpligite mi mencios nur la esencajn
trajtojn de ambau lingvoj:
a) kroata
En la kroata lingvo
ekzistas 7 verbaj tempoj, kiujn oni konstruas per
kvar helpverboj kaj tri specoj de finajhoj, krome
ekzistas pliaj tri tipoj de finajhoj depende de genro
(en perfekto) kaj po 6 finajhoj por chiu gramatika
persono dividita je 22 specoj kaj klasoj kun multegaj
esceptoj. En preskau duono de chiuj verboj ekestas
ankau shanghoj en la verbaj radikoj (lit. 5).
Se chion tion oni
transformus al derivaj kaj transformadaj algoritmoj
je limigita korpuso de 1000 verboj ni ricevus
amasegon el pli ol 10.000 bazaj algoritmoj kaj
ankorau multe pli da subalgoritmoj.
Do, per kelkdek mil
reguloj ni konstruas 7 verbajn tempojn de 1000
kroataj verboj.
b) Esperanto
En Esperanto al la
radiko oni almetas tri finajhojn por tri bazaj tempoj
(por chiuj gramatikaj personoj same). Kombinante kun
unu helpverbo kaj aldonaj tri participaj fmajhoj ni
ricevas 9 kompleksajn aktivajn tempojn.
Do la sistemo el 7
morfemoj (helpverbo kaj 6 gramatemoj) sen esceptoj
realigas entute 12 verbajn tempojn (3 bazajn kaj 9
kompleksajn) nelimigite por chiuj verboj de la
lingvo.
Sekve, la ekonomieco
estas tre diference distribuita lau la lingvoj. Tio
esence ne gravas che la gepatra lingvo, char ghin ni
lernas automate en la infaneco kaj la homa cerbo
havas tiomegan kapaciton, ke ghi povas lerni multe
pli ol estas la plej komplikaj lingvoj (kvankam oni
povas diri, ke la pli komplikaj lingvoj prezentas pli
grandajn problemojn en la koncernaj landoj, kiam
temas pri senanalfabetigo de la loghantaro), sed tio
estas treege grava, se oni devas lerni iun alian
lingvon. Tial estas normalajho, ke iujn lingvojn oni
lernas pli rapide (pli sukcese) ol aliajn.
Chi tie necesas tamen
aldoni tre gravan rimarkigon. Chio ghis nun dirita
estas klaraj lingvostrukturaj faktoj. Sed same tiel
klara estas la fakto, ke lingvo estas socia kreajho,
malfermita kod-sistemo, neniam finfarota. Tio
signifas, ke en ghin oni konstante enshovas novajn
vortojn kaj regulojn, ke ghi daure shanghighas kaj
evoluas. Sekve, iun ajn lingvon estas neeble komplete
finlemi, char neniu lingvo havas la finon, do - chiu
estas senlime malfacila.
Char Esperanto estas
normala socie uzata lingvo, pri ghi validas la samo.
Ankau ghi estas malfermita sistemo, ankau ghin oni
ne povas finlerni kaj do ghi estas senlime malfacila.
Chi tio evidente
kontraudiras al la antauaj pruvoj pri ghia
facileco. Pri kio temas? La solvo estas simpla.
Lingvoj kiel kodoj
baze havas du funkciojn: funkcion de komunikado kaj
funkcion de arta esprimado. Je la nivelo de
komunikado estas en la lingvo tendenco al firme
fiksitaj sencoj en chiu lingva elemento (vorto,
sintagmo), dum je la nivelo de la arto la signifoj
farighas relative labilaj. Ju pli la vortoj au
sintagmoj estas frekvence maloftaj, des pli labilaj
estas iliaj signifoj. Tio signifas la jenon: je la
plej malsupra nivelo (primara, tiu necesa por la plej
elementa konversacio), je la nivelo, ni diru, de la
elementa lingva kono, la reguloj kaj konstruelementoj
(vortoj, morfemoj) havas firme normigitajn funkciojn
kaj chio antaue priskribita validas. Ju pli alta
estas la lingva nivelo, la komunikado chiam pli
malfortighas, la arta funkcio fortighas, estas chiam
pli granda nombro da esceptoj el la reguloj, estas
pli granda nombro da neklaraj signiftransiroj (tio
validas ankau por Esperanto) kaj estas necesa chiam
pli granda strecho por atingi pli superajn nivelojn.
La sekva diagramo montras tion klare (lit. 7):
Chi tie videblas la
esenco de la tuta ellaborajho. Esperanto estas
multoble pli facila (oni lernas ghin pli rapide kiel
negepatran lingvon) ol iu ajn nacia lingvo je la plej
elementa nivelo. Ghi pli facilas ankau je pli altaj
shtupoj, sed la diferenco chiam pli malgrandighadas
kaj en la fina, nekaptebla tendenco al la totala scio
ghi egalighas kun aliaj lingvoj farighante
nefinlernebla samkiel ili.
III
Nun ni provu iom
enrigardi la metodojn de fremdlingva instruado kaj la
necesajn strechojn por lerni fremdan lingvon. Se ni
akceptis la starpunkton, ke la bazan informkvanton
enhavas frazemo (frazo), sed ne vorto, tiam estos
klare, ke lernante fremdan lingvon unue necesas lerni
laueble multajn plej oftajn (plej frekvencajn)
vortojn kaj gramatikajn regulojn. Per ties helpo
eblos realigi la plej grandan kvanton da efektive
aplikeblaj frazoj. Ju pli granda estas la nombro da
eblaj, en praktiko necesaj frazemoj, des pli grandas
la povo ekspliki plenan informacion. Tial sendube la
plej efika metodo instrui fremdlingvon bazighas je la
ideo, ke unue necesas al la lernantoj instrui la plej
gravajn (la plej frekvencajn) regulojn kaj laueble
malgrandan kvanton da plej frekvencaj vortoj kaj
ekzercigi la aplikon (la parolkapablon) de tiuj
reguloj pere de tiuj vortoj. Multaj konataj mezuradoj
de vortfrekvenco montris, ke chirkau 2000 plej oftaj
vortoj kovras chirkau 80% de la normale uzata
vortkorpuso (lit. 3). Estas granda eraro de tiuj
metodoj, kiuj amasigas vortojn kaj gramatikajn
detalojn, sed ne dedichas sin sufiche al la ekzercado
baze de malgranda vortkorpuso. Ne nur, ke sur tiu
malgranda vortnombro de la plej oftaj vortoj staras
la konstruajho de la bezonata tekstaro, chiutage
praktikata lingvo, sed ech oni ne uzas chiujn formojn
de iu ofta vorto. La metodojn do oni devus tiel
strukturi, ke en la unua fazo oni eljhetu chion, kio
estas balasta, t.e. ke oni ne lernu ekz. en la kroata
chiujn formojn de simpla pasinta tempo aoristo, de
pasivo k.s. de chiuj verboj, se tiuj formoj lau la
frekvencesploroj estas malmulte au tute ne uzataj.
Por lerni Esperanton en tiu baza nivelo (80% de la
chiutage bezonata lingvo) estas necese lerni 300
morfemojn. Tion konfirmis mezuradoj efektivigitaj je
korpuso de 25.000 vortoj de la parola lingvo. Estis
konstatitaj entute 1343 diversaj morfemoj, el kiuj
467 plej frekvencaj konsistigis 95% de la tuta
korpuso kaj tial grupo da autoroj en Zagrebo decidis
konstrui lemolibron (la Zagreba Metodo) baze de tiuj
proksimume 500 morfemoj kaj plej oftaj gramatikaj
reguloj (lit. 6).
Tion konfirmis ankau
alia speco de praktiko. Baze de la disponeblaj 500
morfemoj tradukisto R. Imbert devis traduki du
porinfanajn romanojn (Molnar: La knaboj de
Paulo-strato kaj J.F. Cooper: Bravo) en simpligita
kaj mallongigita formo orientighante pli al
kunmetitaj vortoj el tiuj 500 morfemoj ol al
neologismoj. Post la farita laboro montrighis, ke li
devis enkonduki ne pli ol 50 radikojn, nepre
bezonatajn por la temoj de la romanoj aldone al la
bazaj kvincent. Sekve, por lerni sufiche da Esperanto
por la bazaj bezonoj, necesas ellerni 500 morfemojn
kaj ne 2000 vortojn kiel che aliaj lingvoj. Se ni
supozas, ke por komprenigi iun regulon la instruisto
devas ebligi, ke chiu lernanto uzu ghin en almenau
tri ekzemplaj frazoj kaj por komprenigi reciprokan
kombinadon de pluraj antauaj reguloj kun la nova
estas necesaj minimume 2-3 pliaj ekzemploj; estos
necese por instrui centon da reguloj (por lerni
prezencon de la kroata lingvo), ke chiu lernanto
eldiru minimume 1000 ekzemplajn frazojn. Se en la
klaso estas nur 20 gelernantoj, tio signifas 20.000
frazojn. Char en unu instruhoro estas eble efektivigi
maksimume 50-80 frazojn, por regigi la prezencon
(nuntempon) de 50 kroataj verboj estas necesaj
250-400 horoj, t.e. chirkau du instrujaroj!! Se
chiuj gelernantoj daure sekvus la instruadon, t.e.
se ilia atento estus aktive direktita al la
instrumaterialo, oni bezonus iom malpli. Se oni
deziras atingi la samon che Esperanto, estas necese,
ke chiu lernanto diru 5 frazojn kun verbo havanta
AS-finajhon, t.e. entute chirkau 100 frazojn, kio
estas plenumebla dum proksimume unu horo (ne por
lerni nuntempon de 50 verboj, sed de chiuj!).
Estas neeble elkalkuli
kiomoble malpli granda strecho estas necesa por lerni
bazan Esperanton ol la bazan kroatan, sed ankau chi
tiuj ghis nun prezentitaj ilustroj montras, ke temas
sendube pri kelkdekobla diferenco.
Tion konfirmas ankau
la fakto, ke lau la Zagreba Metodo Esperanton oni
povas sukcese instrui en malgrandaj grupoj (ne pli ol
10) dum 20-30 instruhoroj dum por tiu sama nivelo en
fremdlingvaj lernejoj por lerni iun nacian
fremdlingvon oni bezonas minimume 300 horojn
(ricevante malpli bonajn rezultojn). Do, ankau chi
tie temas pri 10-15-obla diferenco.
IV
Fine ni provu montri
ankau kelkajn ekonomiajn aspektojn. Char en la
lernejoj oni lernas fremdlingvojn kutime 4-6 horojn
semajne, tio signifas ke la elspezoj de la landa
lerneja budgheto por fremdlingva instruado estas
inter 1/6 kaj 1/5. Lau la indikoj el 1976 Irano
elspezis chirkau 400 milionojn da dolaroj por
fremdlingva instruado en la lernejoj en tiu jaro
(lit. 4). Por lando kun 20 milionoj da loghantoj
estas tiuj elspezoj inter 200 kaj 300 milionoj da
dolaroj. La rezultoj de la lernado estas tute
nekontentigaj. En la plimulto de Europaj landoj 2-5%
de de la loghantaro scias iun fremdlingvon post
5-jara deviga lernado de fremdlingvoj en elementaj
lernejoj. Tiun minimuman scinivelon pri Esperanto
estas eble atingi dum 14-taga kurso tiel, ke la
pozitivajn rezultojn havus 70-80% de chiuj lernantoj
(se oni lernas en ne tro grandaj grupoj ghis 10
personoj). Por definitiva fiksado de tiu scio estas
necese unu jaron ekzerci unufoje semajne dum du
horoj. Do entute por klaso de 10 lernantoj necesas
investi maksimume 100 instruhorojn por havi la
deziratan sukceson.
Tio signifas ke en la
lando kun 20 milionoj da loghantoj unu generacio de
500.000 gelernantoj devus lerni fremdlingvon nur unu
jaron anstatau 5 (au 8-9 inkluzivante ankau
postajn pli superajn lernejojn). La kosto de tia
instruado estus chirkau 50 milionoj da dolaroj por
tiu unu jaro, kio estas kvinono de la nunaj elspezoj
jaraj. Efikeco de la rezultoj estus ankau 20-obla (char
ghin sukcese ellernus 70-80% el la gelernantoj). La
nuraj kromaj kostoj estus la presado de lernolibroj
kaj aliaj libroj en Esperanto, char la tutan
ghisnunan scion necesus el la kelkaj plej potencaj
lingvoj traduki al Esperanto. Se chiuj landoj decidus
uzi nur 1/10 de la akiritaj shparoj por presi novajn
librojn (tiu shparita sumo por lando de 20 milionoj
da loghantoj estus chirkau 25 milionoj da dolaroj)
oni povus presi milionon da diversaj libroj je
miliardo da ekzempleroj! Se plian kvinonon de la
shparo oni uzus por lerni aliajn fremdlingvojn (nur
tiuj kiuj volontule tion deziras) kaj por
alikvalifikigo de la ghisnunaj instruistoj de
fremdlingvoj (multaj povus foriri al evolulandoj, che
kiuj mankas kvalifikitaj instruistoj), la materiaj
shparoj jam en la 2-a kaj 3-a jaro estus 50% de la
antaua elspezo dum la sukcesnivelo kaj per tio
ankau la rapideco de informfluo en la mondo kreskus
plurdekoble, aparte en la senco de la statplibonigo
en la evolulandoj, kiuj nun devas pagadi altegan
"imposton" por lerni lingvojn de grandaj
potencoj, kiuj siavice elspezas absolutan minimumon
por tio.
Lit. 1. Shkarich, Ivo:
"Kibernetika i jezik" (Kibernetiko kaj
lingvo) en la revuo "Suvremena lingvistika"
7/8, 1973, Zagreb, pagho 26.
Lit. 2. Tishljar,
Zlatko: "Elementoj de Esperanto-gramatiko kiel
modelo de universala gramatiko per analogie-kompara
metodo", referajhoj de Internacia lingvistika
simpozio en Kumrovec, IKS, Zagreb 1875, pagho 9
La plej konciza
priskribo de frazemo en tiu verko estas:
FRAZ (frazo, frazemo)
= [SUBS] < [D1]*n < [D2]*n
PREP = PREPOZICIO +
[SUBS < D1*n]
PROP - FRAZ =
SUBJUNKCIO + FRAZ
SUBS = SUBSTANTIVO au
INTERJEKCIO au P-PRONOMO
ADJ = ADJEKTIVO au
NUMERALO au ADJEKTIVA PRONOMO
P-PRONOMO = PERSONA
au ALIA PRONOMO ANSTATAUANTA SUBSTANTIVON
ADV = ADVERBO
n = IU AJN NOMBRO
INKLUZIVE 0 KAJ RILATAS AL KIU AJN ELEMENTO INTER LA
KRAMPOJ
+ = FIZIKA LIGO INTER
DU ELEMENTOJ
x V y = au X au Y
x < y = se X
tiukaze ankau Y kiel determiniga elemento
Se anstatau
SUBSTANTIVO, VERBO, PRONOMO, ADJEKTIVO, ADVERBO ktp
ni enmetas konkretajn substantivojn, verbojn ktp. ni
ricevos sennombron da eblaj frazoj, kiuj ne chiuj
estos sencplenaj sed chiuj estos sintakse, gramatike
korektaj (ne enirante la detalojn de morfologio).
Se por D1t; n = 0 kaj por D2; n
= 0, la frazo konsistos nur el SUBS, t.e. nur el unu
vorto de substantiva tipo (substantivo, interjekcio,
substantiva pronomo).
Se por D1; n = 0 la frazo konsistos el SUBS kaj D2, t.e. el vorto de substantiva karaktero
kaj verbo (kun eventualaj verbaj kompletigoj). Se por
D2; n = 0, la frazo konsistos el
SUBS kaj D1, t.e. el substantivo kun ties
determinanto(j).
Lit. 3. The Brown s
Corpus, Standard Present Day American English, 1967
Lit. 4. V. Sadler
"Intervjuo kun doktoro M.H. Saheb-Zamani,
E-revuo 865, januaro 1978, pagho 4-5.
"Lernado de
fremdaj lingvoj dauras proksimume 6 horojn semajne
dum 7 jaroj. Tio signifas 1/5 da tempo pasigita en la
lernejo, char la semajna programo ampleksas 30
horojn. Do ankau la prezo estas 1/5 de la budgheto
de la Ministerio por Edukado. Lau la pasintjara
(1976) budgheto tio estas 400 milionoj da usonaj
dolaroj nur por la lernando de fremdaj lingvoj. Kun
kia rezulto? Pasintjare la edukministro mem deklaris,
ke post 7 jaroj da lernado niaj gelernantoj scias
skribi au elparoli ech ne unu anglalingvan frazon
senerare. Sekve la rezultojn oni povas konsideri
neniaj."
Lit. 5. Tomo Maretic:
Gramatika hrvatskog ili srpskog jezika (Gramatiko de
la kroata au serba lingvo), Matica Hrvatska, Zagreb,
1961
Lit. 6.
ZlatkoTishljar: Frekvencmorfemaro de parolata
Esperanto, IKS 1982, Zagreb
Lit. 7. Stanley
Nisbet: Internacia lingvo devas esti facile lernebla,
Revuo "Israela Esperantisto" 88, decembro
1984.
Kroatlingva versio
de chi tiu verko aperis en libro "Jezichni
imperijalizam" (Lingva imperiismo), IKS
Zagrebo, 1986