A nyelvi fejlődés hasonlít a biológiai • Alexander Berdichevsky, Alexander Markov • Tudományos hírek a "Elemek" • Nyelvészet, biológia, evolúció

A nyelvi evolúció hasonló a biológiaihoz

Az indoeurópai nyelvek evolúciós fája a népszerű szinopszistól, melyet a folyóirat két megvitatott cikke kísér természet. Ez a kép különösen érdekes szórakoztató szöveg (ritka eset egy ilyen tiszteletre méltó magazin számára) – az egyik ágon a "szláv" helyett hibásan íródott "iszlám" (iszlám)

Az indoeurópai nyelvek elemzésére való alkalmazásával a fajok, a biológusok fejlődésének tanulmányozására kidolgozott technikák megerősítették a nyelvészek jól ismert mintáját, hogy a nyelvben lévő szavak gyorsabban változnak, annál ritkábban használják őket. Hasonló a biológiai evolúcióra is igaz: a morfológiai jellemzők és a genetikai régiók, amelyek a szervezet számára kevésbé fontosak, általában a leggyorsabb evolúciós változásoknak vannak kitéve.

Charles Darwin először mutatott rá párhuzamot a biológiai fajok és emberi nyelvek evolúciója között a Human Origin című könyvben. Ma ezt a véleményt szigorú statisztikai módszerek igazolják.

A magazinban természet azonnal két cikket szentelnek a nyelvhasználat ütemének tanulmányozására a szóhasználat gyakoriságától függően. Mindkét cikk vezető szerzője biológus.

Az első cikkben, amelyet az amerikai evolúciós teoretikusok és matematikusok írtak, kimutatták, hogy az angol szabálytalan igék "normál" igékben való "átalakulásának" mértéke függ az adott ige használatának gyakoriságától. Régi angolul, használt kb 800 AD e. ("Beowulf" nyelv), számos olyan igeosztály létezett, amelyek különböznek a múlt idejének alakulásában. A következő 1200 évben a "szabályosodás" folyamata zajlott: mindezeket az osztályokat fokozatosan "elfogyasztotta" a leggyakoribb, amelyben az elmúlt feszültség és a múltat ​​hallgatják az igével – e) d.

A modern angol nyelvben az összes többi osztályt csak alapok formájában tartják fenn – az úgynevezett "szabálytalan" igék. A rendszeres igék osztálya az egyetlen termelékeny, azaz minden új, angolul megjelenő ige, az automaták pedig beleilleszkednek, és más szabályos igékhez hasonlóan konjugálják (tehát a "fiatal" ige google a "Google keresőmotor használata" kifejezés múlt idejű és résztvevő formájában jelenik meg googled).

A szerzők tanulmányozták a régi angol (és minden rosszat) 177 ige történelmi sorsát, és még mindig megmaradtak. A közép angol nyelvben (a Choser Canterbury Tales nyelvének, mely 1200 körül volt használatban) 145 ige szabálytalan maradt, és a modern 98-ban egyesek konvencionálhatók rendszeres igékként és 79 mint a megfelelőek.

A szerzők osztották az igéket 6 osztályba, az előfordulás gyakoriságának megfelelően a modern angol szövegekben. E célból elemezték a CELEX szövegeinek nagyméretű korpuszát, amely összesen 17,9 millió angol szót tartalmazott. Az első osztályban két leggyakrabban használt ige van (legyen "legyen", "legyen"); mind a mai napig rossz. A második osztályban 11 ige volt, és mindegyik ma is szabálytalan. A harmadik osztály 37 ige közül mindegyik szabálytalanul maradt a közép-angol nyelvben, de a modern angol nyelvben korrektek voltak (segítség "segítség", "elérés", "séta", "munka"). A negyedik osztály 65 ige szabálytalan a közép angol 57, a modern – 37. Az adott számok az ötödik osztály 50, 29, 14; a hatodik, a 12, a 9, a 1.

Ezen adatok elemzésével a szerzők arra a következtetésre jutottak, hogy a 3-6. Évfolyamok esetében a következő összefüggés meglehetősen pontosan teljesül: az igék egy adott frekvenciaszintjének "féléletideje" közvetlenül arányos az előfordulás gyakoriságának négyzetgyökével. Például ha egy ige 100-szor gyakrabban kerül felhasználásra, mint a másik, akkor számíthatunk arra, hogy tízszer annyiba kerülhet. Az 1-2. Osztályú igék esetében a számolás nem lehetséges, mivel egyik sem lett helyes (a felezési idő túl hosszú).

Eredményeik jövőbeli kiaknázásával a szerzők előrejelzik, hogy ha az azonosított tendenciák folytatódnak, 2500-ig a vizsgált mintából további 15 ige helyes, és a legritkábban ezek közül a legritkább lesz "szabályozni" (esküszöm "Házasságot"). Szigorúan szólva már részben szabályozva van: a szótárak lehetővé teszik, hogy konvencióként is rendszeres ige (a múlt idő "szabálytalan" formájával együtt házasodik szótárak megadják a "helyes" férjezett).

Mikro-tanulmány az angol szabálytalan igék szabályozási szakaszairól

Ellenőrizzük a szerzők adatait saját, nagyon kicsi kutatásainkkal.Az ige nem változtathatja meg azonnal a konjugációt, ez fokozatos folyamat. Az emberek hibákat követtek el (ebben az esetben egy szabálytalan ige helyes igeként való összekapcsolása), egyre több hiba fordul elő, és egy bizonyos időpontban már nem tekinthetők hibának, és normává válnak, miközben a régi normák eltűnnek. Egyrészt a folyamat egy rögzített pontján vagyunk, és nem látjuk mindezt, másrészt a különböző frekvenciasorokból származó igék különböző szakaszaiban állnak: a hatodik osztály esetében ez a folyamat már messzire esett, a második pedig csak a kezdet.

Az internet a nyelv állapotának "pillanatfelvétele" lesz. Pontosan azért érdemes, mert a szövegeket senki nem választja ki (sok nyelvi korpusztól eltérően), és sokféle téves szóhasználat létezik. Válasszunk egy igét a 2-6. Osztályból, és ellenőrizzük, hogy gyakran találkozunk-e az igével és milyen gyakran van konjugálva helytelenül ("helyes"). Ha a szerzõk hipotézise igaz, akkor annál népesebb az ige, annál kevésbé lesz a hibás felhasználások számának aránya a teljes felhasználási számhoz képest.

Keresőként a Google-t használjuk. Az ige felhasználási számának (N) számának meghatározásához, keressük meg a jelenlegi feszültségformát egy személyes névmásszal (Adok, adsz, ad) – ez a megszorítás szükséges a melléknevek és főnevek homonim formáinak levágására, amelyek néhány ige esetében torzíthatják a képet. A múlt idő (P) hibás felhasználásának meghatározásához egyszerűen be kell állítanunk a "helyes" űrlapot (ajánlottak, ebben az esetben hibás); nincsenek korlátozások. A keresőmotor által visszaküldött adatok "magától értetődőnek" tekinthetők, és semmilyen módon nem korrigáltak (feltételezzük, hogy a zajszint minden esetben ugyanaz lesz, és nem károsítja az eredményt).

A 2-6. Gyakorisági osztályok közül kiválasztott egy ige. Számukra a Google használatával kiszámolják a felhasználások teljes számát, a hibás felhasználások számát és a relatív hibaarányt (P / N).

Az eredményeket a táblázatban és a grafikonban mutatjuk be. Amint látja, a mikrokutatás megerősíti a szerzők általános következtetéseit: a frekvenciaosztályok egybeesnek (bár az ötödik és a hatodik osztály között szinte nincs különbség), a relatív hibaarány (P / N arány) nő. Mint látható, az ige ólálkodik a múlt idő rendes formáinak száma (slinked) drámai módon emelkedik, vagyis a szabályozási folyamat nagyon messzire ment (valójában a szótáraknak már szabad beszélniük slinked együtt slunk).

A tengely mentén történő ábrázolás megkönnyítése érdekében a megfelelő értékek logaritmusát ábrázolják. A grafikon megerősíti a következtetéseket: minél kevésbé gyakori az ige, annál nagyobb a relatív hibaarány a múlt időben

* * *

A második tanulmány szerzői, a Reading (Egyesült Királyság) Egyetem biológusa és a Santa Fe Intézet (New Mexico, USA) sokkal több globális feladatot rejtenek magukra, így a kutatások egyrészt érdekesebbek, másrészt kritikát okoznak.

A szerzők megpróbálják megtalálni a nyelvek fejlődésének általános törvényeit, annak sebességét, valamint a különbözõ nyelvek eltérõségét (és ennek következtében a rokonsági fokot) is.

A szerzők által használt módszer valójában egyfajta glottokronológia (lexikostatisztika), amelyet az amerikai nyelvész, Morris Swadesh teremtett a 20. század közepén.

Swadesh kiemelte az alapszótárat: az összes kultúra számára fontos, és ezért feltételezhetően a világ minden nyelvén megtalálható 100 (később 200) univerzális koncepció listája. Egy nyelv szókészlete (szókincs) változóan változik, egyes szavakat mások helyettesítenek, de a Swadesh lista fogalmát jelző szavak különösen stabilak. Mindazonáltal fokozatosan felváltják őket.Összehasonlítva Swadesh listáját a kapcsolódó nyelvekhez és számolva azt, hogy hány koncepciót különböző szavakkal jelöltek meg, meg lehet határozni a nyelvek egymáshoz való viszonyának mértékét (minél több találat, annál közelebb áll a nyelvekhez). Nyilvánvaló tehát, hogy az orosz és a lengyelnél sokkal több véletlen egybeesés, mint az orosz és az angol, de kevesebb, mint az orosz és az ukrán esetében. Ha azonban azt is meghatározzuk, hogy milyen sebességgel helyettesítjük a szavakat a bázislistából, akkor a nagy pontosságú nyelvek közötti eltérés napjainkig lehetséges.

A gyakorlatban a glottokronológia számos komoly technikai és módszertani problémával szembesül. Például nem mindig nyilvánvaló, hogy az egymással összefüggő nyelvek két szava egy szónak leszármazottai, vagyis azt, hogy figyelembe vesszük-e, hogy egy fogalom azonos vagy sem. A kép torzul, különösen az egyik nyelvről kölcsönözött, nem feltétlenül összefüggő szavak (kiderül, hogy a fogalmat ugyanaz a szó jelöli, de az ok valójában nem a nyelvek viszonyában rejlik, hanem szoros kapcsolatban áll). Nem mindig világos, hogy mi a teendő, ha a koncepció több szinonimával is megjelölhető. Mindazonáltal a glottokronológiát aktívan használják a modern nyelvészetben.Az orosz nyelvész, Sergey Anatolyevich Starostin jelentősen fejlesztette és kiegészítette a Swadesh gondolatait, különösen a "Babel-torony" projektet alapította a Santa Fe Intézet alapja, amely a nyelvek rokonságára vonatkozó alapkutatással foglalkozott. Starostin és követői számos világnyelvet elemeztek, és sok esetben érdekes következtetésekre jutottak, amelyek közül néhány azonban komoly kétségeket vetett fel néhány nyelvész között.

A szerzők megvizsgálták a Swadesh 200-as szójegyzékének 87 indoeurópai nyelvvel kapcsolatos fogalmát. A fogalmak (jelentései) a beszéd különféle részeit tartalmazza ("mindent", "és", "állat", "rossz", "mert", "hazugság", "ő", "fekete" , "Két", stb., A teljes lista megtekintéséhez további anyagok találhatók a cikkhez, PDF, 1.2 MB). A nyelvekre vonatkozó adatokat az I. Dyen, J. B. Kruskal, P. Black (1992) által ismertetett kutatók vették. Az indo-európai osztályozás, a lexikai bázis lexikostatisztikus kísérlete, úgy tűnik, hogy az összetett esetekben az etimológia szempontjából (a szavak eredete) támaszkodott.

A különböző nyelvű szavak, amelyek ugyanazt a fogalmat jelölik, és ugyanannak a szónak leszármazottai, "kapcsolódó csoportokká" alakultak.Például a "két" kifejezés minden indoeurópai nyelvben kifejezõ szó ugyanazt a rokon csoportot jelenti (Eng. két, őt zwei, isp. dosfr. deux, Orosz két és így tovább), miközben például a "farok" kifejezést a 28 nyelvcsoport által vizsgált 87 nyelven (görög nyelven) képviselik ουρά, őt Schwanzfr. sorban állEng. farok – a különböző csoportokhoz tartozó szavak példái). A 200 nyelvű 87 nyelvhez tartozó kapcsolódó csoportok száma összesen 4049 volt.

A 200 koncepció mindegyikéhez meghatároztam az előfordulás gyakoriságát. Ebből a célból a szerzők négy nyelven (angol, spanyol, orosz és görög) írt szóbeli és írott beszédek széles skáláját elemezték (20 és 100 millió szó minden nyelv esetében). Ezek a nyelvek az indoeurópai család távoli ágait képviselik. Kiderült, hogy a különböző nyelvek használatának gyakorisága a négy nyelven nagyon hasonló, más szóval az egyik nyelvben gyakran használt fogalmakat valószínűleg gyakran használják más nyelveken is, és fordítva.

A következő lépés 87 indoeurópai nyelv evolúciós faja volt. A fák építésének alapja a 87 * 4049 nullát ábrázoló tábla volt, ami tükrözi a mind a 87 nyelv 4049 verbális csoportjának jelenlétét vagy hiányát.Ebben az esetben az evolúciós biológusok által kifejlesztett evolúciós fák építésére komplex matematikai módszereket alkalmaztak.

Az indoeurópai nyelvek evolúciós fája. Különböző színek az indoeurópai nyelvi család fő részlegeit (csoportokat) kijelölik, nyíl – A használat gyakoriságának számításához használt 4 nyelv. számadatok tükrözik a fa különféle töredékeinek megbízhatóságát (statisztikai bizonyosság). Ábra. a további anyagoktól a Pagel et al.

A fa kalibrálásához (évek abszolút hosszúságának meghatározásához) az indoeurópai nyelvek divergenciájának kezdetére vonatkozó átlagos becslést (8700 évvel ezelőtt használták) (a rendelkezésre álló becslések 6 és 10 ezer év között változtak, a divergencia dátumának megváltoztatása befolyásolja a fa ágainak abszolút hosszát, de nem az arányukon). A felépített fa alapján kiszámították a szavak (csopor- tok) átlagos helyettesítési arányát a kétszáz koncepcióra vonatkozóan. Ezt a sebességet "felezési időnek" (half-life), azaz 50% -os valószínűséggel fogják kifejezni egy másik szóval (pontosabban egy másik kapcsolódó csoporthoz tartozó szóval).Kiderült, hogy az itt vizsgált 200 fogalom 750 és 10 000 év között változik.

Látható, hogy az így létrejövő fa eltér az általánosan elfogadottól (lásd a cikk elején). Érdekes, hogy az új fán az ukrán és a belorusz közelebb van lengyelhez, mint oroszhoz (orosz ágak a lengyel-ukrán-belorusz csoportból, amelyet ezután három nyelvre osztanak), míg a hagyományos ötletek szerint a nyugat-szláv (beleértve lengyel) és Keleti szláv (orosz, fehérorosz, ukrán) csoport. Az eltérések sok oka lehet, az épületfák eredményei nagymértékben függenek attól, hogy a kutatók hogyan oldják meg a felmerülő problémákat (lásd a fenti példákat). A cikk szerzői nem részletesen ismertetik módszertanuk nyelvi részét, ezért nehezen tudjuk pontosan elemezni a fák különbségének okait.

A szavak változásának mértékét (függőleges tengely) használatuk gyakoriságáról (vízszintes tengely) négy nyelven (egy – angol, b – spanyol, c – orosz, d – görög). Szürke szín – szakszervezetek, kék – előterjesztések a piros – melléknevek kék – igék, zöld – főnevek sárga – az úgynevezett "különleges igék" ("különleges"): "mi", "hol", "mikor", "hogyan", "itt", "ott", "nem"; narancs – névmások, lila – számok a fekete – a szavak együtt. Ábra. a Pagel et al.

Ezután a szerzők angolul, oroszul, spanyolul és görögül (lásd az ábrát) grafikonokat állítottak össze az inflexiós frekvencia gyakoriságáról a szóhasználat gyakoriságáról. Kiderült, hogy a beszéd minden egyes részéhez és minden koncepció egészéhez képest a két mutató között jól felismerhető inverz kapcsolat van. Minél gyakrabban használ egy szót, annál lassabban változik.

A szerzők szerint ez a függőség két okból magyarázható:
1) Az emberek kevésbé hajlamosak hibákat elkövetni a gyakran használt szavak kiejtésén, memorizálásán és hallgatásán. Ezt a feltevést empirikus adatok támasztják alá.
2) Az emberek (az anyanyelvűek lakossága) kevésbé hajlandók beleegyezni egy innováció elfogadásában, amikor egy gyakran használt szóról van szó.

Lehetséges, hogy mindkét mechanizmus egyszerre működik. Könnyű látni, hogy teljesen analógak a biológiai evolúció kulcsfontosságú tényezőivel, nevezetesen a mutáció sebességével és a stabilizáló ("tisztító") szelekció hatékonyságával.A szerzők azt sugallják, hogy a "leggyakoribb" mutációkat gyakrabban választják szét, mert ezek a mutációk a kölcsönös félreértés legnagyobb kockázatához vezetnek. Talán ezért, a beszéd minden részében azok a "mutációk", amelyek szinte mindig a kifejezés értelmének teljes elvesztéséhez vagy torzításához vezetnek (számok, névmások és "különleges mellékmondatok") lassabban változnak.

A megfigyelt mintázat valószínűleg érvényes más nyelvű családokra is. 2006-ban ugyanazok a szerzõk megmutatták, hogy az indoeurópai nyelvek ingadozásának magas gyakoriságával jellemezõ fogalmak ugyanolyan tulajdonságokkal rendelkeznek a bantui nyelveken.

A szerzők megjegyzik, hogy a megtalált mintázat lehetővé teszi számunkra, hogy érdekes előrejelzéseket tegyünk. Először is feltételezhető, hogy ha két közös nyelvű "ős" közös nyelv eltér egymástól, a különbségek elsőként kevésbé fontos szavakat fognak felhalmozni, ezért a két nyelv kölcsönösen értelmezhető, sokkal hosszabb ideig, mint amire számítani lehetett, feltételezve a véletlenszerű eloszlást a lexikon egészében felmerülő változások. Másodszor, a tanulmány megmutattahogy a gyakran használt szavakat felismerhető formában lehet tárolni 10 000 vagy több évig; Ez azt jelenti, hogy a kulturális evolúcióban "replikátorok" (mémek) lehetségesek, szinte összehasonlíthatók bizonyos gének replikációjával (átvitel, reprodukálás).

Szeretném felhívni az olvasók figyelmét a "kiegészítő anyagok" (PDF, 1.2 Mb) cikkben szereplő figyelemre méltó táblázatra, amely felsorolja a nyelvi és biológiai evolúció közötti analógiát (rövidített fordítása az alábbiakban található):

Biológiai evolúcióNyelvfejlesztés
Az öröklődés különálló egységei (genetikai kód, morfológia, magatartás)Különleges öröklődési egységek (lexikon (szókincs), szintaxis, fonológia)
homológiaKapcsolódó szavak csoportjai
Mutációk (például nukleotid szubsztitúciók)Innováció (például egy hangban a hangok módosítása)
sodródásA nyelv sodródása
Természetes szelekcióTársadalmi kiválasztás
Cladogenezis (divergáló vonalakkal történő evolúció) – allopatriai speciáció (földrajzi szétválasztás) és szimpatikus speciáció (ökológiai / reproduktív szétválasztás)A nyelvek eltérése a földrajzi és társadalmi megosztottság miatt
Anagenesis (evolúciós változások elválasztás nélkül)Változás az eltérés nélkül
A gének vízszintes cseréje (például a hibridizáció során)hitelfelvétel
hibridekCreole nyelvek (például Suriname, sranantonga, ugyanaz)
kövületŐsi szövegek
Kihalás fajokA nyelvek megszüntetése

Általánosságban elmondható, hogy a szerzők önmagukban nem rendelkeznek alapvető újdonsággal. Ugyanakkor a glottokronológiában biológiai anyagon tesztelt specifikus statisztikai módszerek használata kétségtelenül új. Az egyetlen kár, hogy a szerzők nem próbálják összehasonlítani eredményeiket azzal, amit a nyelvészek már megszereztek.

A nyelvi evolúció és a biológiai viszonyok összehasonlítása számos műben (például A. Wedel, Példamutató modellek, evolúció és nyelvi változás // A nyelvészeti felülvizsgálat 2006. V. 23. P. 247-274.) Kétségtelenül joga van a létezéshez azonban a szavak és az élő egyének, a nyelvek és a fajok közötti analógiát óvatosan kell felhívni. A biológiai és nyelvi tárgyak megjelenésének, fejlődésének és eltűnésének mechanizmusa még mindig meglehetősen különböző. Mindazonáltal okkal feltételezhető, hogy (és a felülvizsgált művek is megerősítik), hogy az evolúció mindkét típusának közös mechanizmusait ugyanazon módszerekkel írhatjuk le, amelyekTermészetesen rendkívül érdekes mind gyakorlati, mind elméleti szempontból.

forrás:
1) Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang, Martin A. Nowak. A nyelv evolúciós dinamikájának számszerűsítése // természet. 2007. V. 449. P. 723-716.
2) Mark Pagel, Quentin D. Atkinson, Andrew Meade. A lexikai evolúció gyakorisága az indoeurópai történelem során // természet. 2007. V. 449. 717-720.

Alexander Markov, Alexander Berdichevsky


Like this post? Please share to your friends:
Vélemény, hozzászólás?

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: