Thesaurus: čo to je. Slovník tezaurov, ktorý je viac ako len slovník. Význam slova tezaurus Člen tezauru

3.1. Koncept tezauru

Thesaurus (z gr. θήσαϋροξ - poklad, zásoba) alebo ideografický slovník (z gr. idea - pojem, reprezentácia, idea a grafo - písať, opisovať) - v modernej lingvistike: 1) špeciálny druh slovníka všeobecnej alebo špeciálnej slovnej zásoby, ktorý obsahuje sémantické vzťahy medzi lexikálnymi jednotkami; 2) slovník na vyhľadávanie slova na základe jeho sémantickej súvislosti s inými slovami; 3) určitý spôsob organizácie (usporiadania) slov v slovníku; 4) spôsob organizácie lexikálneho zloženia, ktorý vám umožňuje ekonomicky „modelovať svet“.

V prvom, pôvodnom význame - úložisko, poklad, termín synonymický slovník používal L.V. Shcherba v článku „Skúsenosti zo všeobecnej lexikografie“ (tretia opozícia: tezaurus - obyčajný (vysvetľujúci alebo prekladový) slovník). Vedec píše: „Keď sa povie synonymický slovník, dnes máme najčastejšie na mysli „Thesaurus linguae latinae“, podnik piatich nemeckých akadémií, ktorý začal v roku 1900 a doteraz s vynechaním len písmena M. Charakteristická vlastnosť Tento typ slovníka spočíva v tom, že obsahujú úplne všetky slová, ktoré sa v danom jazyku aspoň raz vyskytujú, a že pod každým slovom sú uvedené úplne všetky citácie z textov dostupných v danom jazyku. Základom vyššie uvedenej opozície – tezauru – bežného (výkladového alebo prekladového) slovníka – je opozícia „jazykového materiálu“ a „jazykového systému“ – pojmov, ktoré som sa snažil zdôvodniť vo svojom článku „O trojitom aspekte jazykových javov a o experimente v lingvistike“.

Druhý význam tohto výrazu je spojený so všeobecne známym slovníkovým tezaurom „Tezaurus anglických slov a výrazov“ od P.M. Roger (Rogetov Tezaurus anglických slov a fráz, 1852) a jeho pokračovanie, slovník O.V. Baranova.

V tomto výklade pojem tezaurus označuje istý spôsob organizácie a usporiadania lexikálnej skladby v slovníku (pozri tretí význam pojmu).

Štvrtý význam termínu tezaurus je spojený so všeobecným uznaním tejto metódy organizácie lexikálneho zloženia, ktorá umožňuje ekonomicky „modelovať svet“. Z tohto hľadiska je slovník tezauru „systematické usporiadanie slovnej zásoby akejkoľvek vedeckej alebo technickej oblasti a v najvšeobecnejšej forme - všeobecná literárna slovná zásoba a navyše celá slovná zásoba daného jazyka“.

Podľa Yu.N. Karaulova, všeobecný jazykový tezaurus, fixujúci v štruktúre a vzťahoch svojich nadpisov, sekcií, zón, oblastí široké možnosti neverbálneho prepojenia myšlienok, zabezpečuje výklad ľudských hodnôt.

A.N. Baranov a D.O. Dobrovolsky v predslove „Od redaktorov“ k svojmu „Slovníkovému tezauru moderných ruských idiómov“ dáva tezauru nasledujúcu definíciu - špeciálny typ slovníka, ktorý sa od ostatných (najmä vysvetľujúcich, dvojjazyčných atď.) líši spôsobom organizovanie lingvistického materiálu. V tezaure sa jazykové jednotky neuvádzajú v abecednom poradí ako v bežnom slovníku, ale sú zoskupené podľa ich významu.

L.P. Krysin nazýva tezaurus (ideografický slovník) zvláštnym druhom výkladového slovníka, slovníkom „naopak“. „Ak vo vysvetľujúcom slovníku vedec píše, „zápis“ do slovníkového hesla je slovo a obsahom slovníkového hesla je výklad významu tohto slova, potom v ideografickom slovníku je „zápis“ význam, myšlienka (odtiaľ názov tohto typu slovníka - ideografický) a obsah slovníkového hesla je zoznam slov vyjadrujúcich daný význam. A ak je výkladový slovník nepostrádateľným nástrojom na porozumenie textu, potom ideografický slovník môže byť použitý pri vytváraní textu: veľmi často chce človek vyjadriť určitú myšlienku, ale nemôže nájsť slová vhodné na to; ideografický slovník uľahčuje tieto vyhľadávania. Existujú dva hlavné typy tezaurov:

lingvistický tezaurus - slovník obsahujúci zoznam slov v prirodzenom jazyku vybraných ako výsledok zmysluplnej analýzy textov a systematizovaných v súlade s prijatým klasifikačným systémom;

štatistický tezaurus - slovník na vyhľadávanie informácií obsahujúci zoznam slov vybraných na základe štatistickej analýzy textov na konkrétnu tému a zoskupených do slovníkových hesiel na základe frekvencie spoločného výskytu týchto slov v rovnakých textoch.

Tezaury na vyhľadávanie informácií (IRT) uľahčujú vyhľadávanie informácií pri ich automatickom spracovaní. IPT maximálne odhaľuje sémantické vzťahy medzi lexikálnymi jednotkami. Ako sa uvádza v GOST na IPT, „jednojazyčný tezaurus na vyhľadávanie informácií je riadený a meniaci sa slovník lexikálnych jednotiek založený na slovnej zásobe jedného prirodzeného jazyka, ktorý zobrazuje sémantické vzťahy medzi lexikálnymi jednotkami a je určený na spracovanie a získavanie informácií.

Základnou jednotkou IPT sú deskriptívne pojmy. Abecedná, lexikálno-sémantická časť IPT je súborom deskriptorových členov.

Opisné slovníky sú určené na úplný opis slovnej zásoby určitého odboru a zaznamenávanie všetkých použití v ňom; zaznamenávajú všetky dostupné relevantné prípady. Typickým príkladom popisného slovníka je „Výkladový slovník živého veľkého ruského jazyka“ od V.I. Dahl (prvé vydanie v štyroch zväzkoch vyšlo v rokoch 1863-1866). Cieľom jeho tvorcu nebolo štandardizovať jazyk, ale plne opísať celú rozmanitosť veľkoruskej reči – vrátane jej nárečových foriem ľudovej reči.

Každé heslo slovníka deskriptorov začína deskriptorom, v ktorom sú nižšie v článku GOST uvedené synonymá tohto deskriptora, ako aj ďalšie lexikálne jednotky spojené s hlavným deskriptorom podľa rodovo-druhových alebo asociačných vzťahov.

Tezaury, najmä v elektronickom formáte, sú teda jedným z účinných nástrojov na popis jednotlivých tematických okruhov.

V čistej forme sa tezaurus nachádza len zriedka. V skutočných tezauroch je pôvodná myšlienka zjednodušená alebo nadbytočná, ale potenciálne potrebná je informácia pridaná používateľovi. Najznámejšie sú dnes „Ruský sémantický slovník“ od Yu.N. Karaulova, „Slovník identických mien“ N.Yu. Shvedova, „Tematický slovník ruského jazyka“ od L.G. Smekhovej a ďalších.

Zhrnutie. Termín tezauru L.V. Ščerba ho použil vo vzťahu k slovníku, ktorý zaznamenával podľa možnosti všetky kontexty, v ktorých sa dané slovo vyskytuje. Charakteristickým znakom tezaurusov je, že uvádzajú zoznam všetkých slov, ktoré sa v danom jazyku vyskytujú aspoň raz a pod každým slovom sú uvedené všetky citáty z textov dostupných v danom jazyku. Obsah slovníka tezauru je jazykový materiál a bežný slovník je jazykový materiál a jazykový systém (pojmy L.V. Shcherba).

Túto charakteristiku dopĺňajú krížové spojenia rôzneho druhu – často paradigmatické (synonymné alebo antonymické), ktoré naznačujú zhodnosť alebo protiklad významov. Okrem toho rôzne druhy združení. spojenia (t. j. spojenia syntagmy).

Úlohou tezauru (ideografického slovníka) je teda poskytnúť predstavu o sémantickej organizácii určitého prierezu lingvistického materiálu, ktorý ukazuje hlavné sémantické polia, ich vnútornú štruktúru a vonkajšie súvislosti. Tezaurus je jasnou demonštráciou systémovej povahy jazyka, ktorý umožňuje vidieť mnoho typov vzťahov spájajúcich jednotlivé jazykové jednotky a skupiny jednotiek.

3.2. História reprezentácie pojmových vedomostí o svete vo forme tezauru

Potreba usporiadať slová podľa podobnosti, súvislostí a analógie ich významov bola pociťovaná počas celej pozorovateľnej histórie ľudského myslenia.

Aby sme vystopovali počiatky myšlienky reprezentovať konceptuálne poznatky o svete vo forme tezauru, pomôže nám to, ak sa obrátime na históriu zostavovania tezaurov (ideografických slovníkov).

A tak na úsvite civilizácie, keď ľudia mohli svoje myšlienky vyjadrovať písomne ​​len pomocou ideogramov a symbolov, bol asi jediný možný slovník, v ktorom boli slová usporiadané do tematických skupín. Pre lexikografa bolo v tom čase jednoducho ťažké nájsť iné kritérium na klasifikáciu slov, ako sú vzťahy, ktoré existujú v samotnej realite.

Žiaľ, nemáme žiadne dôkazy o tom, či národy, ktoré používali ideografické písanie, takéto slovníky skutočne mali. Medzi najstaršie známe pokusy o ideografickú klasifikáciu patrí Attikai Lexeis gréckeho gramatika, riaditeľa Alexandrijskej knižnice Aristofanesa Byzantského (zomrel 180 pred Kr.).

V II storočí. n. e. objavuje sa hlavné dielo „Onomasticon“, ktoré na materiáli z gréckeho jazyka zostavil lexikograf a sofista Julius Pollux (vlastným menom Polydeuces), rodák z egyptského mesta Naucratis. Yu Pollux napísal niekoľko diel, ale k nám sa dostal iba „Onomasticon“ (Pollux Yu. Onomasticon. M., 1956).


Onomasticon pozostáva z 10 kníh. Knihy sú v podstate samostatné pojednania a obsahujú najdôležitejšie slová súvisiace s konkrétnou témou. Prvá kniha teda hovorí o bohoch a kráľoch; v druhej - o ľuďoch, ich živote a fyziologickej štruktúre; v treťom - o príbuzenstve a občianskych vzťahoch atď. Slová zahrnuté v slovníku sú doplnené stručnými výkladmi. V modernej dobe bol slovník prvýkrát vydaný v roku 1502 v Benátkach.

Medzi 2. a 3. stor. n. e. Bol vydaný úžasný sanskrtský slovník „Amarakosha“ (Amarakosha. Paris, 1839). Jej autorom je staroindický básnik, gramatik a lexikograf Amara Sina, ktorý bol nazývaný „jednou z deviatich perál, ktoré zdobia trón Vikramaditya“. Amarakosha v preklade do ruštiny znamená pokladnica Amara. Slovník obsahuje 10 tisíc slov. Pre lepšie zapamätanie si výkladu významov slov sú slovníkové heslá konštruované vo forme básní. Všetok slovníkový materiál je rozdelený do 3 kníh. Každá kniha obsahuje niekoľko kapitol a kapitola je v prípade potreby rozdelená na niekoľko častí. Prvá kniha je venovaná oblohe, bohom a všetkému, čo s nimi priamo súvisí. Druhá kniha obsahuje slová súvisiace so zemou, sídlami, rastlinami, zvieratami a ľuďmi (najskôr je človek považovaný za živú bytosť a potom za spoločenskú bytosť; pred očami sa nám zjavuje celá kastová štruktúra súčasnej autorovej spoločnosti, kňazi , ako Boží správcovia, sú úplne hore a dole sú vojaci a králi, ešte nižšie sú vlastníci pôdy a úplne dole sú remeselníci, žongléri, sluhovia atď.). Tretia kniha je prísne lingvistická, ako je zrejmé z názvov jej šiestich kapitol.

Do povedomia európskych vedcov sa slovník dostal až koncom 18. storočia, keď v roku 1798 vyšla v Ríme jeho prvá časť. V úplnom znení s prekladom do angličtiny ju publikoval v roku 1808 anglický sanskrtský učenec G.T. Colebrooke (N.T. Colebrooke). V roku 1839 sa objavil jeho francúzsky preklad, ktorý vytvoril A.L. Delonchamps (A.L. Deslongchamps). Ďalší rozvoj myšlienky sémantickej klasifikácie slovnej zásoby je spojený s problémom takzvaného svetového jazyka.

Zhrnutie. Toto je vo všeobecnosti prvá etapa vo vývoji tradície ideografickej klasifikácie slovnej zásoby. Túto etapu možno nazvať prehistóriou ideografických slovníkov. Teraz je vhodné obrátiť sa na modernú klasifikáciu slovníkov tezaurov.

Je ľahké vidieť, ako sa popisované diela líšia od abecedných slovníkov. Ak je v abecedných slovníkoch prezentácia slov regulovaná takým konvenčným a vysoko neutrálnym nástrojom, akým je abeceda, potom pri konštrukcii ideografického slovníka rozhoduje svetonázor samotného lexikografa.

3.3. Princípy klasifikácie slovníkov-tezaurov

Ako už bolo uvedené vyššie, problém zostavovania klasifikácie tezaurov nie je nový a už niekoľko desaťročí priťahuje pozornosť mnohých domácich i zahraničných lingvistov (C. Marello, V. V. Morkovkin, L. P. Stupin, V. V. Dubichinsky atď. ). Výsledkom výskumu v tejto oblasti bolo vytvorenie alternatívnych klasifikácií týchto lexikografických diel. Jedna z najnovších klasifikácií je založená na nasledujúcich kritériách: a) typ sémantických spojení medzi jednotkami slovnej zásoby; 2) objem slovnej zásoby; 3) zovšeobecňovanie slovnej zásoby; 4) rozvoj významu lexém; 5) gramatická a štylistická kvalifikácia lexém; 6) demonštrácia fungovania lexém; 7) počet zastúpených jazykov; 8) typ semiotických prostriedkov používaných na sémantizáciu lexém. Táto klasifikácia je založená na predtým vytvorených klasifikáciách O.M. Karpova a I. Burchanov (Burchanov I. K ideografickému opisu štylisticky a pragmaticky relevantných aspektov lexikálnych významov. Londýn, 1996); terminológia používaná pri klasifikácii sa zavádza do lexikografického aparátu


V.V. Morkovkin, Yu.N. Karaulov, K. Marello. Klasifikačné kritériá sformuloval O.M. Karpovej. C. Marello zároveň rozlišuje tri typy tezaurov:

kumulatívne, čo sú zoskupenia slov bez definovania ich významov;

definitívny, interpretujúci každú lexikálnu jednotku skupiny slov;

dvoj- a viacjazyčné tezaury pre cestovateľov (Marello C. Thesaurus//W.D.D. 1990. V. 2. P. 1083).

Kumulatívne tezaury poskytujú nielen možnosť nájsť zrozumiteľnejšie, presnejšie, štylisticky správne slovo v situácii, keď sa nachádzate v určitom sémantickom poli, ale stávajú sa aj základom pre formovanie tematických počítačových databáz.

Definitívne tezaury môžu obsahovať spolu s definíciami významu aj etymologické informácie a citáty z literárnych diel, čo ukazuje priamu encyklopedickú orientáciu tohto typu tezauru. Okrem toho slovníky tohto typu zoznamujú používateľa s potrebným systémom pojmov, vysvetľujú podstatu, podobnosti a rozdiely pojmov, ich paradigmatické a syntagmatické súvislosti, niekedy poskytujú informácie o výslovnosti, gramatike, slovotvorbe a iných možnostiach lexikálne jednotky označujúce tieto pojmy.

Dvojjazyčné a viacjazyčné tezaury pre cestovateľov sa zvyčajne vytvárajú podľa tematických sekcií: čísla, jedlo, doprava, hotely atď. s prekladovými ekvivalentmi dvoch alebo viacerých jazykov.

Na čo najúplnejšie zobrazenie typov existujúcich slovníkov tezaurov je vytvorená viacúrovňová klasifikácia. Po prvé, podľa typu sémantických spojení medzi jednotkami slovnej zásoby sa tezaury delia do troch veľkých tried:

1. Asociačný tezaurus (terminológia Yu.N. Karaulova

2. Analogický tezaurus (terminológia V. V. Morkovkina

3. Ideografický (ideologický) tezaurus (terminológia L.V. Shcherba, V.V. Morkovkin. Uvedené tri typy tezaurov odrážajú tieto typy významových spojení lexém, resp.

1. Sémanticko-syntaktické súvislosti, na základe ktorých
slová sa spájajú do skupín alebo dvojíc, ktorých výskyt a existenciu predurčujú dvojité spojenia: sémantické a syntaktické. Sémantické spojenia medzi slovami sa vytvárajú najmä medzi slovesami a prídavnými menami, ktoré plnia predikačnú funkciu vo vete, a podstatnými menami, napr.

a) medzi úkonom a orgánom (nástrojom), ktorým sa vykonáva: chytiť - ruku, vidieť - oko, plávať - ​​čln atď.;

b) medzi dejovými slovesami, ktoré vyžadujú jeden podmet a podmet: štekať - pes, rehotať - kôň atď.; c) medzi slovesami a určitým gramatickým doplnením, ktoré prvé vyžadujú: rúbať - drevo, jesť - jedlo atď.

Asociačný tezaurus je teda slovníkový tezaurus, ktorý organizuje lexikálne jednotky na základe sémantických a syntaktických spojení, ktoré medzi nimi existujú, a zoskupuje skupiny v súlade s grafickou formou stredových slov.

2. Lexikálno-sémantické súvislosti. Zoskupovanie s týmto typom spojenia sa vyskytuje podľa hlavného znaku pre slová - lexikálneho významu. V tomto prípade sa zohľadňujú aj lexiko-gramatické spojenia, v podobe ktorých sa realizujú jednotlivé významy slov.

Analogický tezaurus je teda lexikografická referenčná kniha, ktorej hlavnou jednotkou makroštruktúry je lexikálno-sémantická skupina; skupiny sú systematizované v abecednom poradí sémantických dominánt.

3. Predmetové alebo tematické spojenia, kde spojenie slov do jednej skupiny nastáva v dôsledku podobnosti alebo zhody funkcií objektov a procesov označovaných slovami: objekty
predmety pre domácnosť, časti tela, typy odevov, budovy atď.

Ideografický tezaurus je teda lexikografickým dielom, ktoré predstavuje lexikálne jednotky ako súčasť vecných (tematických) skupín a organizuje ich do hierarchickej štruktúry určenej na reprezentáciu konceptualizovaných poznatkov o svete.

V rámci toho istého kritéria ďalej delíme typy. Ideografický tezaurus je teda reprezentovaný nasledujúcimi 4 typmi:


Vlastne ideografický tezaurus.

Tematický slovník.

Systematický slovník.

Tematicko-systematický slovník


Samotný ideografický tezaurus je osobitným typom ideografického slovníka, ktorého makroštruktúra je organizovaná v súlade s apriórnou synoptickou mapou prekrývajúcou lexikálne zloženie jazyka. Na rozdiel od iných typov ideografického slovníka sa samotný ideografický tezaurus vyznačuje logickou a prísne usporiadanou klasifikačnou štruktúrou vytvorenou na základe vedeckej taxonómie, aj keď všeobecná slovná zásoba podlieha lexikografickému popisu (New Webster „Thesaurus. Landoll, 1991).

Tematický slovník je osobitný typ ideografického tezauru, ktorého hlavnou jednotkou makroštruktúry je tematická skupina vrátane lexém, zjednotená na základe klasifikácie ich denotátov (referentov) a posudzovaná z hľadiska súladu s tzv. konkrétnu tému.

Systematický slovník je špeciálny typ ideografického tezauru, ktorého klasifikačná štruktúra má reprezentovať skutočné sémantické vzťahy, ktoré existujú medzi lexikálnymi jednotkami jazyka. Klasifikačná štruktúra vo svojom jadre predstavuje lexiko-gramatickú klasifikáciu slovnej zásoby, inými slovami, jej paradigmatickú štruktúru, opísanú z hľadiska podriadenosti a kompozície.

Tematicko-systematický slovník je osobitný druh ideografického slovníka, ktorý je kombináciou tematického a systematického slovníka.

Zhrnutie. Uvažovaná klasifikácia lingvistických tezaurov zahŕňa tieto typy slovníkov: analogický tezaurus (terminológia V. V. Morkovkina); ideografický (ideologický) tezaurus (terminológia L.V. Shcherba a V.V. Morkovkin); doc. tezaurus (terminológia Yu.N. Karaulova). Ďalej bude predstavený pop. sú odhalené tezaury a ich črty.

3.4. Populárne tezaury a ich vlastnosti

Najznámejší z dostupných slovníkov-tezaurusov, ktorým tento pojem sám vďačí za svoju existenciu, vznikol na materiáli anglického jazyka; toto je neustále dotlačovaný tezaurus od P.M. Tezaurus anglických slov a fráz (1852) Rogera Rogeta.

Je dôležité poznamenať, že autor Tezauru anglických slov a výrazov naplno využil dovtedy dostupné skúsenosti. „Princíp, ktorý ma viedol pri klasifikácii slov,“ píše P.M. Roger je ten istý, ktorý sa používa pri klasifikácii jednotlivcov v rôznych oblastiach prírodnej histórie. Preto časti, ktoré som zvýraznil, zodpovedajú prirodzeným čeľadiam botaniky a zoológie a séria slov je stmelená rovnakými vzťahmi, ktoré spájajú prirodzené rady rastlín a živočíchov.“

POPOLUDNIE. Roger veril, že presvedčivá klasifikácia slov podľa ich významov je nemožná, kým objekty reality nazývané tieto slová nie sú riadne preštudované a usporiadané. Preto svoju prácu začína rozdelením pojmového poľa anglického jazyka do štyroch veľkých tried: abstraktné vzťahy, priestor, hmota a duch (myseľ, vôľa, pocity). Tieto triedy sa ďalej delia na niekoľko rodov, ktoré sa zase delia na určitý počet druhov.

Medzi nedostatky ideografického slovníka P.M. Vedci Rogerovi pripisujú nasledovné: 1) nie celkom presvedčivá nomenklatúra hlavných pojmových tried; 2) abstraktná logika prevláda nad prirodzenými spojeniami slov; 3) relatívne nepohodlie pri používaní (tento nedostatok bol z veľkej časti opravený v nasledujúcich vydaniach).

V modernej ruskej lexikografii existuje niekoľko slovníkov, ktoré by sa mali klasifikovať ako slovníky-tezaury (ideografické slovníky). Toto napríklad vzniklo pod vedením Yu.N. Karaulova „Ruský sémantický slovník“, „Ruský sémantický slovník“ editoval N.Yu. Shvedova, „Tematický slovník ruského jazyka“ od L.G. Sayakhova, D.M. Khasanova a V.V. Morkovkina, „Slovník lexikálno-sémantických skupín ruských slovies“, vyd. E.V. Kuznecovová, „Ideografický slovník ruského jazyka“ O.S. Baranova, „Konceptosféra vnútorného sveta človeka v ruskom jazyku“ od V.I. Ubiyko, komplexný vzdelávací slovník „Lexikálny základ ruského jazyka“ pod vedením V.V. Morkovkina.

Poďme sa s niektorými zoznámiť.

Slovník-tezaurus moderných ruských idiómov“ editoval A.N. Baranovej a D.O. Dobrovolsky zahŕňa štyri hlavné časti: 1) synopsa; 2) legenda; 3) hlavná časť slovníka-tezauru; 4) ukazovatele. Účelom súhrnu je poskytnúť všeobecnú predstavu o štruktúre hlavnej časti tezauru. Uvádza všetky taxóny so subtaxónmi a zodpovedajúcimi paradigmatickými odkazmi. Hlavná časť slovníka Thesaurus Dictionary je zbierka slovníkových hesiel zoskupených do skupín (taxónov) a podskupín (subtaxónov) v súlade s významom v nich opísaných idiómov. Každý článok obsahuje idióm a príklady jeho použitia v modernej ruštine. Synopsa, Legenda, Indexy sú servisné časti vyššie uvedeného Slovníka-tezauru, ktoré užívateľovi poskytujú možnosť pracovať rýchlo a efektívne. Legenda sa používa v prípadoch, keď príklady použitia frazémov nie sú potrebné, pretože reprodukuje všetky informácie okrem príkladov. V skutočnosti ide o slovnú zásobu Slovníka. Jednotkami slovnej zásoby sú lemmy. Lema v tomto prípade predstavuje frazému v jej pôvodnej (slovníkovej) podobe a zahŕňa podľa možnosti všetky jej významné varianty. Napríklad idióm stoj nehybne je súčasťou lemmy označiť čas, stoj v pokoji, šmyk na mieste.

Slovník obsahuje dva ukazovatele. Na konci knihy je článok „Teoretická koncepcia slovníka-tezaurus modernej ruskej ideomatiky“, ktorý podrobne analyzuje vedecké črty tohto projektu.

„Ruský sémantický slovník“, vytvorený pod vedením Yu.N. Karaulova obsahuje 10 000 ruských slov, ktoré sú rozdelené do 1600 pojmových skupín. Identifikácia skupín je založená na opakovaných prvkoch výkladu slov vo výkladových slovníkoch: napríklad „akcia“, „vlastnosť“, „nástroj“ atď.

„Ruský sémantický slovník“, vytvorený pod vedením akademika N.Yu. Shvedova, je založený na mierne odlišných princípoch charakteristických pre zostavovanie ideografických aj vysvetľujúcich slovníkov. Po prvé, všetky slová jazyka sú tu rozdelené do štyroch tried: 1) označujúce jednotky (zámená), 2) pomenovanie (fiktívne slová), 3) skutočné konektory (spojky, predložky, spojovacie slovesá), 4) triedenie (modálne slová , častice, citoslovcia). Po druhé, v rámci každej triedy sú všetky slová rozdelené podľa slovných druhov. Po tretie, v rámci každého slovného druhu sú množiny a podmnožiny identifikované na základe tematickej blízkosti alebo naopak protikladnosti významov slov.

DUDEN je kniha s obrázkami (nákresmi) na ľavej strane (podľa iného softvéru) s očíslovanými časťami (až po najmenšie). Na pravej strane je tento očíslovaný zoznam sprevádzaný názvami (dokonca v dvoch jazykoch). Napríklad železničné zariadenia, stanice a koľaje sú nakreslené na celej strane. Vpravo sú názvy šípov, semaforov, barlí atď.

„Tematický slovník ruského jazyka“ L.G. Sayakhova, D.M. Khasanova a V.V. Morkovkina obsahuje 25 tisíc lexikálnych jednotiek, zoskupených do troch veľkých tried: „Človek“, „Spoločnosť“, „Príroda“, ktoré sa postupne rozvetvujú do menších podtried. Napríklad v triede „Človek“ sú podtriedy „Ľudské telo a organizmus“, „Ľudský život“, „Vzhľad, vzhľad človeka“, „Emocionálny vzhľad človeka“ atď. Každá z podtried je postupne rozdelené na ešte konkrétnejšie: „ Emocionálny svet človeka“ - „Duševné vlastnosti človeka“ - „Temperament“, „Charakter“ - „Všeobecné charakterové črty“ atď. Význam a použitie slov patriacich do každej triedy ilustrujú najbežnejšie frázy. Napríklad slovo „smiech“, ktoré je v podskupine „vyjadrenie pocitov, emócií“ triedy „Človek“, je sprevádzané označením takých kombinácií s týmto slovom, ako je veselý smiech, radostný smiech, detský smiech, výbuch. do smiechu atď.

Zhrnutie. Jedným z efektívnych nástrojov na popis jednotlivých tematických okruhov, najmä v elektronickej podobe, sú tezaury.

Termín tezaurus sa v lingvistike už dlho používa na označenie špeciálneho typu slovníka, ktorý v tej či onej miere odráža „obraz sveta“, „jazykový model sveta“ (podľa Yu.N. Karaulova). Tezaurus ako „pokladnica“ narástol vo svojom sémantickom rozsahu a dostal nový význam. Začali to nazývať slovníkom, ktorý nielenže absorbuje všetky lexikálne bohatstvá jazyka, ale ich aj určitým logicko-systémovým spôsobom organizuje. V slovníku tezaurov sa slová spájajú do skupín a k tomuto zjednoteniu dochádza na základe schopnosti konkrétneho slova sprostredkovať určitý pojem.

Slovník tezauru bol v lingvistike vždy považovaný za akýsi univerzálny systém, ktorý zabezpečuje uchovávanie kolektívnych (pre konkrétnu spoločnosť) poznatkov o svete vo verbálnej podobe. Na rozdiel od iných slovníkov sú v slovníku tezauru tieto poznatky uložené v štruktúrovanej forme, ktorá odráža naše predstavy o „štruktúre sveta“.

Najznámejšími a najobľúbenejšími tezaurmi v súčasnosti sú anglický Roger's Thesaurus, O.V. Ideografický slovník ruského jazyka. Baranova, ruský sémantický slovník Yu.N. Karaulova, ruský sémantický slovník akademika N.Yu. Shvedova, DUDEN, Tematický slovník ruského jazyka L.G. Sayakhova, D.M. Khasanova a V.V. Morkovkina.

Thesaurus(z gréckeho thesauros - poklad) v modernej lingvistike - osobitný druh slovníkov všeobecnej alebo špeciálnej slovnej zásoby, ktoré označujú sémantické vzťahy (synonymá, antonymá, paronymá, hyponymá, hyperonymá atď.) medzi lexikálnymi jednotkami. Tezaury, najmä v elektronickom formáte, sú teda jedným z účinných nástrojov na popis jednotlivých tematických okruhov.

Na rozdiel od vysvetľujúceho slovníka vám tezaurus umožňuje identifikovať význam nielen pomocou definície, ale aj koreláciou slova s ​​inými pojmami a ich skupinami, vďaka čomu môže byť použitý v systémoch umelej inteligencie.

Pod pojmom tezaurus sa v minulosti označovali predovšetkým slovníky, ktoré maximálne kompletne prezentovali slovnú zásobu jazyka s príkladmi jeho použitia v textoch.

Paronymia- čiastočná zvuková podobnosť slov s ich významovou odlišnosťou (úplnou alebo čiastočnou). Paronymá sú často zdrojom rečových chýb.

Príklady rovnakých koreňových paroným: obliekať – obliecť, ľudský – humánny, platiť – platiť – platiť.

Príklady úplne nesúvisiacich paroným: biológia - bryológia, vývar - brouillon, kompót - komplot, textúra - fraktura.

Avšak tezaurus je viac ako len nástroj na vyhľadávanie informácií. Tezaurus možno považovať za univerzálny model terminologického systému, a teda za formálny systém vedomostí obsiahnutých v jazyku konkrétneho vedného odboru.

Všeobecný tezaurus

Tezaurus vo svojej najvšeobecnejšej definícii je slovník so sémantickými prepojeniami medzi jednotkami slovnej zásoby. Od konca 50. rokov sa tezaury používajú v systémoch strojového prekladu a systémoch na vyhľadávanie informácií (IRS).

Na rozdiel od sémantických slovníkov, ktoré sú navrhnuté tak, aby podrobne popisovali všeobecnú slovnú zásobu, sú tezaury vytvorené na ukladanie a klasifikáciu mimoriadne špecifických slov a fráz. Napríklad slovo látka je v slovníku ROSS (Russian General Semantic Dictionary) a všetky názvy chemických zlúčenín sú už v tezaure.

Aké súvislosti sú opísané v tezaure? Zvyčajne:

    rod-druh (AKO)

    časť-celok (POF)

    synonymia/antonymia

    asociatívne.

Príklad rodovo-druhového vzťahu

Príklad sémantickej analýzy

Toto paradigmatický(stabilné spojenia, ktoré existujú medzi slovami v jazyku). A to nie je všetko.

Syntagmatický(textové) spojenia nie sú v tezaure zastúpené.

Príklad: WORDNET - inteligentný počítačový tezaurus

http://wordnet.princeton.edu/perl/webwn

Vytvorené na Princetonskej univerzite a voľne distribuované.

Kľúčové vlastnosti.

Slová v ňom sú zoskupené do synonymných skupín ( synsety). Sú rozdelené do 4 slovníkov – podstatné mená, prídavné mená, slovesá a príslovky.

Synsety sa spájajú tak v hierarchických spojeniach (hyponymá a hyperonymá), ako aj vo vzťahu antonymie a tiež meronymie (byť súčasťou niečoho alebo pozostávať z častí).

Vyriešený je aj problém morfológie – slovo sa po adresovaní WN vracia v pôvodnej podobe.

Tezaurus vyhľadávania informácií

V oblasti získavania informácií výhody používania tezaurusov pochádzajú z prechodu od textu k deskriptorom, ktoré opisujú objekt reálneho sveta. Presun na deskriptory umožňuje pokročilé (nadbytočné) indexovanie.

V tezaure na vyhľadávanie informácií sú explicitne vyjadrené PARADIGMATICKÉ vzťahy medzi deskriptormi (nie všetkými, ale tými, ktoré sú najčastejšie dôležité pre zvýšenie úplnosti vyhľadávania informácií). Experimentálne sa zistilo, že najdôležitejšie paradigmatické vzťahy sú

    podriadenosti

    podobnosť

    druh-rod (rod-druh)

    príčina-dôsledok

    časť-celok.

Príklad položky v slovníku:

Adokultúrne stroje.Dohodárske zariadenia

Syn. poľnohospodárska technika, poľnohospodárska technika,

Vyhliadka: kombajn na zemiaky, sejačka atď.

Príklad redundantného indexovania

Žiadosť "Dohodárske stroje. Dohodnuté kultúrne zariadenia"

Príklad: Sociálno-politický tezaurus ruského jazyka Univerzitný informačný systém RUSKO

http://www.cir.ru/index.jsp

Vyvinuté autonómnou neziskovou organizáciou „Centrum pre výskum informácií“ (ANO ITSI)

Tezaurus je terminologický zdroj implementovaný vo forme slovníka pojmov a termínov so súvislosťami medzi nimi. Hlavným účelom tezauru je pomôcť pri získavaní informácií: na základe odkazov tezauru sa dopyt rozširuje, navigácia cez odkazy tezauru pomáha jasnejšie formulovať samotný dotaz.

Charakteristickým znakom hierarchie tezauru UIS „Rusko“ je mnohopočetnosť klasifikácie, to znamená, že pre väčšinu pojmov sa nehľadá jeden klasifikačný koncept (vzťah NAD - POD), ale rôzne uhly pohľadu na konkrétny konceptu sú popísané, napríklad koncept PREDAJŇA možno považovať aj za BUDOVU aj ako MALOOBCHODNÚ ORGANIZÁCIU.

Tezaurus na spoločensko-politické témy zahŕňa viac ako 26 000 pojmov, 62 000 pojmov, 100 000 priamych a 700 000 zdedených vzťahov medzi pojmami. Aktuálna verzia tezauru popisuje terminológiu používanú v spoločensko-politickej oblasti vrátane ekonomickej, politickej, vojenskej, legislatívnej, sociálnej, medzinárodných vzťahov a iných oblastí.

Úplný názov tezauru je Informačný a vyhľadávací tezaurus o spoločensko-politických témach na automatické indexovanie. Všetky definície sú tu dôležité:

    „vyhľadávanie informácií“ – pretože je navrhnutý špeciálne na použitie pri získavaní informácií, aby pomohol používateľovi pri vytváraní (objasňovaní) dopytu a na automatické rozširovanie podmienok dopytu počas vyhľadávania;

    „o sociálno-politických témach“ - pretože pokrýva 95-99% slovnej zásoby a terminológie ruskojazyčného textu o sociálno-politických témach;

    „pre automatické indexovanie“ – keďže je základom pre proces automatického určovania predmetu dokumentov – zoskupovanie pojmov uzavretých v hierarchii tezauru do tematických uzlov, automatická kategorizácia a automatická anotácia.

Thesauri - záver

Pre mnohé známe tezaurusy (WordNet, Roget, EuroWordNet) zostáva veľkým problémom automatické odvodzovanie zo spojení tezaurov – keď je rozšírenie do najbližšieho okolia správne, ale nie úplné a pokusy o rozšírenie okolia vedú k chybám.

Pojem „tezaurus“ možno čoraz častejšie nájsť v mnohých projektoch, knihách, brožúrach a internetových zdrojoch. Ako záhadný jav desí svojou neznámosťou, pretože je oveľa jednoduchšie povedať „slovník“, ako použiť zvláštnu definíciu.

Tezaurus: čo to je? Ako sa líši od bežného slovníka? Pokúsme sa študovať tieto problémy podrobnejšie a prístupným spôsobom.

Výklad pojmu

Spočiatku sa pojem tezaurus posudzoval z pohľadu slovníka, ktorý predstavoval slovnú zásobu jazyka s príkladmi použitia v texte.

Ozhegov interpretuje tezaurus ako slovník konkrétneho jazyka, ktorý plne odráža slovnú zásobu, zatiaľ čo Efremova uvažuje o tomto fenoméne z hľadiska systematizovaného súboru údajov v určitej oblasti vedomostí.

Najkonkrétnejšia definícia sa používa vo filológii, kde sa tezaurus chápe ako komponent slovníkového typu, kde sú všetky významy slov spojené sémantickými vzťahmi a odrážajú kľúčové vzťahy pojmov v určitej tematickej oblasti.

Ako vidíme, je dosť ťažké odpovedať na otázku: "Tezaurus: čo to je?" určite. Pre užšie štúdium termínu uvažujme o histórii jeho vzniku, typoch a vzťahoch lexikálnych jednotiek v slovníku tohto typu.

História pôvodu

Anglický fyzik Roger je považovaný za zakladateľa tezaurov; bol to on, kto ich systematizoval v roku 1852 a rozdelil ich do skupín. Okrem toho bola každá skupina reprezentovaná názvom konceptu a potom tam boli jeho synonymá pre určité časti reči, zoznamy súvisiacich mien, ako aj odkazy na názvy iných kategórií. Myšlienka takejto klasifikácie bola veľmi cenná, pretože slovník bol považovaný za najprirodzenejší a popisoval slovnú zásobu jazyka v plnom rozsahu. Zároveň by sa dal využiť ako rýchle vyhľadávanie dôležitých pojmov. Od čias prvého tezauru až doteraz dochádza k pravidelnej transformácii tohto typu slovníka, ktorý sa používa v mnohých oblastiach poznania a je veľmi populárny po celom svete. Zároveň študujte tému: „Tezaurus: čo to je? relevantné v mnohých vzdelávacích inštitúciách.

Dodnes zostávajú tezaury najobľúbenejším spôsobom opisu vedomostí v akejkoľvek oblasti potrebnej na efektívne ľudské vnímanie.

Slovné vzťahy v tezaure

Najbežnejšie vzťahy v klasickom tezaure sú:

  1. Synonymia je jav, pri ktorom sa spájajú slová toho istého slovného druhu, ktoré majú podobný lexikálny význam. Napríklad: moc-otca, brigáda-oddelenie, šarlátová - červená atď.
  2. Antonymia je spojenie medzi slovami jednej časti reči, ktoré majú opačný lexikálny význam. Napríklad: ticho - rev, jemný - hrubý.
  3. Hyperonymia (hyponymia) je kľúčový vzťah na účely opisu podstatných mien. Hypernymum má široký lexikálny význam, vyjadruje druhový, všeobecný názov triedy (množiny) predmetov, predmetov, a to jeho vlastnosti a charakteristiky. Hyponymum má úzky význam, pomenúva objekt (znak, vlastnosť) ako prvok špecifickej množiny alebo triedy. Aby sme tieto vzťahy objasnili, uveďme jednoduchý príklad. Slová šelma a tiger sú vzájomne prepojené, pričom spoločný názov je zver- je hypernymom vo vzťahu k hyponymu tiger.
  4. Meronymia (partonymia) je vzťah pre podstatné mená, ktorý sa tvorí podľa princípu „časť – celok“. Ako príklad zvážte slová lietadlo, podvozok, okienko. V tomto prípade je všeobecný názov transportu holonymum (celok, názov) a jeho zložkami sú meronymá.
  5. Dôsledok (vzťahy medzi slovesami). Napríklad slová choď a príď spojené procesom a jeho dôsledkom (výsledkom).
  6. Dôvod (platí aj pre slovesá). Zoberme si príklad takýchto vzťahov, vezmite si slová: byť chorý — minúť. V tomto prípade možno vysledovať dôvod - vynechať ho, pretože boli zdravotné problémy.

Čo je to tezaurus, uvidíme z nasledujúceho príkladu.

Posteľ je zariadenie na spanie.

[hyperonymum]: nábytok
[meronymum]: dom
[synonymum]: posteľ, posteľ.

Toto je len klasický príklad tezauru ruského jazyka, ale všetky slovníky tohto typu sú postavené práve na tomto princípe.

Funkcie tezauru

Slovník tezaurov má dôležité sociálne, komunikačné, vedecké a iné funkcie.

on je:

  • zdroj odborných vedomostí v širokej alebo úzkej tematickej oblasti, spôsob usporiadania, opisu pojmov;
  • vyhľadávací nástroj v toku informácií;
  • nástroj na manuálnu analýzu dokumentácie vo vyhľadávačoch;
  • nástroj na automatické indexovanie zložitých textov.

Druhy tezaurov

Rozmanitosť slovníkov si vyžaduje zváženie nielen otázky: „Tezaurus: čo je to?“, ale aj venovanie pozornosti typom. Pomôže nám to lepšie pochopiť funkcie tohto typu slovníka.


Záver

Dúfame, že sa nám podarilo zrozumiteľným jazykom vysvetliť, čo je tezaurus. Vďaka príkladom je ľahké pochopiť, čím sa líši od iných slovníkov. Venovali sme sa aj problematike tezaurov na vyhľadávanie informácií, ktoré informačný systém vo veľkej miere využíva na rýchle vyhľadávanie a systematizáciu miliónov položiek.

Pojmový systém predmetovej oblasti Základom každej predmetovej oblasti je systém pojmov tejto oblasti. Definícia pojmu: Pojem je myšlienka, ktorá v zovšeobecnenej forme odráža predmety a javy reality tým, že fixuje ich vlastnosti a vzťahy; posledne menované (vlastnosti a vzťahy) sa v koncepte objavujú ako všeobecné a špecifické črty, korelujúce s triedami objektov a javov (Lingvistický slovník)


Pojmy a pojmy Na vyjadrenie pojmu predmetnej oblasti v textoch sa používajú slová alebo slovné spojenia nazývané pojmy. Súbor pojmov predmetnej oblasti tvorí jej terminologický systém. Vzťah konkrétneho pojmu s inými pojmami pojmového systému predmetnej oblasti je špecifikovaný pomocou definície


Definície pojmu? Slovo (alebo spojenie slov), ktoré je presným označením konkrétneho pojmu akejkoľvek špeciálnej oblasti vedy, techniky, umenia, spoločenského života a pod. || Špeciálne slovo alebo výraz používaný na označenie niečoho. v tom či onom prostredí, profesia (Veľký vysvetľujúci slovník ruského jazyka)


Pojmy - presné názvy pojmov Zvyčajne každému pojmu v odbore zodpovedá aspoň jeden jednoznačne chápaný pojem, ktorého významom je tento pojem. - pojmy v zmysle tradičnej teórie terminológie Vlastnosti pojmov - presné názvy pojmov - pojem sa musí týkať priamo pojmu, musí pojem jasne vyjadrovať; - význam pojmu musí byť presný a nesmie sa významovo prekrývať s inými pojmami; - význam výrazu by nemal závisieť od kontextu. Pojmy, ktoré presne pomenúvajú pojem, sú predmetom skúmania teórie terminológie, terminológov


Textové termíny V reálnych textoch predmetnej oblasti možno na označenie pojmu okrem základných termínov použiť mnoho rôznych jazykových výrazov, ktoré nazývame textovými termínmi: - syntaktické a slovotvorné možnosti: prijímateľ rozpočtových prostriedkov - rozpočet príjemca; - lexikálne možnosti – priamy odpis, nesporný odpis; - polysémantické výrazy v závislosti od kontextu, ktoré slúžia ako odkaz na rôzne pojmy odboru, napríklad slovo mena v rôznych kontextoch môže znamenať národnú menu alebo cudziu menu.














Deskriptory so značkami Vrh - časť názvu deskriptora žeriavy (zdvíhacie zariadenie) vs žeriavy (vtáky) škrupiny (konštrukcie) – porovnanie rôznych tezaurov Preferencie fráz: –Zvukové záznamy vs. platne (fonograf) Značky a množné číslo: Drevo (materiál) Drevo (lesné plochy)






Zahrnutie deskriptorov založených na viacslovných výrazoch Rozdelenie výrazu zvyšuje nejednoznačnosť: rastlinná potrava Význam výrazu závisí od slovosledu: informačná veda - vedecké informácie Jedno zo zložkových slov je mimo rozsahu tezauru alebo je príliš všeobecné: prvé pomoc Vzťahy deskriptora nevyplývajú z jeho štruktúry: –Umelé obličky, štatút utečenca, semafory




Asociačné vzťahy Oblasť pôsobenia - herec - Matematika - matematik Disciplína - predmet štúdia - Neurológia - nervový systém Činnosť - prostriedok alebo nástroj - Poľovníctvo - lovec Činnosť - výsledok činnosti - Tkanie - látka Činnosť - cieľ - Kniha - kniha Príčina-účinok - Smrť – pohreb Hodnota – merná jednotka – Sila prúdu – ampér Akcia – protistrana – Alergén – antialergický liek atď.


Tezaury na vyhľadávanie informácií: štádiá vývoja Prvá fáza: indexátory opisujú hlavnú tému textu pomocou ľubovoľných slov a fráz Pojmy získané z mnohých textov sa spájajú Medzi výrazmi, ktoré majú podobný význam, je vybraný najreprezentatívnejší Niektoré zo zostávajúcich sa stávajú podmienené synonymá, zvyšok sa vypúšťa Špecifické termíny zvyčajne nie sú zahrnuté


Tezaury na vyhľadávanie informácií: umenie vývoja Deskriptory sú pojmy, ktoré sú potrebné na vyjadrenie hlavnej témy dokumentu Synonymá sú zahrnuté len to najnutnejšie (napríklad začínajúce na iné písmeno), aby nekomplikovali prácu indexátora Súvisiace výrazy by sa mali zredukovať na jeden výraz, aby sa predišlo indexovaniu subjektivity. Hierarchické úrovne, zahrnutie konkrétnych výrazov je obmedzené


Tezaurus na vyhľadávanie informácií: umenie vývoja - 2 V zložitých prípadoch sa deskriptory dodávajú so značkami a komentármi –LIV: bombardovanie – bombardovanie – Polysémantické pojmy: jeden význam v tezaure (kapitál), nehodia sa do tezauru, značky !!! Tradičný tezaurus na vyhľadávanie informácií je umelý jazyk vybudovaný na základe reálnych termínov




Tradičné IPT: aplikácia v automatickom spracovaní Nedostatok vedomostí o skutočnom jazyku softvéru Nedostatok vedomostí o skutočnom jazyku softvéru Legislatívny indexovací slovník: Legislatívny indexovací slovník: – v texte VOJA – v tezaure MILITARY FORCES – v texte KAPITÁL – veľké, v tezaure len veľké Navrhované: každý deskriptor doplniť zoznamami slov a termínov Navrhuje sa: každý deskriptor doplniť zoznamami slov a termínov Ale: polysémia alebo súvisiaca s rôznymi deskriptormi. Ale: polysémia alebo vzťah k rôznym deskriptorom. Disambiguation resolution Disambiguation resolution


Tradičné IPT: automatické rozšírenie dopytu Problém s asociáciami Odporúčané: zadajte váhy zadajte váhy zadajte názvy vzťahov: objekt, vlastnosť atď. zadajte názvy vzťahov: objekt, vlastnosť atď. ZÁVER: musíte sa naučiť zostavovať lingvistické zdroje špeciálne pre automatické spracovanie textových zbierok


Thesaurus EUROVOC – viacjazyčný tezaurus Európskeho spoločenstva Thesaurus v 9 jazykoch Ruská verzia EUROVOC – +5 tisíc pojmov odrážajúcich ruské špecifiká Viacjazyčný tezaurus – Deskriptor – názvy v rôznych jazykoch – Ascriptory – pre niektoré jazyky


Automatická indexácia podľa tezauru EUROVOC na základe pravidiel (Hlava, Heinebach, 1996) Príklad pravidla: IF (blízko „Technológie“ A s „Vývojom“) POUŽÍVAJTE komunitárny program POUŽÍVAJTE rozvojovú pomoc ENDIF 40 tisíc pravidiel. Testovanie: 20 najčastejších deskriptorov v texte, generovaných automaticky - 42% úplnosť v porovnaní s manuálnou rubrikáciou


Automatické indexovanie založené na stanovení váh korešpondencie medzi slovami a deskriptormi (Steinberger a kol., 2000) Fáza 1 – stanovenie korešpondencie medzi textovými slovami a priradenými deskriptormi na základe štatistických meraní (chí-kvadrát alebo logaritmická pravdepodobnosť) deskriptor RIADENIA RYBOLOVU – nasledujúce slová (v zostupnom poradí podľa hmotnosti): rybolov, ryby, zásoby, rybolov, ochrana, riadenie, plavidlo atď. Samotné indexovanie 2. fázy - sčítanie logaritmov váh alebo ako skalárny súčin vektorov


Kombinácia voľných dopytov a dopytov na základe tezauru na vyhľadávanie informácií. Ručne indexovaná kolekcia – vytváranie korelácií. Používateľ zadáva dopyt v prirodzenom jazyku. Dotaz je rozšírený o deskriptory tezauru, ktoré s dopytom najviac korelujú (Petras 2004 Petras 2005). Napríklad na žiadosť Insolventné spoločnosti je možné získať zoznam deskriptorov likvidita, zadlženosť, podnik, firma a dopyt rozšíriť. Presnosť experimentu sa zvýšila o 13 %.



Sekcia sa používa veľmi jednoducho. Stačí zadať požadované slovo do príslušného poľa a my vám poskytneme zoznam jeho významov. Dovolím si poznamenať, že naša stránka poskytuje údaje z rôznych zdrojov – encyklopedických, výkladových, slovotvorných slovníkov. Tu si môžete pozrieť aj príklady použitia zadaného slova.

Význam slova tezaurus

tezaurus v krížovkárskom slovníku

Výkladový slovník ruského jazyka. S.I.Ozhegov, N.Yu.Shvedova.

tezaurus

[te], -a, m.(špeciálne).

    Slovník jazyka, ktorého cieľom je plne odrážať celú jeho slovnú zásobu.

    Slovník alebo súbor údajov, ktorý plne pokrýva výrazy a koncepty určitého druhu. špeciálne pole.

    adj. synonymický slovník, -aya, -oe.

Nový výkladový slovník ruského jazyka, T. F. Efremova.

tezaurus

    Slovník nejakého druhu jazyk, ktorý predstavuje jeho slovnú zásobu v plnom rozsahu.

    Kompletný systematizovaný súbor údajov o niečom. oblasť vedomostí, ktorá umožňuje človeku alebo počítaču sa v nej orientovať (v informatike).

Encyklopedický slovník, 1998

tezaurus

THESAURUS (z gréckeho thesauros - poklad)

    slovník, v ktorom sú slová jazyka prezentované čo najúplnejšie s príkladmi ich použitia v texte (je plne realizovateľný len pre mŕtve jazyky).

    Slovník, v ktorom sú slová súvisiace s ľubovoľnou oblasťou poznania usporiadané podľa tematického princípu a zobrazené sémantické vzťahy (rodovo-druhové, synonymické a pod.) medzi lexikálnymi jednotkami. V tezauroch na vyhľadávanie informácií sú lexikálne jednotky textu nahradené deskriptormi.

Thesaurus

(z gréckeho thesaurós ≈ poklad, pokladnica), súbor sémantických jednotiek jazyka, v ktorom je špecifikovaný systém sémantických (pozri Sémantika) vzťahov. T. vlastne určuje sémantiku jazyka (národný jazyk, jazyk konkrétnej vedy alebo formalizovaný jazyk pre automatizovaný riadiaci systém). Pôvodne bol T. považovaný za jednojazyčný slovník, v ktorom sa sémantické vzťahy určujú zoskupovaním slov do tematických okruhov. Napríklad anglický T. (autor P. M. Roget), vydaný v roku 1962 (1. vydanie 1852), obsahuje 1040 nadpisov, do ktorých je distribuovaných asi 240 000 slov. Index (kľúč) k tomuto T. obsahuje abecedný zoznam slov s uvedením nadpisov a podnadpisov, do ktorých každé slovo patrí. Existujú tradičné všeobecné lingvistické texty (opisy sémantických systémov jednotlivých jazykov) pre angličtinu, francúzštinu a španielčinu. Jednojazyčné slovníky, ktoré špecifikujú výrazy základných sémantických parametrov každého slova, sú veľmi blízke T., napríklad ruský slovník S. I. Ozhegova.

V 70. rokoch 20. storočie Rozšírili sa technológie vyhľadávania informácií, v ktorých sú identifikované špeciálne lexikálne jednotky - deskriptory, pomocou ktorých je možné automaticky vyhľadávať dokumentárne informácie. Každé slovo takéhoto T. je spojené so synonymným deskriptorom (pozri Synonymia) a pre deskriptory sú výslovne uvedené sémantické vzťahy: rod ≈ druh, časť ≈ ​​celok, cieľ ≈ prostriedky atď. Zvyčajne je zvykom rozlišovať medzi rodovo špecifické (hierarchické) a asociatívne vzťahy. Preto „Thesaurus získavania informácií v informatike“, publikovaný v ZSSR v roku 1973, poskytuje pre každý deskriptor heslo do slovníka, kde sú samostatne uvedené synonymické kľúčové slová, generické, špecifické a asociatívne deskriptory. Pre lepšiu orientáciu v asociatívnych spojeniach medzi deskriptormi sú k tomuto T pripojené sémantické mapy tematických tried. Pri automatizovanom vyhľadávaní informácií sa vyhľadávajú dokumenty, ktorých index obsahuje nielen deskriptory dotazov, ale aj tie deskriptory, ktoré sú s nimi v určitých sémantických vzťahoch. Niekedy je užitočné zdôrazniť špecifické asociatívne vzťahy v slovnej zásobe, ktoré sú špecifické pre danú tematickú oblasť: choroba ≈ patogén, zariadenie ≈ účel (alebo nameraná hodnota) atď. Pozícia lexikálnej jednotky (slova, frázy) v slovnej zásobe charakterizuje jeho význam v jazyku ; znalosť systému sémantických vzťahov, do ktorých dané slovo vstupuje (vrátane kategórií, do ktorých je zaradené), nám umožňuje posúdiť význam tohto slova.

V širšom zmysle sa T. interpretuje ako opis systému vedomostí o realite, ktorý vlastní individuálny nosič informácie alebo skupina nosičov. Toto médium môže vykonávať funkcie prijímača dodatočných informácií, v dôsledku čoho sa mení aj jeho T. Pôvodné T určuje schopnosti prijímača pri prijímaní sémantickej informácie. V psychológii a pri štúdiu systémov s umelou inteligenciou sa zvažujú vlastnosti jednotlivcov, ktoré sa prejavujú vo vnímaní a chápaní informácií. V sociológii a teórii komunikácie študujú vlastnosti komunikácie jednotlivcov a skupín, ktoré zabezpečujú možnosť vzájomného porozumenia založeného na spoločnej komunikácii.V týchto situáciách musí komunikácia zahŕňať zložité výroky a ich sémantické súvislosti, ktoré určujú zásobu informácií dostupných pre komplexný systém. T. v skutočnosti obsahuje nielen informácie o realite, ale aj metainformácie (informácie o informáciách), ktoré umožňujú prijímať nové správy.

Lit.: Cherny A.I., Všeobecná metodológia na vytváranie tezaurusov, „Vedecké a technické informácie. Ser. 2", 1968, ╧5; Varga D., Metodika prípravy informačných tezaurov, prekl. [z maďarčiny], M., 1970; Shreider Yu. A., Thesauruses in computer science a teoretická sémantika, „Vedecké a technické informácie. Ser. 2", 1971, ╧ Z.

Yu.A. Schrader.

Wikipedia

Thesaurus

Thesaurus vo všeobecnom zmysle - špeciálna terminológia, presnejšie a konkrétnejšie - slovník, zbierka informácií, korpus alebo kód, plne pokrývajúci pojmy, definície a termíny špeciálnej oblasti poznania alebo oblasti činnosti, ktoré by mali prispieť k správnej lexikálnej oblasti, firemná komunikácia; v modernej lingvistike - špeciálny typ slovníka, ktorý označuje sémantické vzťahy (synonymá, antonymá, paronymá, hyponymá, hyperonymá atď.) medzi lexikálnymi jednotkami. Tezaury sú jedným z najúčinnejších nástrojov na popis jednotlivých tematických okruhov.

Na rozdiel od vysvetľujúceho slovníka vám tezaurus umožňuje identifikovať význam nielen prostredníctvom definície, ale aj koreláciou slova s ​​inými pojmami a ich skupinami, vďaka čomu môže byť použitý na naplnenie bázy znalostí systémov umelej inteligencie.

V minulosti termín tezaurus primárne boli určené slovníky reprezentujúce slovnú zásobu jazyka s maximálnou úplnosťou s príkladmi jeho použitia v textoch.

Tiež termín tezaurus používa sa v teórii informácie na označenie súhrnu všetkých informácií, ktoré má subjekt.

V psychológii je tezaurus jednotlivca charakterizovaný vnímaním a chápaním informácií. Teória komunikácie zvažuje aj všeobecný tezaurus komplexného systému, prostredníctvom ktorého jeho prvky interagujú.

tezaurus (zjednoznačnenie)

Thesaurus:

  • Thesaurus je slovník, zbierka informácií pokrývajúcich pojmy, definície a termíny špeciálnej oblasti vedomostí alebo oblasti činnosti.
  • Rogerov tezaurus je jedným z prvých v histórii a najznámejších ideografických slovníkov súčasnosti.

Príklady použitia slova tezaurus v literatúre.

Pre vnímanie a spolutvorbu určité optimum tezaurus, nie malý, ale ani príliš veľký.

S neobmedzeným množstvom prichádzajúcich informácií výrazne prevyšuje tezaurus, jeho hodnota nezávisí od tejto veličiny a je úplne určená tezaurus ohm

Všestrannosť a systematickosť umenia vedie k nerovnomernému vnímaniu diela ako celku: pre vnímanie niektorých aspektov verša tezaurus optimálne, pre ostatných je nedostatočné alebo príliš veľké.

Pretože tezaurus rastie a mení sa, opätovné zoznámenie sa s prácou môže znamenať získanie nových cenných informácií.

Túžba dieťaťa prečítať si svoju obľúbenú rozprávku mnohokrát je pochopiteľná: on tezaurus rýchlo rastie a jeho schopnosť spolutvorby a asociatívnej fantázie je obzvlášť veľká.

Tento aspekt veci je premenlivejší a subjektívnejší ako tezaurus, a pri hľadaní objektívneho estetického posúdenia diela ho treba zredukovať na minimum.

Preniká tezaurus básnik a adresuje preklad tezaurus od cudzojazyčného čitateľa.

Najdôležitejšie je určiť, aký veľký je váš tezaurus, T.

Nie, len jeho vlastná batožina je skromná, je nevyvinutá, jeho tezaurus je v plienkach a ak tomu nerozumie tezaurus treba zvysit, tak v kazdom pripade to ta zena bude mat s nim tazke.

Bohatý tezaurus, na základe pravdivého poznania, umožňuje človeku pri komunikácii s inou osobou, vrátane najbližšej komunikácie s najbližšou osobou, správne reagovať na čokoľvek, čo sa deje.

Je zrejmé, že s rastúcou hodnotou klesá hodnota informácií tezaurus musí závisieť od vzťahu tezaurus k množstvu prijatých informácií.

Je zrejmé, že optimálna hodnota umeleckej informácie zodpovedá blízkosti tezaurusčitateľ a tezaurus básnik.

Môžeme povedať, že spolutvorba si rovnako ako kreativita vyžaduje inšpiráciu, teda inklúziu tezaurus v širšom zmysle slova.

Takéto vnútorné opakovanie jasného obrazu a jasného zvuku, pričom zostáva v rámci existujúceho tezaurus, obohacuje o rovnaký estetický moment opakovania.

V tomto bode tezaurus Nabokova a Prišvina treba považovať za protinožcov Platonova a Marina Cvetajevovú možno považovať za podobnú ako on.