Tezaur: ce este. Un dicționar de tezaur care este mai mult decât un dicționar. Semnificația cuvântului tezaur articol tezaur

3.1. Conceptul de tezaur

Tezaur (din greaca θήσαϋροξ - comoara, stoc) sau dictionar ideografic (din greaca idee - concept, reprezentare, idee si grapho - scrie, descrie) - in lingvistica moderna: 1) un tip special de dictionar de vocabular general sau special, care conține relații semantice între unitățile lexicale; 2) un dicționar pentru căutarea unui cuvânt pe baza conexiunii sale semantice cu alte cuvinte; 3) un anumit mod de organizare (aranjare) a cuvintelor în dicționar; 4) un mod de organizare a compoziției lexicale, care vă permite să „modelezi lumea” economic.

În primul sens, original - depozit, comoară, termenul tezaur a fost folosit de L.V. Shcherba în articolul „Experiența lexicografiei generale” (a treia opoziție: tezaur - un dicționar obișnuit (explicativ sau de traducere). Omul de știință scrie: „Când se spune tezaur, astăzi ne referim cel mai adesea la „Thesaurus linguae latinae”, o întreprindere a cinci academii germane, începută încă din 1900 și adusă până acum cu omisiuni doar la litera M. Trăsătură caracteristică Acest tip de dicționar constă în faptul că ele conţin absolut toate cuvintele care apar cel puţin o dată într-o limbă dată, iar sub fiecare cuvânt sunt date absolut toate citatele din textele disponibile într-o limbă dată. La baza opoziției de mai sus - tezaur - un dicționar obișnuit (explicativ sau de traducere) - este opoziția dintre „material lingvistic” și „sistem lingvistic” - concepte pe care am încercat să le susțin în articolul meu „Despre triple aspect al fenomenelor lingvistice și pe experiment în lingvistică.”

Cel de-al doilea sens al acestui termen este asociat cu dicționarul-tezaur cunoscut pe scară largă „Thesaurus of English Words and Expressions” de P.M. Roger (Roget's Thesaurus of English Words and Phrases, 1852) și continuarea lui, dicționarul lui O.V. Baranov.

În această interpretare, termenul tezaur denotă un anumit mod de organizare și aranjare a compoziției lexicale în dicționar (vezi a treia semnificație a termenului).

Cel de-al patrulea înțeles al termenului tezaur este asociat cu recunoașterea universală a acestei metode de organizare a compoziției lexicale, care permite „modelarea lumii” economic. Din acest punct de vedere, un dicționar de tezaur este „o ordonare sistematică a vocabularului oricărui domeniu științific sau tehnic și în cea mai generală formă - vocabular literar general și, în plus, întreg vocabularul unei limbi date”.

Potrivit lui Yu.N. Karaulova, tezaur de limbă generală, fixând în structura și relațiile titlurilor, secțiunilor, zonelor, zonelor sale largi posibilități de conectare non-verbală a ideilor, asigură o contabilitate a valorilor umane.

UN. Baranov și D.O. Dobrovolsky în prefața „De la editori” la „Dicționarul-tezaur al idiomurilor ruse moderne” dă tezaurului următoarea definiție - un tip special de dicționar care diferă de altele (în special, explicativ, bilingv etc.) în modul de organizare a materialului lingvistic. Într-un tezaur, unitățile de limbă nu sunt prezentate în ordine alfabetică, ca într-un dicționar obișnuit, ci sunt grupate în funcție de semnificația lor.

L.P. Krysin numește tezaurul (dicționarul ideologic) un tip special de dicționar explicativ, un dicționar „dimpotrivă”. „Dacă într-un dicționar explicativ, omul de știință scrie, „intrarea” într-o intrare din dicționar este un cuvânt, iar conținutul intrării din dicționar este interpretarea sensului acestui cuvânt, atunci într-un dicționar ideografic „intrarea” este sensul, ideea (de unde și denumirea acestui tip de dicționar - ideografic), iar conținutul unei intrări de dicționar este o listă de cuvinte care exprimă un sens dat. Și dacă un dicționar explicativ este un instrument indispensabil pentru înțelegerea unui text, atunci un dicționar ideografic poate fi folosit în generarea unui text: de foarte multe ori o persoană dorește să exprime un anumit gând, dar nu poate găsi cuvintele potrivite pentru aceasta; un dicţionar ideografic facilitează aceste căutări. Există două tipuri principale de tezauri:

tezaur lingvistic - un dicționar care conține o listă de cuvinte din limbaj natural selectate ca urmare a unei analize semnificative a textelor și sistematizate în conformitate cu sistemul de clasificare acceptat;

tezaur statistic - un dicționar de regăsire a informațiilor care conține o listă de cuvinte selectate ca urmare a analizei statistice a textelor pe o anumită temă și grupate în intrări de dicționar pe baza frecvenței de co-apariție a acestor cuvinte în aceleași texte.

Tezaurile de regăsire a informațiilor (IRT) facilitează căutarea informațiilor în timpul procesării sale automate. IPT relevă la maximum relațiile semantice dintre unitățile lexicale. După cum se precizează în GOST pe IPT, „un tezaur monolingv de regăsire a informațiilor este un dicționar controlat și în schimbare de unități lexicale, bazat pe vocabularul unei limbi naturale, afișând relații semantice între unitățile lexicale și destinat procesării și regăsării informațiilor.”

Unitatea de bază a IPT sunt termenii descriptori. Partea alfabetică, lexico-semantică a IPT este un set de articole descriptor.

Dicționarele descriptive sunt menite să descrie pe deplin vocabularul unui anumit domeniu și să înregistreze toate utilizările din acesta; înregistrează toate cazurile relevante disponibile. Un exemplu tipic de dicționar descriptiv este „Dicționarul explicativ al marii limbi ruse vie” de V.I. Dahl (prima ediție în patru volume a fost publicată în 1863-1866). Scopul creatorului său nu a fost acela de a standardiza limba, ci de a descrie pe deplin întreaga diversitate a vorbirii Marii Ruse - inclusiv formele sale dialectale ale vernaculare.

Fiecare intrare din dicționar de descriptor începe cu un descriptor, în care sinonimele acestui descriptor, precum și alte unități lexicale asociate cu descriptorul principal pe gen-specie sau relații asociative, sunt date mai jos în articolul GOST.

Astfel, tezaurile, în special în format electronic, sunt unul dintre cele mai eficiente instrumente de descriere a domeniilor individuale.

Un tezaur se găsește rar în forma sa pură. În tezaurele reale, ideea originală este simplificată sau străină, dar, potențial necesară, informațiile sunt adăugate utilizatorului. Cele mai faimoase astăzi sunt „Dicționar semantic rus” de Yu.N. Karaulova, „Dicționar de nume identice” N.Yu. Shvedova, „Dicționar tematic al limbii ruse” de L.G. Smekhova și alții.

Rezumat. Termenul de tezaur L.V. Shcherba l-a folosit în legătură cu un dicționar, care a înregistrat, dacă era posibil, toate contextele în care apare un anumit cuvânt. O trăsătură caracteristică a tezaurelor este că ele listează toate cuvintele care apar într-o anumită limbă cel puțin o dată, iar sub fiecare cuvânt sunt date toate citatele din textele disponibile în limba respectivă. Conținutul unui dicționar de tezaur este material lingvistic, iar un dicționar obișnuit este material lingvistic și un sistem lingvistic (termeni de L.V. Shcherba).

Această caracteristică este completată de conexiuni încrucișate de diferite tipuri - adesea paradigmatice (sinonim sau antonimic), care indică comunitatea sau opoziția de semnificații. În plus, diverse tipuri de asociații. conexiuni (adică conexiuni de sintagmă).

Astfel, sarcina unui tezaur (dicționar ideologic) este de a oferi o idee despre organizarea semantică a unei anumite secțiuni transversale a materialului lingvistic, arătând principalele câmpuri semantice, structura lor internă și conexiunile externe. Un tezaur este o demonstrație clară a naturii sistemice a unei limbi, permițând să vedem mai multe tipuri de relații care conectează unități lingvistice individuale și grupuri de unități.

3.2. Istoria reprezentării cunoștințelor conceptuale despre lume sub forma unui tezaur

Nevoia de a aranja cuvintele în funcție de asemănarea, contiguitatea și analogia semnificațiilor lor a fost simțită de-a lungul istoriei observabile a gândirii umane.

Pentru a urmări originile ideii de a reprezenta cunoștințele conceptuale despre lume sub forma unui tezaur, ne vom ajuta să ne întoarcem la istoria compilării tezaurilor (dicționare ideologice).

Astfel, în zorii civilizației, când oamenii își puteau exprima gândurile în scris doar cu ajutorul ideogramelor și simbolurilor, singurul dicționar posibil era probabil cel în care cuvintele erau aranjate în grupuri tematice. Era pur și simplu dificil pentru un lexicograf la acea vreme să găsească un alt criteriu de clasificare a cuvintelor, altele decât relațiile care există în realitatea însăși.

Din păcate, nu avem nicio dovadă că popoarele care au folosit scrierea ideografică aveau de fapt astfel de dicționare. Printre cele mai vechi încercări de clasificare ideografică cunoscute nouă se numără Attikai Lexeis al gramaticului grec, director al Bibliotecii din Alexandria, Aristofan din Bizanț (mort în 180 î.Hr.).

În secolul al II-lea. n. e. apare lucrarea majoră „Onomasticon”, compilată pe material din limba greacă de către lexicograful și sofistul Julius Pollux (cu numele adevărat Polydeuces), originar din orașul egiptean Naucratis. Yu. Pollux a scris mai multe lucrări, dar doar „Onomasticon” a ajuns la noi (Pollux Yu. Onomasticon. M., 1956).


Onomasticon este format din 10 cărți. Cărțile sunt în esență tratate separate și conțin cele mai importante cuvinte legate de un anumit subiect. Astfel, prima carte vorbește despre zei și regi; în al doilea - despre oameni, viața lor și structura fiziologică; în a treia - despre rudenie și relații civile etc. Cuvintele incluse în dicționar sunt însoțite de scurte interpretări. În timpurile moderne, dicționarul a fost publicat pentru prima dată în 1502 la Veneția.

Între secolele II și III. n. e. A fost publicat minunatul dicționar sanscrit „Amarakosha” (Amarakosha. Paris, 1839). Autorul său este poetul, gramaticianul și lexicograful indian antic Amara Sina, care a fost numit „una dintre cele nouă perle care împodobesc tronul Vikramaditya”. Amarakosha tradus în rusă înseamnă vistieria Amarei. Dicționarul conține 10 mii de cuvinte. Pentru a reține mai bine interpretarea semnificațiilor cuvintelor, intrările din dicționar sunt construite sub formă de poezii. Tot materialul dicționarului este împărțit în 3 cărți. Fiecare carte cuprinde mai multe capitole, iar capitolul la rândul său, dacă este necesar, este împărțit într-un număr de secțiuni. Prima carte este dedicată cerului, zeilor și tot ceea ce are legătură directă cu ei. A doua carte conține cuvinte legate de pământ, așezări, plante, animale și oameni (în primul rând, omul este considerat ca o ființă vie, apoi ca o ființă socială; în fața ochilor noștri ne apare întreaga structură de castă a societății contemporane a autorului; preoții). , în calitate de mandatari ai lui Dumnezeu, sunt în partea de sus, iar dedesubt sunt militari și regi, și mai jos sunt proprietarii de pământ, iar în partea de jos sunt artizani, jonglerii, servitorii etc.). A treia carte este strict lingvistică, așa cum reiese din titlurile celor șase capitole ale sale.

Dicționarul a devenit cunoscut oamenilor de știință europeni abia la sfârșitul secolului al XVIII-lea, când prima sa parte a fost publicată la Roma în 1798. A fost publicată integral cu traducere în engleză în 1808 de către savantul englez sanscrită G.T. Colebrooke (N.T. Colebrooke). În 1839 apare traducerea sa în franceză, realizată de A.L. Delonchamps (A.L. Deslongchamps). Dezvoltarea ulterioară a ideii de clasificare semantică a vocabularului este asociată cu problema așa-numitei limbi mondiale.

Rezumat. Aceasta, în termeni cei mai generali, este prima etapă în dezvoltarea tradiției clasificării ideografice a vocabularului. Această etapă poate fi numită preistoria dicționarelor ideografice. Acum este recomandabil să apelăm la clasificarea modernă a dicționarelor de tezaur.

Este ușor de observat cât de diferite sunt lucrările descrise față de dicționarele alfabetice. Dacă în dicționarele alfabetice prezentarea cuvintelor este reglementată de un instrument atât de convențional și extrem de neutru precum alfabetul, atunci când se construiește un dicționar ideografic, viziunea asupra lumii a lexicografului însuși devine decisivă.

3.3. Principii de clasificare a dicționarelor-tezaure

După cum sa arătat deja mai sus, problema elaborării unei clasificări a tezaurilor nu este nouă și de câteva decenii a atras atenția unui număr de lingviști autohtoni și străini (C. Marello, V.V. Morkovkin, L.P. Stupin, V.V. Dubichinsky etc. ). Rezultatul cercetărilor în acest domeniu a fost crearea unor clasificări alternative ale acestor lucrări lexicografice. Una dintre cele mai recente clasificări se bazează pe următoarele criterii: a) tipul de legături semantice dintre unitățile de vocabular; 2) volumul vocabularului; 3) generalizarea vocabularului; 4) dezvoltarea sensului lexemelor; 5) calificarea gramaticală și stilistică a lexemelor; 6) demonstrarea funcționării lexemelor; 7) numărul de limbi reprezentate; 8) tipul de mijloace semiotice folosite pentru semantizarea lexemelor. Această clasificare se bazează pe clasificările create anterior de O.M. Karpova și I. Burkhanov (Burchanov I. On the Ideographic Description of Stylistically and Pragmatically Relevant Aspects of Lexical Meanings. Londra, 1996); terminologia folosită în clasificare este introdusă în aparatul lexicografic


V.V. Morkovkin, Yu.N. Karaulov, K. Marello. Criteriile de clasificare au fost formulate de O.M. Karpova. Totodată, C. Marello distinge trei tipuri de tezauri:

cumulative, care sunt grupări de cuvinte fără a le defini semnificațiile;

definitivă, interpretând fiecare unitate lexicală a unui grup de cuvinte;

tezaure bi- și multilingve pentru călători (Marello C. Thesaurus//W.D.D. 1990. V. 2. P. 1083).

Tezaurele cumulate nu numai că oferă posibilitatea de a găsi un cuvânt mai înțeles, mai precis, mai corect din punct de vedere stilistic în situația de a fi într-un anumit domeniu semantic, dar devin și baza formării băncilor de date informatice tematice.

Tezaururile definitive pot include, alături de definițiile sensului, informații etimologice și citate din opere literare, care arată orientarea directă enciclopedică a acestui tip de tezaur. În plus, dicționarele de acest tip introduc utilizatorul în sistemul necesar de concepte, explică esența, asemănările și diferențele dintre concepte, conexiunile lor paradigmatice și sintagmatice și, uneori, oferă informații despre pronunția, gramatica, formarea cuvintelor și alte posibilități ale unităţi lexicale care denotă aceste concepte.

Tezaurile bilingve și multilingve pentru călători sunt create de obicei în funcție de secțiuni tematice: numere, mâncare, transport, hoteluri etc. cu echivalente de traducere a două sau mai multe limbi.

Pentru a afișa cât mai complet posibil tipurile de dicționare de tezaur existente, se creează o clasificare pe mai multe niveluri. În primul rând, în funcție de tipul de conexiuni semantice dintre unitățile de vocabular, tezaurile sunt împărțite în trei clase mari:

1. Tezaur asociativ (terminologie de Yu.N. Karaulov

2. Tezaur analog (terminologie de V.V. Morkovkin

3. Tezaur ideologic (ideologic) (terminologie de L.V. Shcherba, V.V. Morkovkin. Cele trei tipuri de tezaure de mai sus reflectă următoarele tipuri de conexiuni semantice ale lexemelor, respectiv:

1. Legături semantico-sintactice, pe baza cărora
cuvintele sunt combinate în grupuri sau perechi, predeterminate în apariția și existența lor prin duble conexiuni: semantică și sintactică. Legăturile semantice dintre cuvinte se stabilesc în principal între verbe și adjective care îndeplinesc o funcție predicativă într-o propoziție și substantive, de exemplu:

a) între o acţiune şi orga (instrumentul) cu care se execută: a apuca - o mână, a vedea - un ochi, a înota - o barcă etc.;

b) între verbe de acțiune care necesită un subiect și un subiect: lătrat - un câine, nech - un cal etc.; c) între verbe și un anumit adaos gramatical, pe care cei dintâi o cer: toacă - lemne, mănâncă - mâncare etc.

Prin urmare, un tezaur asociativ este un dicționar-tezaur care organizează unitățile lexicale pe baza conexiunilor semantice și sintactice care există între ele și aranjează grupurile în conformitate cu forma grafică a cuvintelor centrale.

2. Legături lexico-semantice. Gruparea cu acest tip de conexiune are loc în funcție de caracteristica principală a cuvintelor - sensul lexical. În acest caz, se iau în considerare și conexiunile lexico-gramaticale, sub forma cărora se realizează semnificațiile individuale ale cuvintelor.

Astfel, un tezaur analogic este o carte de referință lexicografică, a cărei unitate principală de macrostructură este grupul lexico-semantic; grupurile sunt sistematizate în ordinea alfabetică a dominantelor semantice.

3. Legături de subiecte sau tematice, în care combinarea cuvintelor într-un singur grup are loc datorită asemănării sau comunității de funcții ale obiectelor și proceselor notate prin cuvintele: obiecte
articole de uz casnic, părți ale corpului, tipuri de îmbrăcăminte, clădiri etc.

Astfel, un tezaur ideografic este o lucrare lexicografică care reprezintă unități lexicale ca parte a grupurilor de subiecte (tematice) și le organizează într-o structură ierarhică menită să reprezinte cunoștințele conceptualizate despre lume.

În cadrul aceluiași criteriu, subdivizăm în continuare tipurile. Astfel, tezaurul ideografic este reprezentat de următoarele 4 tipuri:


De fapt, un tezaur ideografic.

Dicționar tematic.

Dicționar sistematic.

Dicţionar tematic-sistematic


Tezaurul ideografic însuși este un tip special de dicționar ideografic, a cărui macrostructură este organizată în conformitate cu o hartă sinoptică a priori suprapusă compoziției lexicale a limbii. Spre deosebire de alte tipuri de dicționar ideografic, tezaurul ideografic în sine se caracterizează printr-o structură de clasificare logică și strict ordonată creată pe baza taxonomiei științifice, chiar dacă vocabularul general este supus descrierii lexicografice (New Webster „Thesaurus. Landoll, 1991).

Un dicționar tematic este un tip special de tezaur ideografic, a cărui unitate principală de macrostructură este un grup tematic, inclusiv lexeme, unite pe baza clasificării denotațiilor (referentelor) acestora și luate în considerare din punctul de vedere al respectării unui subiect specific.

Un dicționar sistematic este un tip special de tezaur ideografic a cărui structură de clasificare este menită să reprezinte relațiile semantice reale care există între unitățile lexicale ale unei limbi. În nucleul său, structura de clasificare reprezintă clasificarea lexico-gramaticală a vocabularului, cu alte cuvinte, structura sa paradigmatică, descrisă din punct de vedere al subordonării și al compoziției.

Un dicționar tematic-sistematic este un tip special de dicționar ideografic, care este o combinație între un dicționar tematic și sistematic.

Rezumat. Clasificarea considerată a tezaurilor lingvistice include următoarele tipuri de dicționare: tezaur analogic (terminologie de V.V. Morkovkin); tezaur ideografic (ideologic) (terminologie de L.V. Shcherba și V.V. Morkovkin); conf. univ. tezaur (terminologie de Yu.N. Karaulov). În continuare va fi prezentat pop. tezaurele și trăsăturile lor sunt dezvăluite.

3.4. Tezauri populare și caracteristicile lor

Cel mai faimos dintre dicționare-tezaurele disponibile, căruia însuși acest termen își datorează existența, a fost creat pe materialul limbii engleze; acesta este un tezaur retipărit constant de P.M. Tezaurul de cuvinte și expresii engleze al lui Roger Roget (1852).

Este important de menționat că autorul Tezaurului de cuvinte și expresii engleze a folosit pe deplin experiența disponibilă până la acel moment. „Principiul care m-a ghidat atunci când clasific cuvintele”, scrie P.M. Roger, este același folosit în clasificarea indivizilor în diverse domenii ale istoriei naturale. Prin urmare, secțiunile pe care le-am evidențiat corespund familiilor naturale de botanică și zoologie, iar seria de cuvinte este cimentată de aceleași relații care unesc seria naturală de plante și animale.”

P.M. Roger credea că o clasificare convingătoare a cuvintelor în funcție de semnificațiile lor este imposibilă până când obiectele realității numite aceste cuvinte sunt studiate și organizate corespunzător. Prin urmare, își începe munca prin împărțirea câmpului conceptual al limbii engleze în patru mari clase: relații abstracte, spațiu, materie și spirit (minte, voință, sentimente). Aceste clase sunt împărțite în continuare într-un număr de genuri, care la rândul lor sunt împărțite într-un anumit număr de specii.

Printre lipsurile dicționarului ideografic al lui P.M. Oamenii de știință îi atribuie lui Roger următoarele: 1) o nomenclatură nu pe deplin convingătoare a principalelor clase conceptuale; 2) logica abstractă prevalează asupra conexiunilor naturale ale cuvintelor; 3) inconvenient relativ de utilizare (această deficiență a fost corectată în mare măsură în edițiile ulterioare).

În lexicografia rusă modernă există mai multe dicționare care ar trebui clasificate ca dicționare-tezaure (dicționare ideologice). Acesta, de exemplu, a fost creat sub conducerea lui Yu.N. Karaulova „Dicționar semantic rus”, „Dicționar semantic rus” editat de N.Yu. Shvedova, „Dicționar tematic al limbii ruse” de L.G. Sayakhova, D.M. Khasanova și V.V. Morkovkina, „Dicționar de grupuri lexico-semantice de verbe rusești”, ed. E.V. Kuznetsova, „Dicționar ideologic al limbii ruse” O.S. Baranova, „Conceptosfera lumii interioare a omului în limba rusă” de V.I. Ubiyko, un dicționar educațional cuprinzător „Baza lexicală a limbii ruse” sub îndrumarea lui V.V. Morkovkina.

Să facem cunoștință cu câteva dintre ele.

Dicționar-tezaur al idiomurilor rusești moderne” editat de A.N. Baranova și D.O. Dobrovolsky cuprinde patru părți principale: 1) rezumat; 2) legenda; 3) corpul principal al Dicționarului-Tezaur; 4) indicatoare. Scopul Sinopsisului este de a oferi o idee generală a structurii Corpului Principal al Tezaurului. Listează toți taxonii cu subtaxa și referințele paradigmatice corespunzătoare. Corpul principal al Dicționarului tezaurului este o colecție de intrări din dicționar, grupate în grupuri (taxa) și subgrupe (subtaxa) în conformitate cu semnificația expresiilor descrise în acestea. Fiecare articol conține un mod și exemple de utilizare a acestuia în limba rusă modernă. Sinopsis, Legendă, Indecși sunt părți de serviciu ale dicționarului-tezaur menționat mai sus, oferind utilizatorului posibilitatea de a lucra rapid și eficient. Legenda este folosită în cazurile în care nu sunt necesare exemple de utilizare a idiomurilor, deoarece reproduce toate informațiile cu excepția exemplelor. De fapt, acesta este vocabularul Dicționarului. Unitățile vocabularului sunt lemele. Lema în acest caz reprezintă idiomul în forma sa originală (dicționar) și include, dacă este posibil, toate variantele sale semnificative. De exemplu, expresia stand still face parte din lema de marcare a timpului, stand still, skid in place.

Dicționarul conține două indicatoare. La sfârșitul cărții există un articol „Conceptul teoretic al dicționarului-tezaur al ideologiei ruse moderne”, care analizează în detaliu caracteristicile științifice ale acestui proiect.

„Dicționar semantic rus”, creat sub conducerea lui Yu.N. Karaulova include 10 mii de cuvinte rusești, care sunt împărțite în 1600 de grupuri conceptuale. Identificarea grupurilor se bazează pe elemente repetate de interpretare a cuvintelor din dicționarele explicative: de exemplu, „acțiune”, „proprietate”, „instrument” etc.

„Dicționar semantic rus”, creat sub conducerea academicianului N.Yu. Shvedova, se bazează pe principii ușor diferite caracteristice compilației atât a dicționarelor ideografice, cât și a celor explicative. În primul rând, toate cuvintele limbii sunt împărțite aici în patru clase: 1) unități indicatoare (pronume), 2) denumire (cuvinte noționale), 3) conectori efectivi (conjuncții, prepoziții, verbe de legătură), 4) clasificare (cuvinte modale). , particule, interjecții). În al doilea rând, în cadrul fiecărei clase, toate cuvintele sunt distribuite în funcție de părți de vorbire. În al treilea rând, în cadrul fiecărei părți de vorbire, seturile și subseturile sunt identificate pe baza proximității tematice sau, dimpotrivă, a opoziției semnificațiilor cuvintelor.

DUDEN este o carte cu imagini (desene) pe partea stângă (conform diferitelor programe) cu părți numerotate (până la cele mai mici). În partea dreaptă, această listă numerotată este însoțită de titluri (chiar și în două limbi). De exemplu, echipamentele feroviare, gările și șinele sunt desenate pe o pagină întreagă. În dreapta sunt numele de săgeți, semafore, cârje etc.

„Dicționar tematic al limbii ruse” L.G. Sayakhova, D.M. Khasanova și V.V. Morkovkina conține 25 de mii de unități lexicale, grupate în trei clase mari: „Omul”, „Societatea”, „Natura”, care se ramifică treptat în subclase mai mici. De exemplu, în clasa „Om” există subclasele „Corpul uman și organism”, „Viața umană”, „Aspectul, aspectul unei persoane”, „Aspectul emoțional al unei persoane”, etc. Fiecare dintre subclase la rândul său este împărțit în unele și mai specifice: „Lumea emoțională a unei persoane” - „Proprietăți mentale ale unei persoane” - „Temperament”, „Caracter” - „Trăsături generale de caracter”, etc. Semnificația și utilizarea cuvintelor aparținând fiecărei clase sunt ilustrate prin cele mai comune expresii. De exemplu, cuvântul „râs”, care se află în subgrupul „expresie a sentimentelor, emoțiilor” din clasa „Bărbat”, este însoțit de indicarea unor astfel de combinații cu acest cuvânt, cum ar fi râs vesel, râs vesel, râs al copilului, explozie. în râs etc.

Rezumat. Unul dintre instrumentele eficiente pentru descrierea disciplinelor individuale, în special în format electronic, sunt tezaurile.

Termenul tezaur a fost mult timp folosit pe scară largă în lingvistică pentru a desemna un tip special de dicționar, reflectând într-o măsură sau alta „imaginea lumii”, „modelul lingvistic al lumii” (conform lui Yu.N. Karaulov). Tezaurul ca „trezorerie” a crescut în domeniul său semantic și a primit un nou sens. Au început să-l numească un dicționar care nu numai că absoarbe toate bogățiile lexicale ale unei limbi, dar le organizează într-o anumită manieră logico-sistemică. Într-un dicționar de tezaur, cuvintele sunt combinate în grupuri, iar această unificare are loc pe baza capacității unui anumit cuvânt de a transmite un anumit concept.

Dicționarul tezaur a fost întotdeauna considerat în lingvistică ca un fel de sistem universal care asigură stocarea cunoștințelor colective (pentru o anumită societate) despre lume în formă verbală. Spre deosebire de alte dicționare, într-un tezaur-dicționar aceste cunoștințe sunt stocate într-o formă structurată care reflectă ideile noastre despre „structura lumii”.

Cele mai cunoscute și populare tezaure în prezent sunt Tezaurul lui Roger englez, O.V. Dicționar ideologic al limbii ruse. Baranova, dicționar semantic rus Yu.N. Karaulova, dicționar semantic rus al academicianului N.Yu. Shvedova, DUDEN, Dicționar tematic al limbii ruse L.G. Sayakhova, D.M. Khasanova și V.V. Morkovkina.

Tezaur(din grecescul thesauros - comoară) în lingvistica modernă - un tip special de dicționare de vocabular general sau special, care indică relații semantice (sinonime, antonime, paronime, hiponime, hiperonime etc.) între unități lexicale. Astfel, tezaurile, în special în format electronic, sunt unul dintre instrumentele eficiente pentru descrierea domeniilor individuale de studiu.

Spre deosebire de un dicționar explicativ, un tezaur vă permite să identificați sensul nu numai cu ajutorul unei definiții, ci și prin corelarea unui cuvânt cu alte concepte și grupurile acestora, datorită cărora poate fi folosit în sistemele de inteligență artificială.

În trecut, termenul tezaur desemna în primul rând dicționare care prezentau vocabularul unei limbi cu maximă completitate cu exemple de utilizare a acesteia în texte.

Paronimie- asemănarea parțială a sunetului cuvintelor cu diferența lor semantică (completă sau parțială). Paronimele sunt adesea o sursă de erori de vorbire.

Exemple din aceeași rădăcină paronime: îmbrăcare - îmbrăcat, uman - uman, plătiți - plătiți - plătiți.

Exemple de paronime complet neînrudite: biologie - briologie, bulion - brouillon, compot - complot, textură - fraktura.

Cu toate acestea, un tezaur este mai mult decât un instrument de regăsire a informațiilor. Un tezaur poate fi considerat ca un model universal al unui sistem terminologic și, prin urmare, ca un sistem formal de cunoștințe conținut în limbajul unui anumit domeniu științific.

Tezaur de uz general

Un tezaur în definiția sa cea mai generală este un dicționar cu conexiuni semantice între unitățile de vocabular. De la sfârșitul anilor 50, tezaurile au fost folosite în sistemele de traducere automată și sistemele de regăsire a informațiilor (IRS).

Spre deosebire de dicționarele semantice, care sunt concepute pentru a descrie în detaliu vocabularul general, tezaurele sunt create pentru a stoca și clasifica cuvinte și fraze extrem de specifice. De exemplu, cuvântul substanţă se află în dicționarul ROSS (Dicționar semantic general rus), iar toate denumirile compușilor chimici sunt deja în tezaur.

Ce conexiuni sunt descrise în tezaur? De obicei:

    gen-specie (AKO)

    parțial întreg (POF)

    sinonimie/antonimie

    asociativ.

Un exemplu de relație gen-specie

Exemplu de parsare semantică

Acest paradigmatic(legături stabile care există între cuvintele dintr-o limbă). Și asta nu este tot.

Sintagmatic legăturile (text) nu sunt reprezentate în tezaur.

Exemplu: WORDNET - tezaur computer inteligent

http://wordnet.princeton.edu/perl/webwn

Creat la Universitatea Princeton și distribuit gratuit.

Caracteristici cheie.

Cuvintele din el sunt grupate în grupuri sinonime ( synsets). Ele sunt împărțite în 4 dicționare - substantive, adjective, verbe și adverbe.

Sinseturile sunt unite atât în ​​conexiuni ierarhice (hiponime și hiperonime), cât și în relația de antonimie și, de asemenea, meronimie (a face parte din ceva sau a consta din părți).

S-a rezolvat și problema morfologiei - cuvântul, după ce a fost adresat lui WN, revine în forma sa inițială.

Tezaur de regăsire a informațiilor

În domeniul regăsirii informațiilor, beneficiile utilizării tezaururilor provin din trecerea de la text la descriptori care descriu un obiect din lumea reală. Trecerea la descriptori permite indexarea avansată (redundantă).

Într-un tezaur de regăsire a informațiilor, relațiile PARADIGMATICE dintre descriptori sunt exprimate în mod explicit (nu toate, dar cele care sunt cel mai adesea importante pentru creșterea caracterului complet al regăsirii informațiilor). S-a determinat experimental că cele mai importante relații paradigmatice sunt

    subordonare

    similitudine

    specie-gen (gen-specie)

    cauza efect

    parte-întreg.

Exemplu de intrare din dicționar:

Utilaje agreeculturale.Echipamente agreecultural

Sin. mașini agricole, mașini agricole,

Vedere: mașină de recoltat cartofi, semănătoare etc.

Exemplu de indexare redundantă

Cerere "Mașini agreeculturale. Echipamente agreeculturale"

Exemplu: Tezaurul socio-politic al limbii ruse Sistemul informatic universitar RUSIA

http://www.cir.ru/index.jsp

Dezvoltat de Organizația Autonomă Non-Profit „Centrul de Cercetare Informațională” (ANO ITSI)

Un tezaur este o resursă terminologică implementată sub forma unui dicționar de concepte și termeni cu legături între ei. Scopul principal al unui tezaur este de a ajuta la regăsirea informațiilor: pe baza legăturilor de tezaur, interogarea este extinsă, navigarea prin legăturile de tezaur ajută la formularea mai clară a interogării în sine.

O caracteristică a ierarhiei tezaurului UIS „Rusia” este multiplicitatea clasificării, adică pentru majoritatea conceptelor, nu se caută un singur concept de clasificare (relația SUS - JOS), ci puncte de vedere diferite asupra unui anumit concept. concept sunt descrise, de exemplu, conceptul MAGAZIN poate fi considerat atat ca BUILDING cat si ca ORGANIZATIE DE RETAIL.

Tezaurul pe teme socio-politice include peste 26.000 de concepte, 62.000 de termeni, 100.000 de relații directe și 700.000 de relații moștenite între concepte. Versiunea actuală a Tezaurului descrie terminologia utilizată în domeniul socio-politic, inclusiv în domeniul economic, politic, militar, legislativ, social, al relațiilor internaționale și în alte domenii.

Numele complet al Tezaurului este Tezaur de informare și recuperare pe teme socio-politice pentru indexare automată. Toate definițiile sunt importante aici:

    „preluare a informațiilor” – deoarece este conceput special pentru a fi utilizat în regăsirea informațiilor pentru a ajuta utilizatorul în formarea (clarificarea) unei interogări și pentru extinderea automată a condițiilor de interogare în timpul căutării;

    „pe subiecte socio-politice” - deoarece acoperă 95-99% din vocabularul și terminologia textului în limba rusă pe teme socio-politice;

    „pentru indexare automată” - întrucât stă la baza procesului de determinare automată a subiectului documentelor - gruparea termenilor apropiați în ierarhia tezaurului în noduri tematice, categorizare automată și adnotare automată.

Tezauri – concluzie

Pentru multe tezaure cunoscute (WordNet, Roget, EuroWordNet), inferența automată din conexiunile tezaurului rămâne o mare problemă - atunci când extinderea la cel mai apropiat cartier este corectă, dar nu completă, iar încercările de extindere a cartierului duc la erori.

Din ce în ce mai mult, conceptul de „tezaur” poate fi găsit în numeroase proiecte, cărți, broșuri și resurse de pe Internet. Ca un fenomen misterios, înspăimântă prin necunoașterea lui, pentru că este mult mai ușor să spui „dicționar” decât să folosești o definiție ciudată.

Tezaur: ce este? Cum este diferit de un dicționar obișnuit? Să încercăm să studiem aceste probleme mai detaliat și într-un mod accesibil.

Interpretarea termenului

Inițial, conceptul de tezaur a fost considerat din punctul de vedere al unui dicționar, care reprezenta vocabularul unei limbi cu exemple de utilizare în text.

Ozhegov interpretează un tezaur ca un dicționar al unei limbi specifice, reflectând vocabularul în întregime, în timp ce Efremova consideră acest fenomen din punctul de vedere al unui set sistematizat de date dintr-un anumit domeniu de cunoaștere.

Definiția cea mai specifică este folosită în filologie, unde un tezaur este înțeles ca o componentă a unui tip de dicționar, unde toate semnificațiile cuvintelor sunt conectate prin relații semantice și reflectă relațiile cheie ale conceptelor dintr-o anumită zonă.

După cum putem vedea, este destul de dificil să răspundem la întrebarea: „Tezaur: ce este?” categoric. Pentru un studiu mai restrâns al termenului, să luăm în considerare istoria originii sale, tipurile și relațiile unităților lexicale într-un dicționar de acest tip.

Istoria originii

Fizicianul englez Roger este considerat părintele fondator al tezaurilor; el a fost cel care l-a sistematizat în 1852, împărțindu-l în grupuri. Mai mult, fiecare grup a fost reprezentat de numele conceptului, iar apoi au existat sinonimele sale pentru anumite părți de vorbire, liste de nume înrudite, precum și referiri la nume ale altor categorii. Ideea unei astfel de clasificări a fost foarte valoroasă, deoarece dicționarul a fost considerat cel mai natural și a descris vocabularul limbii în cea mai mare măsură. În același timp, ar putea fi folosit ca o căutare rapidă a conceptelor importante. De pe vremea primului tezaur și până în prezent, a avut loc o transformare regulată a acestui tip de dicționar, care este folosit în multe domenii ale cunoașterii și este larg popular în întreaga lume. În același timp, studiind subiectul: „Tezaur: ce este?” relevante în multe instituții de învățământ.

Până în prezent, tezaurile rămân cel mai popular mod de a descrie cunoștințele în orice domeniu, necesar pentru o percepție umană eficientă.

Relații de cuvinte în tezaur

Cele mai comune relații din tezaurul clasic sunt:

  1. Sinonimia este un fenomen în care sunt asociate cuvinte din aceeași parte de vorbire care sunt similare în sens lexical. De exemplu: putere-patrie, brigadă-detașament, stacojiu - roșu etc.
  2. Antonimia este o conexiune între cuvintele unei părți de vorbire care au semnificații lexicale opuse. De exemplu: tăcere - vuiet, blând - nepoliticos.
  3. Hiponimia (hiponimia) este o relație cheie în scopul descrierii substantivelor. Un hipernim are un înțeles lexical larg, exprimă denumirea generică, generală, a unei clase (mulțimi) de obiecte, elemente, și anume proprietățile și caracteristicile acesteia. Un hiponim are o semnificație restrânsă; denumește un obiect (semn, proprietate) ca element al unui anumit set sau clasă. Pentru a clarifica aceste relații, să dăm un exemplu simplu. Cuvinte fiară și tigru sunt interconectate, cu numele comun fiind fiară- este un hipernim în raport cu hiponimul tigru.
  4. Meronimia (paronimia) este o relație pentru substantive care se formează conform principiului „parte - întreg”. Ca exemplu, luați în considerare cuvintele avion, tren de aterizare, hubloul. În acest caz, denumirea generală a transportului este holonim (întreg, nume), iar componentele sale sunt meronime.
  5. Consecință (relații între verbe). De exemplu, cuvintele du-te si vino legate de un proces și de consecința (rezultatul) acestuia.
  6. Motivul (valabil și numai pentru verbe). Să luăm în considerare un exemplu de astfel de relații, luați cuvintele: a fi bolnav – a rata. În acest caz, motivul poate fi urmărit - să-l ratezi pentru că au existat probleme de sănătate.

Vom vedea ce este un tezaur din exemplul următor.

Un pat este un dispozitiv pentru dormit.

[hiperonim]: mobilier
[meronim]: casă
[sinonim]: pat, pat.

Acesta este doar un exemplu clasic de tezaur al limbii ruse, dar toate dicționarele de acest tip sunt construite tocmai pe acest principiu.

Funcții de tezaur

Un dicționar de tezaur are funcții sociale, de comunicare, științifice și alte funcții importante.

El este:

  • o sursă de cunoștințe de specialitate într-un domeniu larg sau restrâns, un mod de ordonare, descriere a termenilor;
  • instrument de căutare în fluxul de informații;
  • un instrument pentru analiza manuală a documentației în motoarele de căutare;
  • un instrument pentru indexarea automată a textelor complexe.

Tipuri de tezauri

Varietatea dicționarelor necesită luarea în considerare nu numai a întrebării: „Tezaur: ce este?”, ci și atenție la tipuri. Acest lucru ne va ajuta să înțelegem mai bine caracteristicile acestui tip de dicționar.


Concluzie

Sperăm că am putut explica într-un limbaj accesibil ce este un tezaur. Datorită exemplelor, este ușor de înțeles cum diferă de alte dicționare. Am abordat, de asemenea, problema tezaurilor de regăsire a informațiilor, care sunt utilizate pe scară largă de sistemul informațional pentru a căuta și sistematiza rapid milioane de articole.

Sistemul conceptual al unei domenii de subiect Baza oricărei discipline este sistemul de concepte din această zonă. Definiția unui concept: Un concept este o gândire care reflectă într-o formă generalizată obiecte și fenomene ale realității prin fixarea proprietăților și relațiilor acestora; acestea din urmă (proprietăți și relații) apar în concept ca trăsături generale și specifice, corelate cu clase de obiecte și fenomene (Dicționar lingvistic)


Concepte și termeni Pentru a exprima conceptul de domeniu în texte, se folosesc cuvinte sau expresii numite termeni. Setul de termeni ai unui domeniu formează sistemul său terminologic. Relația unui anumit termen cu alți termeni ai sistemului de termeni ai domeniului de studiu este specificată prin intermediul unei definiții


Definiții ale termenului? Un cuvânt (sau o combinație de cuvinte) care este o desemnare exactă a unui concept specific din orice domeniu special al științei, tehnologiei, artei, vieții sociale etc. || Un cuvânt sau o expresie specială folosită pentru a desemna ceva. într-un mediu sau altul, profesie (Marele Dicționar explicativ al limbii ruse)


Termeni - denumiri exacte ale conceptelor De obicei, fiecărui concept din domeniu îi corespunde cel puțin un termen înțeles fără ambiguitate, al cărui sens este acest concept. - termeni, în sensul teoriei tradiționale a terminologiei Proprietăți ale termenilor - denumiri exacte ale conceptelor - termenul trebuie să se raporteze direct la concept, trebuie să exprime clar conceptul; - sensul termenului trebuie să fie precis și să nu se suprapună în sens cu alți termeni; - sensul termenului nu trebuie să depindă de context. Termenii care denumesc cu acuratețe un concept fac obiectul cercetării de către teoria terminologiei, terminologii


Termeni texti În textele reale ale domeniului de studiu, pentru a face referire la un concept, pe lângă termenii de bază, pot fi folosite multe expresii lingvistice diferite, pe care le numim termeni texti: - opțiuni sintactice și de formare a cuvintelor: destinatar al fondurilor bugetare - buget destinatar; - opțiuni lexicale – radiere directă, radiere necontestată; - expresii polisemantice, în funcție de context, care servesc drept referință la diferite concepte ale domeniului, de exemplu, cuvântul monedă în diferite contexte poate însemna monedă națională sau valută străină.














Descriptori cu semne Litier - parte a numelui descriptorului macarale (echipamente de ridicare) vs macarale (păsări) cochilii (structuri) – compararea diferitelor tezaure Preferințe pentru fraze: –Înregistrări fonografice vs. înregistrări (fonograf) Mărci și plural: Lemn (material) Păduri (zone împădurite)






Includerea descriptorilor bazați pe expresii cu mai multe cuvinte Împărțirea unui termen crește ambiguitatea: hrana vegetală Sensul expresiei depinde de ordinea cuvintelor: știința informației - informația științifică Unul dintre cuvintele componente este în afara domeniului tezaurului sau este prea general: mai întâi ajutor Relațiile descriptorului nu decurg din structura acestuia: –Rinichi artificiali, statut de refugiat, semafoare




Relații asociative Domeniu de activitate - actor - Matematică - matematician Disciplina - obiect de studiu - Neurologie - sistem nervos Acțiune - agent sau unealtă - Vânătoare - vânător Acțiune - rezultat al acțiunii - țesut - țesătură Acțiune - scop - Legătorie - carte Cauză-efect - Deces – înmormântare Valoare – unitate de măsură – putere curentă – amper Acțiune – contrapartidă – alergen – medicament antialergic etc.


Tezauri de regăsire a informațiilor: etape de dezvoltare Prima etapă: indexatorii descriu subiectul principal al textului folosind cuvinte și expresii arbitrare Termenii obținuți din mai multe texte sunt reuniți. sinonime condiționate, restul sunt șterse Termenii specifici nu sunt de obicei incluși


Tezauri de regăsire a informațiilor: arta dezvoltării Descriptorii sunt termeni care sunt necesari pentru a exprima subiectul principal al documentului Sinonimele sunt incluse doar cele mai necesare (de exemplu, începând cu o altă literă) pentru a nu complica munca indexatorului. termenii ar trebui redusi la un singur termen pentru a evita indexarea subiectivității Niveluri ierarhice, includerea unor termeni specifici este limitată


Tezaur de regăsire a informațiilor: arta dezvoltării - 2 În cazurile complexe, descriptorii sunt furnizați cu note și comentarii –LIV: bombardament – ​​bombardament – ​​Termeni polisemantici: un sens în tezaur (majusculă), nu se încadrează în tezaur, note !!! Tezaurul tradițional de regăsire a informațiilor este un limbaj artificial construit pe baza unor termeni reali




IPT tradițional: aplicație în procesare automată Lipsa cunoștințelor despre limbajul real al softului Lipsa cunoștințelor despre limbajul real al software-ului Legislative Indexing Vocabular: Legislative Indexing Vocabular: – în text TRUPE – în tezaur FORCE MILITARE – în text MAJUSCULĂ – capitală, în tezaur numai majuscule Sugerat: fiecare descriptor supliment cu liste de cuvinte și termeni Se propune: fiecare descriptor este completat cu liste de cuvinte și termeni Dar: polisemie sau referitor la diferiți descriptori. Dar: polisemie sau raportat la diferiți descriptori. Rezoluție de dezambiguizare Rezoluție de dezambiguizare


IPT tradițional: extindere automată a interogării Problemă cu asocierile Sugerat: introduceți ponderi introduceți ponderi introduceți numele relațiilor: obiect, proprietate etc. introduceți numele relațiilor: obiect, proprietate etc. CONCLUZIE: trebuie să înveți cum să construiești resurse lingvistice special pentru procesarea automată a colecțiilor de texte


Tezaur EUROVOC – tezaur multilingv al Comunităţii Europene Tezaur în 9 limbi Versiunea rusă a EUROVOC – +5 mii de concepte care reflectă specificul rusesc Tezaur multilingv – Descriptor – nume în diferite limbi – Ascriptori – pentru unele limbi


Indexare automată conform tezaurului EUROVOC, pe bază de reguli (Hlava, Heinebach, 1996) Exemplu de regulă: IF (lângă „Tehnologie” ȘI cu „Dezvoltare”) UTILIZARE Program comunitar UTILIZARE ajutor pentru dezvoltare ENDIF 40 mii reguli. Testare: 20 de descriptori cei mai frecventi din text, generati automat - 42% completitate, comparativ cu rubricarea manuala


Indexare automată bazată pe stabilirea ponderilor corespondenței între cuvinte și descriptori (Steinberger et al., 2000) Etapa 1 - stabilirea corespondenței între cuvintele text și descriptorii alocați pe baza unor măsuri statistice (chi-pătrat sau log-probabilitate) Descriptor de MANAGEMENT PESCUIT - următoarele cuvinte (în ordinea descrescătoare a greutății): pescuit, pește, stoc, pescuit, conservare, management, navă etc. Etapa 2 indexarea în sine - însumând logaritmii greutăților sau ca produs scalar al vectorilor


O combinație de interogări gratuite și interogări bazate pe un tezaur de regăsire a informațiilor. O colecție indexată manual – stabilirea corelațiilor. Un utilizator solicită o interogare în limbaj natural. Interogarea este extinsă de descriptorii tezaurului care sunt cel mai puternic corelați cu interogarea (Petras 2004). ; Petras 2005). De exemplu, la cererea Companii insolvente se poate obține o listă de descriptori lichiditate, îndatorare, întreprindere, firmă, iar interogarea poate fi extinsă.Acuratețea experimentului a crescut cu 13%.



Secțiunea este foarte ușor de utilizat. Doar introduceți cuvântul dorit în câmpul oferit și vă vom oferi o listă cu semnificațiile acestuia. Aș dori să menționez că site-ul nostru oferă date din diverse surse - dicționare enciclopedice, explicative, de formare a cuvintelor. Aici puteți vedea și exemple de utilizare a cuvântului pe care l-ați introdus.

Sensul cuvântului tezaur

tezaur în dicționarul de cuvinte încrucișate

Dicționar explicativ al limbii ruse. S.I.Ozhegov, N.Yu.Shvedova.

tezaur

[te], -a, m. (special).

    Un dicționar al unei limbi care își propune să reflecte pe deplin tot vocabularul acesteia.

    Un dicționar sau un corp de date care acoperă în întregime termeni și concepte de un fel. domeniu special.

    adj. tezaur, -aya, -oe.

Noul dicționar explicativ al limbii ruse, T. F. Efremova.

tezaur

    Dicționar de un fel limba, reprezentând vocabularul în întregime.

    Un set complet sistematizat de date despre ceva. un domeniu de cunoștințe care permite unei persoane sau unui computer să-l navigheze (în informatică).

Dicţionar enciclopedic, 1998

tezaur

THESAURUS (din greaca thesauros - comoara)

    un dicționar în care cuvintele unei limbi sunt prezentate cât mai complet posibil cu exemple de utilizare a acestora în text (este pe deplin fezabil doar pentru limbile moarte).

    Un dicționar în care cuvintele legate de orice domeniu de cunoaștere sunt aranjate după un principiu tematic și sunt prezentate relații semantice (gen-specie, sinonime etc.) între unitățile lexicale. În tezaurile de regăsire a informațiilor, unitățile lexicale ale textului sunt înlocuite cu descriptori.

Tezaur

(din grecescul thesaurós ≈ comoară, tezaur), un set de unități semantice ale unei limbi cu un sistem de relații semantice (vezi Semantică) specificate în ea. T. determină de fapt semantica unei limbi (limba națională, limba unei științe specifice sau un limbaj formalizat pentru un sistem de control automat). Inițial, T. a fost considerat ca un dicționar monolingv, în care relațiile semantice sunt determinate prin gruparea cuvintelor în titluri tematice. De exemplu, engleza T. (autor P. M. Roget), publicată în 1962 (ediția I 1852), conține 1040 de titluri, în care sunt distribuite aproximativ 240.000 de cuvinte. Indexul (cheia) acestui T. conține o listă alfabetică de cuvinte care indică titlurile și subtitlurile cărora le aparține fiecare cuvânt. Există texte tradiționale lingvistice generale (descrieri ale sistemelor semantice ale limbilor individuale) pentru engleză, franceză și spaniolă. Dicționarele monolingve care specifică expresii ale parametrilor semantici de bază ai fiecărui cuvânt sunt foarte apropiate de T., de exemplu, dicționarul de limbă rusă de S. I. Ozhegov.

În anii 70 Secolului 20 Tehnologiile de regăsire a informațiilor s-au răspândit.În aceste sisteme sunt identificate unități lexicale speciale - descriptori, care pot fi folosiți pentru căutarea automată a informațiilor documentare. Fiecare cuvânt al unui astfel de T. este asociat cu un descriptor sinonim (vezi Sinonimia), iar relațiile semantice sunt indicate în mod explicit pentru descriptori: gen ≈ specie, parte ≈ întreg, scop ≈ înseamnă etc. De obicei, se obișnuiește să se facă distincția între relaţii specifice genului (ierarhice) şi asociative. Astfel, „Tezaurul de regăsire a informațiilor în informatică”, publicat în URSS în 1973, pentru fiecare descriptor oferă o intrare de dicționar, unde sunt indicate separat cuvintele cheie sinonime, descriptorii generici, specifici și asociativi. Pentru o mai bună orientare în conexiunile asociative dintre descriptori, hărți semantice ale claselor tematice sunt atașate acestui T. În timpul regăsirii automate a informațiilor, sunt căutate documente al căror index conține nu numai descriptori de interogare, ci și acei descriptori care se află în anumite relații semantice cu aceștia. Uneori este utilă evidențierea unor relații asociative specifice într-un vocabular care sunt specifice unui anumit domeniu tematic: boală ≈ agent patogen, dispozitiv ≈ scop (sau valoare măsurată) etc. Poziția unei unități lexicale (cuvânt, frază) într-un vocabular caracterizează sensul său în limbă; cunoaşterea sistemului de relaţii semantice în care intră un cuvânt dat (inclusiv categoriile în care este inclus) ne permite să judecăm sensul acestui cuvânt.

Într-un sens larg, T. este interpretat ca o descriere a sistemului de cunoștințe despre realitate deținut de un purtător individual de informații sau de un grup de purtători. Acest mediu poate îndeplini funcțiile unui receptor de informații suplimentare, în urma căruia se schimbă și T. T-ul original determină capacitățile receptorului atunci când primește informații semantice. În psihologie și în studiul sistemelor cu inteligență artificială sunt luate în considerare proprietățile indivizilor care se manifestă în percepția și înțelegerea informațiilor. În sociologie și teoria comunicării, ei studiază proprietățile comunicării indivizilor și grupurilor, care asigură posibilitatea înțelegerii reciproce bazate pe comunitatea comunicării.În aceste situații, comunicarea trebuie să includă enunțuri complexe și conexiunile lor semantice, care determină stocul. a informaţiilor disponibile unui sistem complex. T. conține de fapt nu numai informații despre realitate, ci și meta-informații (informații despre informații), care fac posibilă primirea de mesaje noi.

Lit.: Cherny A.I., Metodologia generală de construire a tezaurelor, „Informații științifice și tehnice. Ser. 2", 1968, =5; Varga D., Metodologia întocmirii tezaurelor informaţionale, trad. [din maghiară], M., 1970; Shreider Yu. A., Tezaure în informatică și semantică teoretică, „Informații științifice și tehnice. Ser. 2", 1971, ╧ Z.

Yu. A. Schrader.

Wikipedia

Tezaur

Tezaur, în sens general - terminologie specială, mai strict și mai specific - un dicționar, colecție de informații, corpus sau cod, care acoperă în întregime concepte, definiții și termeni ai unui domeniu special de cunoaștere sau a unui domeniu de activitate, care ar trebui să contribuie la corectarea lexicalului, comunicare corporativă; în lingvistica modernă - un tip special de dicționar care indică relații semantice (sinonime, antonime, paronime, hiponime, hiperonime etc.) între unitățile lexicale. Tezaurile sunt unul dintre cele mai eficiente instrumente pentru descrierea domeniilor individuale de subiect.

Spre deosebire de un dicționar explicativ, un tezaur vă permite să identificați sensul nu numai printr-o definiție, ci și prin corelarea unui cuvânt cu alte concepte și grupurile acestora, datorită cărora poate fi folosit pentru a umple bazele de cunoștințe ale sistemelor de inteligență artificială.

În trecut termenul tezaur au fost desemnate în primul rând dicționarele, reprezentând vocabularul limbii cu maximă completitudine cu exemple de utilizare a acesteia în texte.

Tot termen tezaur folosit în teoria informaţiei pentru a desemna totalitatea tuturor informaţiilor deţinute de subiect.

În psihologie, tezaurul unui individ se caracterizează prin percepția și înțelegerea informațiilor. Teoria comunicării are în vedere și tezaurul general al unui sistem complex prin care elementele sale interacționează.

Tezaur (dezambiguizare)

Tezaur:

  • Tezaurul este un dicționar, o colecție de informații care acoperă concepte, definiții și termeni ai unui domeniu special de cunoaștere sau a unui domeniu de activitate.
  • Tezaurul lui Roger este unul dintre primele din istorie și cele mai faimoase dicționare ideografice de astăzi.

Exemple de utilizare a cuvântului tezaur în literatură.

Pentru percepție și co-creare, un anumit optim tezaur, nu mic, dar nici prea mare.

Cu o cantitate nelimitată de informații primite, depășind semnificativ tezaur, valoarea sa nu depinde de această cantitate și este în întregime determinată tezaur ohm

Versatilitatea și natura sistematică a artei duce la percepția neuniformă a operei în ansamblu: pentru perceperea unor aspecte ale versului tezaur optim, pentru alții este insuficient sau prea mare.

Deoarece tezaur crește și se schimbă, re-cunoașterea cu munca poate însemna obținerea de noi informații valoroase.

Dorința unui copil de a reciti de multe ori basmul lui preferat este de înțeles: el tezaur este în creștere rapidă și capacitatea lui de co-creare și fantezie asociativă este deosebit de mare.

Acest aspect al problemei este mai schimbător și subiectiv decât tezaur, iar în căutarea unei evaluări estetice obiective a unei lucrări ar trebui redusă la minimum.

El pătrunde tezaur poet și se adresează traducerii tezaur de la un cititor de limbi străine.

Cel mai important lucru este să determinați cât de mare aveți tezaur, T.

Nu, doar că propriul lui bagaj este puțin, este nedezvoltat, al lui tezaur este la început, iar dacă nu înțelege asta tezaur ar trebui să fie crescută, atunci, în orice caz, această femeie va avea o perioadă grea cu el.

Bogat tezaur, bazat pe cunoștințe adevărate, permite unei persoane, în comunicare cu o altă persoană, inclusiv în cea mai apropiată comunicare cu cea mai apropiată persoană, să reacționeze corect la orice se întâmplă.

Este evident că scăderea valorii informaţiei odată cu creşterea tezaur trebuie să depindă de relație tezaur la cantitatea de informații primite.

Evident, valoarea optimă a informațiilor artistice corespunde proximității tezaur cititor și tezaur poet.

Putem spune că co-crearea, ca și creativitatea, necesită inspirație, adică incluziune tezaurîn sensul larg al cuvântului.

O astfel de repetiție internă a imaginilor strălucitoare și a sunetului strălucitor, rămânând în același timp în cadrul existentului tezaur, o îmbogățește cu același moment estetic de repetiție.

În acest moment tezaur Nabokov și Prișvin ar trebui considerați antipozi pentru Platonov, iar Marina Tsvetaeva poate fi considerată similară cu el.