Pentru a analiza scara raportului, se folosesc tipuri de statistici. Prelegeri despre statistică matematică. Tipuri de scale de măsurare variabile

În studiile statistice se folosesc diverse tipuri de semne care caracterizează starea unui obiect economic. Semnele pot avea aspecte diferite în funcție de scara de măsurare, ceea ce afectează și mai mult alegerea metodelor de analiză statistică.

În funcție de scara de măsurare, se disting datele cantitative (numerice) și categoriale (nenumerice, calitative) (vezi Fig. 3.1).

Cantitativ (numeric) datele sunt indicatori care preiau valori numerice, care se obtin prin unele masuratori sau calcule.

În ceea ce privește scalele de măsurare, datele cantitative sunt considerate a fi măsurate pe o scară de interval, care este utilizată pentru a reprezenta mărimea diferenței dintre caracteristicile itemilor. O scară de interval (cantitativă) arată cât de mult o valoare este mai mare decât alta în unitățile de măsură acceptate (de exemplu, o scară de temperatură, timp, număr de obiecte). O scară de interval poate avea o origine și o scară arbitrare. Setul de transformări admisibile la o scară dată este format din toate transformările liniare. Principala proprietate a scalei este păstrarea raportului dintre lungimile intervalului. Cazuri speciale ale scalei intervalului sunt scara raportului (punctul de referință zero) și scara diferențelor (punctul de referință arbitrar și scara unitară), precum și scara absolută (punctul de referință zero și scara unității de referință). Scale cantitative permit toate operațiunile aritmetice asupra rezultatelor măsurătorilor (de exemplu, salariile, soldurile conturilor bancare, numărul de angajați într-o companie).

Daca datele sunt obtinute prin masuratori si pot lua absolut orice valoare dintr-un anumit interval sau intreaga axa numerica, acestea se numesc continuu. Dacă datele formează un set numărabil și iau doar câteva valori izolate pe axa numerelor, între care nu pot exista valori, atunci astfel de caracteristici sunt numite discret.

Exemple de date cantitative discrete

  • Numărul de apeluri de ambulanță primite zilnic în spitalele din Moscova.
  • Numărul de companii de asigurări din Federația Rusă care au licențe.
  • Numărul de evenimente asigurate care au avut loc în portofoliul de contracte de asigurare a carcasei auto al companiei de asigurări în cursul anului.
  • Numărul de refugiați și de persoane strămutate în interior, înregistrate oficial de către Serviciul Federal de Migrație în 2011.

Sursă: URL: http://rating.rbc.ru/article.shtml92008/09/30/32143066.

Datele sunt prezentate sub formă de tabel, sub formă de grafic linie și grafic cu bare.

Două variabile - „numărul de mașini din oraș” și „populația orașului” - sunt cantitative discrete. Pentru claritate, graficul arată o variabilă calculată ca raport al acestora - numărul de mașini la o mie de locuitori.

Exemple de date cantitative continue

  • Dinamica prețurilor contabile pentru aur în Rusia în ultimii 20 de ani.
  • Înălțimea, greutatea, tensiunea arterială și alți indicatori măsurați ai unei persoane.
  • Randamentul culturilor agricole la fermele din Federația Rusă.
  • Producția de lapte în fermele de animale din Districtul Federal Central.
  • Raza de zbor a unui proiectil tras dintr-o armă.

Sursă: URL: http://rating.rbc.ru/articles/201 l/ll/09/33470757_tbl.shtml?2011/11/08/33470320.

Pentru a prezenta datele privind variabila cantitativă continuă „Activul net”, s-au folosit un formular tabelar și un grafic cu bare.

Un alt grup, semnificativ diferit de datele cantitative, constă din nenumerice - categoric sau calitate date. În acest caz, un obiect poate aparține doar uneia dintre multe categorii (clase). Acest lucru se întâmplă mai ales la crearea și prelucrarea chestionarelor, chestionarelor, evaluărilor etc. Chiar dacă desemnați aceste categorii cu numere (de exemplu, recodificați: 0 - feminin, 1 - masculin), atunci nu puteți lucra cu astfel de date ca numerice, ci doar ca categoriale.

În funcție de faptul că aceste categorii pot fi ordonate, caracteristicile sunt măsurate pe o scară nominală sau ordinală. În consecință, datele sunt împărțite în nominalȘi ordinal.

Scala de nume (nominal sau scala de clasificare). Datele la această scară sunt definite în termeni de categorii care nu pot fi ordonate în mod semnificativ (profesie; regiune a țării; oraș; număr de grup de studenți; bancă în care există depozit). Scala nominala folosit pentru a descrie apartenența elementelor la anumite clase. Tuturor elementelor aceleiași clase li se atribuie aceeași valoare sau număr de text, iar elementelor din clase diferite li se atribuie valori sau numere diferite. Orice înlocuire de numere pentru a desemna clase este acceptabilă, atâta timp cât este o transformare unu-la-unu și fiecare clasă primește propriul număr. Această împrejurare determină setul de transformări admisibile ale scalei nominale ca mulțime a tuturor funcțiilor unu-la-unu. Nu există niciun motiv să credem că o categorie este mai bună (sau mai proastă) decât alta, așa că atunci când se prelucrează astfel de date se folosesc doar operațiuni de comparare: „egal” și „nu este egal”.

  • Orașul Federației Ruse (Vladivostok, Surgut, Tyumen etc.).
  • Grupa sanguină umană (O, A, B, AB).
  • Starea civilă (căsătorit, căsătorit, divorțat, într-un parteneriat civil).
  • Banca Rusiei (Sberbank of Russia, VTB, Gazprombank etc.).
  • Districtele federale ale Rusiei (Central, Orientul Îndepărtat etc.).

Exemplul 3.12


Datele privind variabila categorială nominală „culoarea ochilor” sunt prezentate sub formă de tabel și sub formă de diagramă circulară (Graficul proporțiilor).

Un alt tip de variabile categorice este ordinal (ordinal) - diferă prin faptul că datele sunt măsurate pe o scară ordinală. Scale ordinale sunt folosite pentru a organiza elemente după una sau mai multe caracteristici. Ele ne permit să stabilim că un element este mai bun, mai important, preferabil altuia sau egal cu altul. Scara ordinală reflectă doar ordinea în care apar elementele și nu face posibil să se spună cu cât sau de câte ori este de preferat un element față de altul. Cu alte cuvinte, în această scară este imposibil să se determine gradul de preferință. Pentru a compara astfel de date, nu sunt permise numai operațiunile „egal” și „nu este egal”, ci și „mai mult” - „mai puțin” (fără a determina cât de mult).

  • Răspunsuri la întrebările din chestionar care conțin următoarele opțiuni de răspuns: da; mai mult da decât nu; nu mai mult decât da; Nu.
  • Note primite de elevi la examen (excelent, bun, satisfăcător, nesatisfăcător).
  • Funcția deținută de un angajat într-un laborator științific (cercetător junior, cercetător, cercetător senior etc.);
  • Grade militare în armata rusă (locotenent, căpitan, maior, colonel etc.).

L (înalt), ÎN(satisfăcător), B+(suficient), B++(acceptabil),

CU(nesatisfăcător), D(faliment), E(revocarea licenței sau lichidare))


Una dintre cele mai frecvente probleme întâlnite în proiectarea și instrumentarea sondajului este modul în care se atribuie o valoare sau un punctaj reprezentativ unic unei atitudini sau unui comportament complex. Ca exemplu, luați în considerare modul în care s-ar putea măsura părtinirea publică față de studenții. O astfel de părtinire se poate manifesta într-o varietate de forme, în funcție de ce caracteristici ale elevilor se concentrează atenția unui anumit individ (respondent). Astfel, unii oameni judecă elevii după haine, alții după maniere, alții după comportamentul lor în viața de zi cu zi, după statutul lor socioeconomic și chiar după nivelul lor de igienă personală. Alții s-ar putea să-și fi format o opinie stereotipă bazată doar pe una sau două întâlniri (plăcute sau nu) cu anumiți studenți; iar unii pot fi cu greu capabili să distingă un student de alți oameni. Elementele de judecată pot varia foarte mult în ceea ce privește conținutul, focalizarea și gradul de evaluare, dar fiecare dintre ele reprezintă, cel puțin potențial, o componentă a conceptului mai larg de „prejudecată”.

Dacă este necesar să ținem cont de toate aceste puncte, atunci trebuie să alegem un instrument care va fi capabil să identifice și să măsoare cât mai multe dintre aceste elemente constitutive ale conceptelor posibil și, în același timp, să fie suficient de precis pentru a ne permite determina gradul de manifestare a unui concept general intr-o singura observatie. Cu alte cuvinte, avem nevoie de un instrument care să surprindă și să afișeze un concept precum conceptul de „prejudecată” în toate detaliile sale și, în plus, să ne arate cât de mult (ce proporție) este conținută în acest concept într-un anumit caz sau răspunsul respondentului. Un astfel de mijloc se numește scalare.

Scalarea este o procedură de combinare a unui număr de indicatori relativ restrânși (de exemplu, articolele de sondaj referitoare la caracteristicile individuale ale elevilor observate de respondenți) într-o singură măsură rezumativă, care este luată pentru a reflecta un concept de bază mai larg (în cazul nostru, prejudecată) , din care face parte fiecare caracteristică individuală. Astfel, s-ar putea măsura atitudinile respondentului față de diferitele tipuri de comportament al elevilor (de exemplu, cât de mult alcool beau sau cât de zgomotoase sunt petrecerile lor) sau manierele studențești (cât de aroganți, aroganți sau neconsiderați sunt). dar nu am putea accepta niciunul dintre aceste semne separat ca o reflectare deplină a unui concept atât de larg ca prejudecata. Mai degrabă, ar trebui să aducem cumva toate aceste măsuri împreună pentru a putea trage concluzii despre punctul de vedere mai general pe care fiecare dintre ele îl completează și îl reflectă într-un fel. Mai mult, trebuie să rezolvăm această problemă în așa fel încât să putem compara cantitatea de părtinire (sau orice concept pe care îl măsurăm) conținută în răspunsul unui respondent cu cantitatea conținută în răspunsul altui respondent și, în cele din urmă, să judecăm cine dintre ele. respondenții sunt mai prejudiciați.

O măsură unificatoare care reflectă un anumit concept de bază se numește scară. Valoarea particulară a gradului de manifestare în fiecare caz dat a conceptului de bază se numește evaluare la scară. Scalare, sau construcția scalei, este procedura prin care cercetătorul construiește o scală și atribuie scoruri pe acea scală cazurilor individuale.

Scalare este o metodă de modelare a proceselor reale folosind scale.

Scalare este o metodă de atribuire a valorilor numerice atributelor individuale ale unui sistem.

Scalare vă permite să descompuneți descrierea unui proces complex într-o descriere a parametrilor pe scale separate. Ca rezultat, atunci când se aplică problemelor economice, de exemplu, se poate face o idee despre zona de interes a consumatorului și se poate explora importanța fiecărei scale pentru el.

Scala (latina scala - ladder) - o comparație a rezultatelor măsurării unei cantități și a punctelor de pe o dreaptă numerică.

O scară este un set de desemnări, relațiile dintre care reflectă relațiile dintre obiectele sistemului empiric. O scară poate fi numită rezultatele măsurătorii obținute într-un studiu, precum și un instrument de măsurare (adică un sistem de întrebări, un chestionar, un test).

1.2 Tipuri de scale și tipuri de scalare

Scalele sunt împărțite pe tip, în funcție de relațiile pe care le reflectă. În plus, fiecare scară corespunde transformărilor matematice acceptabile pentru această scară. Tipurile de scale sunt ordonate ierarhic în funcție de complexitate. În psihometrie, econometrie și statistică aplicată, următoarea clasificare a scalelor, propusă în 1946 de Stanley Smith Stevens, este acceptată:

– scară de nume (nominal) – cea mai simplă dintre scale. Numerele sunt folosite pentru a distinge obiectele. Afișează acele relații prin care obiectele sunt grupate în clase separate, care nu se suprapun. Numărul clasei nu reflectă conținutul său cantitativ. Un exemplu de scară de acest fel este clasificarea subiecților în bărbați și femei, numerotarea jucătorilor din echipele sportive etc. Numerele de telefon, pașapoartele, codurile de bare ale mărfurilor, numerele de contribuabil individual sunt măsurate într-o scară de nume;

– scară ordinală – afișarea relațiilor de ordine. Subiectele din această scală sunt clasate. Pentru această scară este acceptabilă o transformare monotonă. O astfel de scară este brută pentru că nu ține cont de diferențele dintre subiecții scalei. Un exemplu de astfel de scară: scorurile de performanță academică (nesatisfăcător, satisfăcător, bun, excelent), scala Mohs;

– scară de interval – pe lângă relațiile indicate pentru scalele de nume și ordine, afișează relația distanței (diferenței) dintre obiecte. Diferențele în toate punctele de pe această scară sunt egale. O transformare liniară este acceptabilă pentru aceasta. Acest lucru vă permite să reduceți rezultatele testelor la scale comune și astfel să comparați indicatorii. Exemplu: scara Celsius.

– scară de raport – spre deosebire de scara de interval, poate reflecta cât de mult este un indicator mai mare decât altul. Scala de relații are un punct zero, care caracterizează absența calității măsurate. Această scară permite transformarea similarității (înmulțirea printr-o constantă). Determinarea punctului zero este o sarcină dificilă pentru cercetarea psihologică și impune limitări în utilizarea acestei scale. Folosind astfel de scale, pot fi măsurate masa, lungimea, rezistența și valoarea (prețul). Exemplu: scara Kelvin (temperaturi măsurate de la zero absolut, cu unitatea de măsură aleasă cu acordul experților - grad Celsius).

Scala diferențelor – punctul de plecare este arbitrar, este specificată unitatea de măsură. Transformările acceptabile sunt schimbări. Exemplu: măsurarea timpului.

Scară absolută - conține o caracteristică suplimentară - prezența naturală și neechivocă a unei unități de măsură. Această scară are un singur punct zero. Exemplu: numărul de persoane din audiență.

Problema tipului de scară este direct legată de problema adecvării metodelor de prelucrare matematică a rezultatelor măsurătorilor. În general, statisticile adecvate sunt cele care sunt invariante în raport cu transformările admisibile ale scalei de măsurare utilizate.


Orez. 1. Clasificarea metodelor de scalare

Metodele de scalare utilizate în cercetarea sociologică pot fi împărțite în comparative și necomparative.

Scalele comparative implică compararea directă a obiectelor în cauză. De exemplu, respondenții sunt întrebați dacă preferă Cola sau Pepsi. Datele din scalele comparative sunt considerate relative și au proprietățile doar ale valorilor ordinale și de rang. Prin urmare, scalarea comparativă este numită și nonmetrică. După cum se arată în Fig. 1, scalele comparative includ compararea perechilor, clasarea ordinală, scalele cu sumă constantă, sortarea Q și alte operațiuni.

Scalele comparative sunt una dintre cele două metode de scalare care implică compararea directă a obiectelor în cauză.

Principalul avantaj al scalării comparative este capacitatea de a recunoaște diferențele subtile dintre obiectele luate în considerare. Atunci când compară două obiecte, respondenții trebuie să aleagă între ele. În plus, respondenții finalizează sarcina pe baza scorurilor de preferințe date. Acest lucru face scalele comparative ușor de înțeles și aplicat. Un alt avantaj al acestor scale este numărul comparativ mai mic de ipoteze teoretice utilizate, precum și eliminarea influenței efectului de halo, sau a efectului de trecere, atunci când o preferință puternică pentru un produs denaturează evaluarea comparativă a altora. Principalul dezavantaj al scalelor comparative este natura lor ordinală și limitarea analizei la un anumit număr de obiecte luate în considerare. De exemplu, ar trebui efectuat un nou studiu pentru a compara RC Cola cu Coca Cola și Pepsi. Aceste dezavantaje sunt în mare măsură eliminate atunci când se utilizează metode de scalare non-comparative.

Când se utilizează scale necomparative, numite și scale monadice sau metrice, fiecare obiect din populația originală luată în considerare este evaluat independent de celelalte. Datele obținute sunt considerate a fi măsurate pe o scară de interval sau relativă.

Scalele necomparative sunt una dintre cele două metode de scalare care implică autoevaluarea fiecărui obiect.

De exemplu, respondenților li se poate cere să evalueze Soke pe o scară de preferințe de la 1 la 6 (1 = nu le place deloc, 6 = îmi place foarte mult). Pepsi și RC Cola au prețuri similare. Din fig. 1 arată că scalele de evaluare necomparative pot fi continue sau detaliate. Scalele de evaluare detaliate, la rândul lor, sunt împărțite în scale: Likert, diferențial semantic și Stapel. În cercetarea de marketing, scalarea non-comparativă este cel mai des utilizată. Această secțiune discută tehnicile de scalare comparativă.

1.3 Principalele probleme în construirea scalelor

Din cele de mai sus, scalarea poate părea a fi o procedură destul de simplă, simplă, atunci când sarcina cercetătorului este pur și simplu să identifice o serie de componente ale conceptului principal, să stabilească ce indicator poate fi utilizat pentru a măsura fiecare dintre ele, apoi să combine acești indicatori în o evaluare totală „... rostind câteva cuvinte magice sau vrăji statistice, și - unu-doi! - E gata". Din păcate, această simplitate aparentă este înșelătoare, deoarece atunci când selectăm și interpretăm componentele unei scale, putem întâlni o serie de capcane care necesită o atenție specială. În primul rând, există probleme asociate cu conceptele de validitate și fiabilitate.

Valabilitatea este o proprietate determinată de răspunsul la întrebarea: „Măsurăm cu adevărat ceea ce vrem să măsurăm?” În contextul nostru actual, această întrebare poate fi oarecum transformată după cum urmează: „Există vreun motiv să credem că fiecare dintre componentele individuale ale scalei (fiecare dintre întrebările specifice) este într-adevăr direct legată de conceptul principal și că toate componentele împreună surprinde pe deplin acest concept?” Cu alte cuvinte, trebuie să ne punem întrebarea: „Există oare vreun sens în a combina un număr de indicatori parțiali între ei și – din moment ce am făcut deja acest lucru – are rost să etichetăm această serie de indicatori cu eticheta de conceptul de bază pe care l-am ales?” Astfel, revenind din nou la exemplul elevilor, este necesar să aflăm, în primul rând, dacă opinia unei persoane despre comportamentul elevilor este direct legată de opinia sa despre stilul vestimentar al elevului sau despre manierele elevilor și, în al doilea rând, dacă toate aceste opinii în ansamblu reflectă într-adevăr gradul în care o anumită persoană este prejudiciată față de studenți.

În ceea ce privește fiabilitatea, aceasta este determinată de răspunsul la întrebarea: „Indiferent de ce măsurăm exact, o facem în mod consecvent?” Când este aplicată la scalare, această problemă se traduce printr-o îngrijorare că diferiții indicatori care alcătuiesc scala sunt legați între ei într-un mod consistent și semnificativ. Ceea ce ne interesează cu adevărat aici nu este dacă un anumit set de întrebări sau măsuri ne permite să distingem merele de portocale, ci mai degrabă dacă acest set ne permite să sortăm în mod constant merele pe care le-am identificat deja după mărime, culoare etc., conform la un anumit standard. Dacă da, atunci combinarea diferitelor măsuri va spune mai multe despre mere decât orice măsură unică. Dar dacă standardele noastre (culoare, mărime etc.) sunt inconsecvente sau ambigue, atunci observațiile bazate pe ele se pot dovedi a fi false. 1

Poate că un alt exemplu va ajuta la clarificarea acestor puncte. Să luăm în considerare o anumită scară concepută pentru ca fiecare respondent să-și exprime acordul sau dezacordul cu următoarele afirmații:

1. Cubanezii sunt răi și nu pot avea încredere.

2. Francezii sunt răi și nu se poate avea încredere

3. Japonezii sunt răi și nu se poate avea încredere.

4. Chinezii sunt răi și nu se poate avea încredere.

Să ne imaginăm că avem o scală de măsurare a xenofobiei, adică a fricii și a neîncrederii față de străini. Probabil, cu cât un respondent este de acord cu mai multe afirmații, cu atât este mai mare nivelul de xenofobie pe care îi putem atribui. Dar acesta va fi cazul? O persoană care crede că doar cubanezii sunt răi și nu se poate avea încredere, afirmă acest lucru mai mult din anticomunism decât din xenofobie. La rândul său, o persoană care crede că doar japonezii și chinezii sunt răi și nu se poate avea încredere, afirmă acest lucru mai mult din rasism decât din xenofobie. Și chiar și respondentul care crede că toate cele patru grupuri sunt rele și nu se poate avea încredere, după cum se dovedește la o examinare mai atentă, nu suferă de xenofobie, ci mai degrabă de sentimentul că toți oamenii, sau toate guvernele (chiar și țara în care trăiește ) sunt rele și nu trebuie să aveți încredere.credeți. Și, prin urmare, din moment ce nu putem spune cu încredere că această scară măsoară xenofobia în esența sa, atunci această scară este invalidă. Și putem chiar să avem încredere în ea? Este gândit gândit pentru a măsura chiar și nivelul de xenofobie? Frica și neîncrederea față de chinezi, de exemplu, pot fi un indicator al a cel puțin două caracteristici foarte diferite, una ideologică și alta motivată rasial, iar doi respondenți ar putea da același răspuns din motive foarte diferite. Și sentimentul de xenofobie va fi același pentru un anticomunist și pentru un rasist? Cel mai probabil nu. Astfel, legătura mecanică a acestor puncte specifice în scopul comparării lor va fi în cel mai bun caz un exercițiu de inutilitate și, în cel mai rău caz, o sursă de concluzii eronate. 1

Problemele de acest fel nu sunt întotdeauna ușor de depășit și, din această cauză, atunci când scalați trebuie să acționați cu mare atenție, calculând totul în avans. Cu toate acestea, capacitatea de a reprezenta o atitudine sau un comportament complex ca un singur număr sau scor, ceea ce reprezintă un avantaj incontestabil al scalei, servește ca un stimulent pentru a utiliza această tehnică într-o mare varietate de cazuri.

2. ROLUL SCARELOR ÎN PROCESUL DE ANALIZĂ A DATELOR

O scară de măsurare este un algoritm pentru atribuirea unui număr unui obiect, reflectând prezența sau gradul de exprimare a unei anumite proprietăți. Există patru tipuri principale de scale de măsurare: scară de nume, scară de ordine, scară de interval și scară de raport. Scalele de nume și ordinea permit unui obiect să fie clasificat într-una dintre mai multe clase care nu se suprapun și sunt numite „calitative”. Scalele de interval și raport măsoară „cantitatea” sau gradul de exprimare a unui obiect cu o anumită proprietate și sunt numite „cantitative”. Scala de numire (scala nominală) vă permite să clasificați un obiect într-una din mai multe clase, între care nu s-a stabilit nicio relație de ordine, adică. clase în raport cu care nu se aplică comparații precum „mai mult – mai puțin”, „mai bine – mai rău”, etc. Pe scale nominale sunt măsurați indicatori sociologici precum sexul, naționalitatea sau rasa, culoarea ochilor, temperamentul etc. La elaborarea unei scale nominale, este compilată o listă completă de clase, care este numerotată în ordine aleatorie. În acest caz, numerele care reprezintă numerele de clasă joacă rolul de simboluri sau „etichete”; nu le pot fi aplicate operații aritmetice. Cu alte cuvinte, pe scara nominală este definită doar relația de identitate: obiectele atribuite unei clase sunt considerate identice, obiectele atribuite unor clase diferite nu sunt identice. Un caz special al unei scale nominale este o scară dihotomică, care înregistrează prezența sau absența unei anumite proprietăți într-un obiect. Prezența calității este de obicei notă cu numărul „1”, absența acesteia cu numărul „0”. Scala de ordine are scopul de a atribui un obiect uneia dintre clasele disjunse, ordonat după un anumit criteriu. Pe scara de ordine, pe lângă relația de identitate, este definită și relația de ordine („mai mult este mai puțin”). Astfel, despre obiectele clasificate ca clase diferite, putem spune că într-una dintre ele proprietatea măsurată este exprimată mai puternic decât în ​​cealaltă, dar este imposibil de determinat cât de puternică. Exemple tipice de scară de ordine sunt educația, tipul de așezare, statutul social, gradele militare etc. La construirea unei scale de ordine, clasele sunt numerotate în ordinea crescătoare sau descrescătoare a caracteristicii corespunzătoare. Operațiile aritmetice asupra numerelor de clasă nu sunt efectuate. Un caz special al unei scale de ordine este o scară de rang, folosită în cazurile în care un anumit atribut nu poate fi măsurat, dar obiectele pot fi ordonate după criteriul corespunzător sau când ordinea obiectelor este mai importantă decât rezultatul exact al măsurării - pt. de exemplu, locurile ocupate în competițiile sportive. Scalele de rang sunt folosite și în studiul preferințelor, orientărilor valorice, motivelor, atitudinilor etc. În acest caz, intimatul este rugat să ordoneze lista propusă de obiecte, concepte sau judecăți după un anumit criteriu. Un alt caz special al unei scale de ordine este o scară de evaluare, cu ajutorul căreia proprietățile unui obiect sau atitudinea respondentului față de ceva sunt evaluate pe baza unui anumit număr de puncte. De exemplu, performanța academică este evaluată pe o scară de 5 puncte. Scalele de evaluare sunt adesea văzute ca o excepție de la scalele de ordine, deoarece presupun că există o distanță aproximativ egală între punctele de pe scară. De exemplu, se presupune că un elev „excelent” cunoaște materia la fel de mult mai bine decât un elev „bun” pe cât o știe elevul „bun” mai bine decât un elev „C”. Această proprietate permite ca scalele de evaluare să fie tratate ca cvasi-interval în multe cazuri și utilizate în consecință, de exemplu, pentru a calcula GPA sau pentru a determina performanța medie într-o clasă. Scalele de interval și raport sunt S.I. În sensul literal al cuvântului. Ele se caracterizează prin prezența unei unități de măsură care permite să se determine cât de mult este un obiect mai mare sau mai mic decât altul, în funcție de criteriul studiat. Diferența dintre aceste două tipuri de scale este că scara raportului are un zero „obiectiv”, independent de arbitrariul observatorului, care, de regulă, corespunde cu absența completă a calității măsurate în obiect. Pe scara intervalului, zero este stabilit în mod arbitrar sau în conformitate cu unele tradiții și acord. Astfel, vârsta este măsurată pe o scară de proporții, iar cronologia este măsurată pe o scară de intervale, deși ambele scale folosesc aceeași unitate de măsură - anul. Pe scara intervalului, pe lângă relațiile de identitate și ordine, se definește relația de diferență: pentru orice pereche de obiecte se poate determina câte (unități de măsură) un obiect este mai mare sau mai mic decât celălalt. Scalele de intervale sunt utilizate pe scară largă în testele psihologice și psihometrice, tehnici diferențiale semantice și alte metode de măsurători secundare. Scalele de atitudine măsoară indicatori precum înălțimea, vârsta, venitul, experiența de muncă, numărul de țigări fumate etc. Pentru astfel de variabile sunt definite nu numai relațiile de identitate, ordine și diferență, ci și relația de relații, ceea ce face posibil să se determine de câte ori un obiect este mai mare sau mai mic decât altul.

Măsurarea este maparea unui sistem empiric într-un sistem numeric care păstrează ordinea relațiilor dintre obiecte. Conceptul clasic de măsurare distinge două moduri de atribuire a valorilor variabile obiectelor. Prima metodă se numește evaluare. Maparea proprietăților obiectului pe scară se realizează aici în unități convenționale. De exemplu, este posibil să se determine cu diferite grade de acuratețe locul unei persoane pe scara „conservatorismului”. Nu există nicio unitate de conservatorism la dispoziția cercetătorului; gradațiile se pot schimba arbitrar.

Măsurarea în sine necesită definirea unei unități - standardul scalei. În acest caz, pot fi măsurate numai caracteristicile spațiale și temporale, precum și numerele - cantități aditive. Cu toate acestea, o viziune mai largă a măsurării ca atribuire de semnificații obiectelor în conformitate cu un sistem dat de relații la diferite niveluri a câștigat acceptarea în științele sociale și comportamentale.

O variabilă nu este același lucru cu un atribut sau o proprietate reală. Acesta este un fel de riglă - un set de norme și operațiuni care sunt necesare și suficiente pentru a califica un eveniment, o proprietate, o relație, într-un cuvânt, tot ceea ce este înțeles în mod obișnuit ca fapte. Pentru o riglă, nu este foarte important dacă diviziunile sale sunt aplicate pe o placă de lemn, plastic sau metal. Mult mai importantă este gradarea scalei, precum și capacitatea utilizatorului de a efectua măsurători corect. Situația este similară la măsurarea comportamentului, doar „rigla” în acest caz are forma unui chestionar (sau formular de observație), iar „aplicarea” acestora unui obiect nu este altceva decât o definiție operațională.

Ca instrument de măsurare, o variabilă este construită de către cercetător prin stabilirea unui continuum de valori (gradații). Minimumul minim al continuumului, așa cum știm deja, este o dihotomie: „da” și „nu”, plus și minus, afirmare și negație. De fapt, aproape întotdeauna ne ocupăm de tricotomii, deoarece orice variabilă include o gradare de „fără răspuns” (sau „fără date”).

Astfel, variabila conține trei componente: 1) unele concepte nu întotdeauna clar formulate ale atributului care se măsoară, de exemplu, „preferințe electorale”, „stabilitatea familiei”, „educație” etc.; 2) scară - un set de valori care definesc criteriile de clasificare a obiectelor; 3) definiție operațională - un set de instrucțiuni care reglementează procesul de identificare a unui obiect după o scară de valori stabilită.

Nivelul elementar de măsurare este nominal. Acest nivel corespunde unei scale de denumire, care constă din valori caracteristice care nu sunt ordonate după grade crescătoare sau descrescătoare. Exemple tipice ale unei scale de nume: naționalitate, profesie, convingeri politice. Valorile scalei de numire sunt construite în conformitate cu regulile de clasificare logică. Prima dintre acestea este regula necontradicției. Acesta afirmă: „Un obiect poate fi atribuit unei singure clase, așa cum este specificat de valoarea variabilei.” Cu alte cuvinte, cercetătorul este obligat să numească pică o pică și să evite dialectica, în care un obiect se dovedește simultan a fi ambele. Acest lucru nu este atât de ușor de făcut pe cât pare - să numiți un lucru prin numele său propriu. Reacționarii par uneori liberali, proștii par deștepți, femeile par bărbați. Dar chiar și în cele mai dificile situații, analistul este obligat să dea o calificare fără ambiguitate obiectului. Multe sunt permise aici. Singurul lucru interzis este clasificarea unui obiect ca fiind alb și negru în același timp.

Consecința acestei reguli este suma sută la sută a frecvențelor tuturor gradațiilor variabilei. Dacă suma frecvențelor depășește pragul de sută la sută, înseamnă că cel puțin unele unități se încadreau în două clase simultan și au fost numărate de mai multe ori. Acest lucru se întâmplă atunci când chestionarul solicită o scară asortată, unde poți alege unul, și celălalt și al treilea. De exemplu, este întrebat: „Ce iubești cel mai mult?” cu variante de răspuns: matzo, shish kebab, libertăți liberal-democrate... Aici poți alege toate sfaturile chestionarului și nu vei obține un total de 100% dacă cel puțin unul dintre respondenți se încadrează în clasa celor care îi iubesc pe amândoi matzo și libertăți democratice liberale. Motivul distorsiunii este că pozițiile date nu constituie o variabilă; dimpotrivă, fiecare dintre ele este o versiune „trunchiată” a variabilei. Versiunea completă necesită răspunsurile „Da”, „Nu” și „Nu pot spune”. O variabilă corect construită reprezintă un continuum unidimensional. Spre deosebire de dimensiunile cu mai multe părți, nu necesită agregare. De aici a doua regulă - regula unei singure baze de clasificare. Nu poți împărți oamenii în oameni deștepți și oameni cu părul roșu, pentru că uneori oamenii cu părul roșu se dovedesc a fi deștepți. Nu puteți amesteca două variabile diferite într-o singură întrebare. Este imposibil să nu ținem cont de schimbarea sensului unei variabile atunci când aceasta este mutată în alt context. De exemplu, o întrebare despre atitudinea față de intelectuali pusă la Moscova și Chicago se va dovedi a fi două întrebări diferite, deoarece în tradiția rusă se obișnuiește să se atribuie intelectualului rolul de purtător al principiilor morale, în timp ce rezident al Chicago nu va ghici imediat cine se înțelege prin „intelectual”.

A treia regulă este regula completității. În populația studiată nu trebuie să existe un singur obiect care să nu poată fi identificat prin valorile date. Cu alte cuvinte, obiectul trebuie să fie distribuit pe continuum-ul variabilei și să-și primească locul cuvenit într-una dintre clase. Dacă acest lucru nu se întâmplă, procesul de măsurare „îngheață” - pur și simplu nu există nimic sau nimeni căruia să aplici rigla. Rețineți că poziția „Fără date” rezolvă problema completității atunci când scara nu acoperă întregul interval de valori. De exemplu, refuzul unui respondent de a-și raporta vârsta nu înseamnă că scala de vârstă este irelevantă pentru element. Exemplele de scale care nu au nicio legătură cu obiectul, cu alte cuvinte, nu sunt relevante pentru acesta, sunt numeroase. Sociologii încearcă adesea să măsoare opiniile, atitudinile și alte caracteristici personale, presupunând că fiecare are proprietatea studiată. De exemplu, întrebarea: „Care este atitudinea dumneavoastră față de Burbulis?”, pusă de unele centre de cercetare a opiniei publice în 1992, s-a bazat pe convingerea că proprietatea „Atitudine față de Burbulis” este prezentă la toți cei incluși în eșantion. A fost exclusă însăși posibilitatea ca o persoană să nu aibă o atitudine nici pozitivă, nici negativă față de Burbulis. Poziția „Nu pot spune” ar părea să includă acest tip de respondenți, dar aceasta îi include nu numai pe cei care nu au o opinie, ci și pe cei care nu au atributul în sine.

În măsurarea sociologică, apare adesea un tip de variabilă emergentă creată artificial - variabile generate de procedura în sine. Persoanele care nu au avut nicio relație cu caracteristica studiată înainte de interviu construiesc această relație în procesul de comunicare interpersonală cu intervievatorul, răspunzând „pozitiv”, „negativ” sau cel mai adesea „neutru”. Cauzele variabilelor emergente sunt cel mai mult legate de influența intervievatorului.

G. A. Pogosyan arată circumstanțe tipice în care variabilele descriu nu atât comportamentul independent de vorbire al respondentului, cât mai degrabă situația culegerii datelor. În special, Pogosyan a arătat că solicitarea unui răspuns schimbă semnificativ distribuția frecvenței.

Tabelul arată că „hint” crește semnificativ numărul de oameni care cred că specialiștii buni au cele mai favorabile șanse de promovare și aproape la fel de mult reduce numărul celor care indică obsechiozitate. Presupunând că întrebările deschise oferă o oportunitate mai mare pentru exprimarea independentă a opiniei, promptul duce la un artefact: 62% au ales versiunea adecvată a răspunsului în loc să-și exprime opinia.

Atunci când proiectează variabile, sociologul caută să se asigure că acestea corespund comportamentului real al obiectului. În același timp, el este obligat să le organizeze într-o manieră logică, neglijând faptul că „viața” este adesea ilogică și ambiguă. Aici apare o dilemă: fie descrieți viața în toată inconsecvența ei, fie construiți diagrame. În primul caz, este mai bine ca un sociolog să aleagă o carieră de scriitor; în al doilea caz, este necesar să se încerce să se asigure că schema logică corespunde realității.

Cererile de corespondență unu-la-unu și o bază unică conțin o anumită violență împotriva realității „umane”. În viață, „da” se transformă adesea în „nu”, „democrații” se numesc comuniști, dar un plus se dovedește a fi un minus. Cel mai bine este să lucrați cu nominale care se presupune că sunt cele mai în concordanță cu limbajul interacțiunii sociale și al comportamentului. Măsurătorile nominale în cercetarea sociologică și socio-economică sunt considerate fundamentale pentru înțelegerea însăși a naturii realității sociale. S.V. Cesnokov bazează această concluzie pe presupunerea că variabilele nominale sunt rezultatul final al procedurilor de verificare empirică a conceptelor teoretice ori de câte ori obiectul cercetării într-o măsură sau alta îl reprezintă oamenii, conștiința și comportamentul lor. „Acest lucru se datorează faptului”, scrie S.V. Cesnokov, „că atât sociologul-cercetător, cât și oamenii care și-au exprimat bunăvoința de a contacta sociologul în rolul respondenților își exprimă reacțiile, formează și descriu socialul în imagini și concepte, ale căror semne sunt cuvinte, nu numere”8. . Aceasta implică presupunerea unor posibilități limitate pentru analiza datelor numerice. Dimensiunea umanitară a S.V. Cesnokov numește orice denumire, iar analiza deterministă este stabilirea următoarelor „dacă a, atunci b”, unde a și b sunt nume.

Fără îndoială, variabilele nominale care înregistrează valori specifice stau la baza vocabularului sociologic. Cu toate acestea, această caracteristică a acestora este înrădăcinată nu atât în ​​„limbajul viu” al comunicării sociale, ci în echivalența valorilor variabile cu declarațiile de înregistrare a faptelor de protocol. Aceste tipuri de „protocoale” nominale, indiferent de conținutul lor, stau la baza oricărei descrieri științifice. Scalele (continuum-urile) în sine sunt modalități de organizare a valorilor nominale în metrici idealizate, dar în orice caz trebuie îndeplinită cerința de corespondență unu-la-unu între unitate și valoarea variabilei.

Cerințele pentru măsurătorile nominale (identificări) trebuie îndeplinite și pentru scalele de nivel superior: ordonate, interval și metrice.

O scară ordonată diferă de una nominală prin faptul că gradațiile sale sunt dispuse într-o anumită ordine în raport cu intensitatea crescătoare sau descrescătoare a proprietății.

Clasa ordonată include scale de evaluare, atitudini și preferințe. În sociologie se folosesc două tipuri de scale ordonate: ranguri (evaluări) și puncte. Rangurile sunt stabilite prin atribuirea unui loc unui obiect astfel încât numărul de locuri să fie exact egal cu numărul de obiecte. De exemplu, puteți distribui elevii după nivelul de pregătire și alocați fiecăruia un loc, începând de la primul până la ultimul. Cu alte cuvinte, îi ierarhăm, știind că indiferent de nivelul de cunoștințe din grup trebuie să fie primul și ultimul. Un sistem similar de stimulente de producție, bazat pe ideea de a recompensa pe primul în detrimentul celui din urmă, a fost folosit în anii 1960. V.M. Yakushev, experimentând într-unul dintre birourile de proiectare, experimentul a devenit cunoscut sub numele de „Pulsar”. Întrucât în ​​orice caz cineva va fi ultimul, grupul este pus în condiții de competiție și luptă pentru supraviețuire.

Evaluarea ca tip de evaluare socială este norma unui anumit tip de cultură, bazată pe prioritatea interesului individual asupra intereselor colective. Viața și succesul profesional sunt conceptualizate aici ca o victorie asupra celorlalți. În acest tip de joc, este considerat stupid și chiar imoral să lași un coleg de clasă să trișeze la un test - la urma urmei, asta înseamnă să pierzi în fața lui în competiție. În cele din urmă, caii conduși sunt împușcați, nu? Toate acestea se întâmplă nu numai în studii, ci și în afaceri, familie, comunicare și religie. Teoria alegerii raționale se bazează tocmai pe ideea de optimizare a comportamentului individual cu resurse limitate.

Scalele de puncte nu operează cu locuri, ci cu valori școlare. Aceste valori sunt independente unele de altele. Într-un fel, scara de puncte are origini egalitare. Toți studenții, inclusiv primul și ultimul, pot obține C și pot fi fericiți conform teoriei privării relative. Cu toate acestea, fiabilitatea acestui tip de scară este foarte discutabilă, mai ales în cazurile în care numerele sunt folosite pentru a indica semnele. O distanță de la 4 la 5 nu este aceeași cu o distanță de la 2 la 3. Fiecare profesor are propria sa preferință pentru locul în care plasează elevii în continuum. Unul pune 2 și 3, celălalt 4 și 5. Cum să le comparăm? Nu există mari dificultăți aici, deoarece valorile individuale pot fi normalizate în raport cu scorul mediu sau deviația standard a scorurilor pentru fiecare profesor.

Scale de rating ordonate implică o echilibrare logică a pozițiilor în raport cu un centru neutru. Această cerință reflectă o regulă mai generală pentru construirea scalelor: fiecare categorie a scalei trebuie să fie caracterizată de o probabilitate egală de „lovire” a obiectului, supusă distribuției aleatorii. Cu alte cuvinte, numărul de gradații din dreapta centrului ar trebui să fie egal cu numărul de gradații din stânga. Adesea, valoarea „Nu se poate spune” este folosită ca „centru” al scalei. Acest lucru creează o ambiguitate evidentă în interpretarea datelor. „Nu pot spune” înseamnă că respondentul nu poate alege niciuna dintre pozițiile propuse; dar dacă „Nu pot spune” se află în centrul unei scale echilibrate, înseamnă „Îmi este greu să prefer ceva”.

Atunci când valorile unei scale de evaluare ordonate nu au limite clar definite, scala devine semi-ordonată. De fapt, scalele semi-ordonate sunt cel mai des folosite în cercetările sociologice și psihologice.

Scalele de intervale se bazează pe proceduri care asigură distanțe egale sau aproximativ egale între gradațiile unei variabile. În acest caz, nu valorile variabilelor sunt comparate, ci distanțele dintre valori. Cu alte cuvinte, oricare două măsurători ale unui sistem empiric dat, efectuate pe o scară de interval, sunt convertite una în alta folosind o funcție liniară.

Dacă la scară nominală succesiunea obiectelor se stabilește fără mare dificultate, scara intervalului presupune rezolvarea problemei comparării distanțelor dintre obiecte. Această proprietate a transformărilor liniare, caracteristică scărilor de interval, este demonstrată printr-un exemplu numeric: 5 - 2 / 2 - 1 = 24 - 15 / 15 - 12 = 3. Raportul dintre diferențele dintre valorile scalei este constant în acest caz." Dacă unul dintre obiectele unei scale de interval este afișat la zero, putem vorbi despre o scală de raport - un caz special al unei scale de interval. În acest caz, începutul numărătorii inverse12 este fix.

Puteți construi o scală de interval folosind comparații pereche sau folosind, așa cum a făcut L. Thurstone, proceduri judiciare. În primul rând, este creată o serie de judecăți relevante care descriu atributul care este măsurat, de exemplu, o atitudine, o atitudine sau o evaluare. Apoi experții sunt rugați să clasifice judecățile pe categorii de la cea mai mare intensitate a atributului până la cea mai mică. Se presupune că distribuirea ratingurilor judecătorilor în jurul valorii de scară este supusă unei legi normale. Sunt selectate acele judecăți care au primit și au convenit punctaje de la judecători. Aceasta este metoda de a construi „intervale care par egale”. Cele mai cunoscute metode de construire a scalelor de intervale au fost dezvoltate de L. Thurstone, R. Likert și L. Guttman. Cu toate acestea, ele sunt rareori folosite în sociologia modernă.

Scalele metrice sau absolute îndeplinesc toate cerințele pentru scalele claselor inferioare; au nu numai un semn de referință zero, ci și o unitate de măsură a timpului, distanței sau numărului de unități. Toate transformările cu numere sunt permise aici.

Atribuirea semnificației obiectelor are loc în trei forme: verbală, grafică și numerică. Interpretarea verbală a variabilelor este cea mai frecventă în anchetele de masă. Elementele scalei aici sunt judecăți care indică opinii, valori și stări. Cât de adecvate sunt aceste dovezi este o problemă specială. Un lucru este clar: judecățile în sine nu sunt altceva decât o dovadă a realității care stă în spatele lor. Prin urmare, interpretarea verbală a scalei joacă rolul unui fel de sondă în limbajul vieții de zi cu zi. Diferența sa fundamentală față de vorbirea de zi cu zi constă în structura sa conceptuală clară, adaptată la o varietate de situații și contexte de vorbire. Chiar și o întrebare deschisă, aparent concentrată maxim pe vocabularul respondentului, funcționează numai dacă există o codificare conceptuală lipsită de ambiguitate.

Pozițiile scalei interpretate verbal sunt percepute destul de clar, dacă sunt puține. Dar deja atunci când alegeți dintre cinci gradații, încep dificultățile. De exemplu, categoriile „mulțumit” și „mai degrabă mulțumit decât nemulțumit” diferă cu un grad semnificativ de convenție. La scara de șapte puncte, posibilitățile de interpretare verbală sunt epuizate. Aici este de preferat designul grafic al scalei, creând posibilitatea unei citiri standard. Interpretarea grafică a scalei este folosită în așa-numitele studii interculturale, unde vocabularul instrumentului necesită traducerea în limba respondentului. Vizualizarea unei variabile într-o figură ar trebui să creeze un „model” universal al scalei. Gesturile sunt folosite în mod similar în comunicarea internațională. Un exemplu de instrument realizat într-o cheie grafică sunt imaginile testului tematic de apercepție. Cântarele sunt adesea descrise ca rigle și pictograme. Harvey Cantril a dezvoltat „scara fericirii”: pe un desen al scării, respondentul trebuie să-și marcheze poziția actuală în raport cu cea mai bună (în partea de sus a scării) și cea mai proastă (partea de jos a scării) combinație de circumstanțe și apoi să indice direcția mișcării sale de-a lungul „scării fericirii”. Într-una dintre primele versiuni ale scalei de atitudine, L. Thurstone a propus un continuum de unsprezece puncte, realizat sub forma unui termometru.

Interpretarea numerică este uneori identificată în mod eronat cu interpretarea verbală. Utilizarea numerelor ca nume numerice nu înseamnă introducerea unor metrici. De exemplu, în scopuri de codificare, bărbații pot fi desemnați ca 1 și femeile ca 2. În acest caz, se folosesc etichete, dar nu și numere. Numerele implică implementarea operațiilor de aditivitate și a operațiilor aritmetice. Gama scărilor numerice este limitată la niveluri de măsurare interval și metrice, unde sunt stabilite unitățile de intensitate a proprietății.

794. Orlov A.I. Teoria măsurării ca parte a metodelor de analiză a datelor: reflecții asupra traducerii unui articol de P.F. Velleman și L. Wilkinson // Sociologie: metodologie, metode, modelare matematică. 2012. Nr 35. P. 155-174.
A.I. Orlov

(Moscova)
LOCUL TEORIEI MĂSURĂRII ÎN METODELE DE ANALIZĂ A DATELOR 1


Conform paradigmei moderne a statisticii aplicate, teoria măsurării este o parte integrantă a metodelor de analiză a datelor. Potrivit lui P.F. Velleman și L. Wilkinson, utilizarea teoriei măsurării „în selectarea sau recomandarea anumitor metode de analiză statistică este inadecvată și duce adesea la erori”. Articolul oferă scurte informații despre scalele de măsurare și aplicarea teoriei măsurării în alegerea mediilor în conformitate cu scalele de măsurare a datelor, iar apoi analizează cu atenție argumentele lui P.F. Velleman și L. Wilkinson. Rezumatul discuției: „teoria măsurării este importantă pentru interpretarea analizei statistice”. Discuția a făcut posibilă clarificarea unui număr de aspecte în aplicarea statisticii aplicate (analiza datelor): s-au identificat rolul problemei care se rezolvă și modelul de date utilizat pentru stabilirea tipurilor de scale de măsurare pentru aceste date; Domeniile de aplicare ale analizei exploratorii și ale statisticilor bazate pe dovezi sunt separate.
Cuvinte cheie: teoria măsurătorilor, analiza datelor, statistică aplicată, scale de măsurare, transformări admisibile, invarianța concluziilor.
Metodele de analiză a datelor (cu alte cuvinte, statistică aplicată, metode statistice) sunt necesare pentru ca un sociolog să prelucreze rezultatele anchetelor de masă, precum și să sintetizeze rezultatele anchetelor experților. Acest domeniu științific se dezvoltă rapid. Conform noii paradigme a statisticii aplicate, teoria măsurării este o parte integrantă a metodelor moderne de analiză a datelor. Manualele noastre (, etc.) vorbesc despre teoria măsurătorilor și aplicarea acesteia în alegerea metodelor adecvate pentru analiza datelor.

Există și alte opinii despre oportunitatea utilizării teoriei măsurării în analiza datelor sociologice. Ideea principală a articolului lui P.F. Velleman și L. Wilkinson este exprimat în numele său. În opinia lor, utilizarea teoriei măsurării „atunci când se alege sau se recomandă anumite metode de analiză statistică este inadecvată și duce adesea la erori”.

Înainte de a analiza argumentele lui P.F. Velleman și L. Wilkinson, este indicat să oferim informații succinte despre subiectul discuției, în special, pentru a defini termenii pe care îi folosim și a formula principalele prevederi în stilul școlii probabilistic-statistice autohtone, al cărei fondator este A.N. Kolmogorov, care a transformat teoria probabilității și statistica matematică într-o ramură a matematicii. În același timp, clarificăm prezentarea și descriem aplicarea teoriei măsurătorilor în teoria mediilor, ceea ce a făcut posibilă crearea unui sistem armonios și final de medii.
Bazele teoriei măsurătorii
Teoria măsurătorilor pornește de la faptul că operațiile aritmetice cu numere utilizate în lucrările practice nu au întotdeauna sens. De exemplu, de ce să adăugați sau să înmulțiți numere de telefon? În plus, relațiile aritmetice obișnuite nu sunt întotdeauna îndeplinite. De exemplu, suma cunoștințelor a doi elevi săraci nu este egală cu cunoștințele unui elev „bun”, adică. pentru evaluările de cunoștințe, 2+2 nu este egal cu 4. Exemplele date arată că practica folosirii numerelor pentru a descrie rezultatele observațiilor (măsurători, teste, analize, experimente) merită o analiză metodologică.

Scale de măsură de bază. Cel mai simplu mod de a folosi numerele este să le folosești pentru a distinge obiecte. De exemplu, numerele de telefon sunt necesare pentru a distinge un abonat de altul. Cu această metodă de măsurare se folosește o singură relație între numere - egalitatea (două obiecte sunt descrise fie prin numere egale, fie prin altele diferite). Scara de măsurare corespunzătoare se numește scară de denumire (folosind termenul latinesc, o scară nominală; uneori numită și scară de clasificare). Această scală măsoară codurile de bare ale mărfurilor, numerele de pașapoarte, TIN (numerele individuale ale contribuabililor) și multe alte cantități exprimate în numere. Din punct de vedere aplicat, o scară de măsură este o modalitate de atribuire a numerelor obiectelor luate în considerare, corespunzătoare relațiilor existente între obiecte.

Rețineți că numerele pot fi atribuite obiectelor în moduri diferite. Trecerea de la o metodă la alta se observă la schimbarea pașapoartelor sau a numerelor de telefon. Care sunt proprietățile transformărilor valide? Pentru o scară de denumire, este firesc să se solicite doar neambiguitate reciprocă. Cu alte cuvinte, aplicând o transformare unu-la-unu rezultatelor măsurătorilor, obținem o nouă scară care descrie sistemul de obiecte originale la fel de bine ca scara anterioară.

Cele șase tipuri principale de scale de măsurare sunt descrise în Tabelul 1.
Tabelul 1. Principalele scale de măsurare.


Tipul de scară

Definiţia scale

Exemple

Grup de transformări permise

Scale de trăsături calitative

Articole

Numerele sunt folosite pentru a distinge obiectele

Numere de telefon, pașapoarte, TIN, coduri de bare

Toate conversiile unu-la-unu

Ordinal

Numerele sunt folosite pentru a ordona obiecte

Evaluări ale experților, scoruri ale vântului, note la școală, utilitate, numere de case

Toate transformările strict crescătoare

Scale de trăsături cantitative

(descris prin punctul de referință și unitatea de măsură)



Intervale

Originea și unitatea de măsură sunt arbitrare

Energia potențială, poziția punctului, temperatura pe scara Celsius și Fahrenheit

Toate transformările liniare φ( X) = topor + b,

A Și b arbitrar A>0


Relații

Este dat punctul de referință, unitatea de măsură este arbitrară

Greutate, lungime, putere, tensiune, rezistență, temperatura Kelvin, prețuri

Toate aceste transformări φ( X) = topor,

A arbitrar, A>0


Diferențele

Punctul de plecare este arbitrar, este specificată unitatea de măsură

Timp

Toate transformările de deplasare φ( X) = X + b,

b arbitrar


Absolut

Sunt specificate originea și unitatea de măsură

Numărul de persoane dintr-o cameră dată

Doar transformarea identităţii φ( X) = X

Pe lângă cele enumerate în Tabelul 1, se mai folosesc și alte tipuri de cântare. Rețineți că în Tabelul 1 expresia „unitatea de măsură este arbitrară” înseamnă că poate fi aleasă prin acordul specialiștilor, dar nu rezultă din nicio relație fundamentală. La măsurarea timpului, unitatea naturală de măsură este determinată de perioadele de revoluție ale corpurilor cerești. Punctul de pornire la măsurarea lungimii este determinat de lungimea segmentului al cărui început și sfârșit coincid etc.

În prezent, se consideră necesar, înainte de a utiliza anumiți algoritmi de analiză a datelor, să se stabilească în ce tipuri de scale se măsoară cantitățile luate în considerare. Mai mult, în timp, tipul de cântare pentru măsurarea unei anumite cantități se poate modifica. De exemplu, temperatura a fost măsurată mai întâi pe o scară ordinală (mai cald - mai rece). După inventarea termometrelor, acesta a început să fie măsurat pe o scară de interval (Celsius, Fahrenheit sau Reaumur). Temperatura CU pe scara Celsius exprimată în termeni de temperatură F Fahrenheit folosind transformarea liniară

Odată cu descoperirea temperaturilor zero absolut, a devenit posibilă trecerea la o scară de raport (scala Kelvin).

Cerința invarianței (adecvarea) concluziilor. Clarificarea tipurilor de scale utilizate este necesară pentru a selecta în mod adecvat metodele de analiză a datelor. Cerința fundamentală este independența concluziilor de la care scară de măsurare a folosit cercetătorul (dintre toate scalele care se transformă unele în altele în cadrul transformărilor permise). De exemplu, dacă vorbim despre lungimi, atunci concluziile nu ar trebui să depindă de dacă lungimile sunt măsurate în metri, arshins, thoms, picioare sau inci.

Cu alte cuvinte, concluziile trebuie să fie invariante sub un grup de transformări admisibile ale scalei de măsurare. Numai atunci pot fi numite adecvate, adică. liber de subiectivitatea cercetătorului care selectează o scară specifică dintr-un set de scale de un tip dat, conectate prin transformări acceptabile.

Cerința pentru invarianța inferenței impune restricții asupra numeroșilor algoritmi posibili de analiză a datelor. Ca exemplu, luați în considerare o scară ordinală. Unii algoritmi de analiză a datelor ne permit să obținem concluzii adecvate, alții nu. De exemplu, în problema testării omogenității a două eșantioane independente, algoritmii de statistici de rang (adică, folosind doar rangurile rezultatelor măsurătorilor) dau concluzii adecvate, dar statisticile Cramer-Welch și Student nu o fac. Aceasta înseamnă că pentru a procesa datele măsurate pe o scară ordinală pot fi folosite testele Smirnov și Wilcoxon, dar nu testele Cramer-Welch și Student nu.
Selectarea valorilor medii în conformitate cu scalele de măsurare
Cerința de invarianță este destul de puternică. Din mulți algoritmi pentru analiza datelor statistice, doar câțiva îi satisfac. Să arătăm acest lucru comparând valorile medii.

Mediile Cauchy. Printre toate metodele de analiză a datelor, algoritmii de mediere ocupă un loc important. În anii 1970, a fost posibil să se clarifice pe deplin ce tipuri de medii pot fi utilizate atunci când se analizează datele măsurate pe anumite scale.

Lăsa X 1 , X 2 ,…, X n - volumul de prelevare n. Cel mai conceptul general de valoare medie a fost introdus de un matematician francez în prima jumătate a secolului al XIX-lea. O. Cauchy. Valoarea medie (după Cauchy) este orice funcție f(X 1 , X 2 ,...,X n) astfel încât pentru toate valorile posibile ale argumentelor valoarea acestei funcții să nu fie mai mică decât minimul numerelor X 1 , X 2 ,...,X n, și nu mai mult decât maximul acestor numere. Mediile Cauchy sunt media aritmetică, mediana, modul, media geometrică, media armonică și media pătrată.

Mediile sunt de obicei folosite pentru a înlocui o populație de numere (eșantion) cu un singur număr și apoi pentru a compara populațiile folosind medii. Să, de exemplu, Y 1 ,Y 2 ,...,Y n- un set de evaluări ale experților (sau respondenților) „atribuiți” unui obiect al examinării, Z 1 , Z 2 ,...,Z n- la al doilea. Cum se compară aceste populații? Cel mai simplu mod este prin valori medii.

Cu o transformare de scară acceptabilă, valoarea mediei se schimbă evident. Dar concluziile despre care populație media este mai mare și pentru care este mai mică nu ar trebui să se schimbe (în conformitate cu cerința invarianței concluziilor, acceptată ca principală cerință în teoria măsurării). Să formulăm problema matematică corespunzătoare de căutare a tipului de valori medii, al căror rezultat al comparării este stabil în raport cu transformările de scară admisibile.

Lăsa f(X 1 , X 2 ,...,X n) - Cauchy medie. Fie ca media pentru prima populație să fie mai mică decât media pentru a doua populație:

f(Y 1 ,Y 2 ,...,Y n) (Z 1 , Z 2 ,...,Z n).

Apoi, conform teoriei de măsurare, pentru stabilitatea rezultatului comparării mediilor este necesar ca pentru orice transformare admisibilă g(din grupul transformărilor admisibile la scara corespunzătoare) inegalitatea era și ea adevărată

f(g(Y 1), g(Y 2),...,g(Y n)) (Z 1),g(Z 2 ),...,g(Z n)),

acestea. media valorilor transformate din prima populație a fost mai mică decât media valorilor transformate din a doua populație. Mai mult, condiția formulată trebuie îndeplinită pentru oricare două seturi Y 1 ,Y 2 ,...,Y nȘi Z 1 , Z 2 ,...,Z n.Și, reamintim, pentru orice transformare admisibilă. Numim valorile medii care satisfac condiția formulată acceptabil(la scara corespunzatoare). Conform teoriei măsurătorii, numai valorile medii acceptabile pot fi utilizate atunci când se analizează opiniile experților și alte date măsurate pe scara în cauză.

Cu ajutorul teoriei matematice dezvoltate în monografie, este posibil să se descrie tipul de valori medii admisibile pe scalele principale.

Valori medii pe o scară ordinală. Să luăm în considerare prelucrarea, pentru certitudine, a opiniilor experților măsurate la scară ordinală. Următoarea afirmație este adevărată.

Teorema 1. Dintre toate mediile Cauchy, numai membrii seriei de variații (statistici ordinale) sunt medii acceptabile pe o scară ordinală.

Teorema 1, obținută mai întâi în articol, este valabilă cu condiția ca media f(X 1 , X 2 ,...,X n) este o funcție continuă (peste setul de variabile) și simetrică. Aceasta din urmă înseamnă că atunci când argumentele sunt rearanjate, valoarea funcției f(X 1 , X 2 ,...,X n) nu se schimba. Această condiție este destul de naturală, deoarece găsim valoarea medie pentru colecții (seturi) numere, nu pentru secvente. Setul nu se modifica in functie de ordinea in care enumeram elementele acestuia.

Conform teoremei 1, în special, mediana poate fi utilizată ca medie pentru datele măsurate pe o scară ordinală (dacă dimensiunea eșantionului este impară). Dacă volumul este par, ar trebui să se folosească unul dintre cei doi termeni centrali ai seriei de variații - așa cum sunt uneori numiti, mediana stângă sau mediana dreaptă. Moda poate fi, de asemenea, folosită - este întotdeauna un membru al seriei de variații. Puteți utiliza quartile de probă, minim și maxim, decile etc. Dar nu poți calcula niciodată media aritmetică, media geometrică etc.

Medii conform lui Kolmogorov. Sistemul natural de axiome (cerințe pentru valori medii) conduce la așa-numitele medii asociative. Aspectul lor general a fost găsit în 1930 de A.N. Kolmogorov. Acum se numesc „medii Kolmogorov”.

Pentru numere X 1 , X 2 ,...,X n Media Kolmogorov este

G{(F(X 1) + F(X 2) +...+ F(X n))/n} ,

Unde F- funcție strict monotonă (adică strict crescător sau strict descrescător), G- funcţia inversă F. Printre mediile lui Kolmogorov sunt multe personaje cunoscute. Astfel, dacă F(X) = x, atunci media Kolmogorov este media aritmetică dacă F(X) = ln X, atunci media geometrică dacă F(X) = 1/X, atunci media armonică dacă F(X) = X, apoi pătratul mediu etc. (în ultimele trei cazuri, se face media valorilor pozitive).

Media Kolmogorov este un caz special al mediei Cauchy. Pe de altă parte, medii populare precum mediana și modul nu pot fi reprezentate ca medii Kolmogorov. Următoarele afirmații sunt dovedite pentru prima dată în articol.

Teorema 2. Pe o scară de interval de dintre toate mediile conform lui Kolmogorov, numai media aritmetică este valabilă .

Astfel, media geometrică sau pătratul mediu al temperaturilor (în Celsius), energiilor potențiale sau coordonatele punctuale sunt lipsite de sens. Media aritmetică trebuie utilizată ca medie. Puteți utiliza, de asemenea, mediana sau modul.

Teorema 3.În scara raportului, dintre toate mediile Kolmogorov, sunt acceptabile doar mediile de putere c și media geometrică.

Există medii Kolmogorov care nu pot fi utilizate în scara raportului? Desigur că au. De exemplu, cu F(X) = e 2 X .

Nota 1. Media geometrică este limita medie a puterii la .

Nota 2. Teoremele 1 și 2 sunt valabile dacă sunt îndeplinite anumite condiții interne de regularitate matematică. Demonstrațiile teoremelor 1-3 sunt date în monografie. Transferul în cazul mediilor ponderate este dat în articol.

Similar valorilor medii, pot fi studiate și alte caracteristici statistice - indicatori de împrăștiere, conexiune, distanță etc. (vezi, de exemplu,). Nu este greu de arătat, de exemplu, că coeficientul de corelație nu se modifică cu nicio transformare admisibilă în scara intervalului, la fel ca și raportul varianțelor. Varianta nu se modifica in scara diferentei, coeficientul de variatie nu se modifica in scara raportului etc. Articolul discută rezultate suplimentare privind valorile medii.

Conform abordării luate în considerare, este mai întâi necesar să se stabilească în ce scale se măsoară datele sociologice, iar apoi să se utilizeze doar algoritmi de prelucrare a datelor care sunt invarianți în raport cu aceste scale.

În articol, teoria măsurării se numește „Restricții Stevens”, scara ordinală se numește ordinală, scara raportului se numește relativă, nu există conceptul de „grup de transformări admisibile”, etc. Vom folosi termeni care sunt bine stabiliți în statisticile aplicate. În general, poziția susținătorilor utilizării teoriei măsurării în analiza datelor este descrisă corect.

Există destul de multe publicații despre teoria măsurătorilor în limba rusă, scrise strict de autori calificați. Deoarece nu ne propunem să facem o trecere în revistă a teoriei măsurătorii aici, vom trimite cititorii la lucrările și referințele la sursele literare disponibile acolo.
Primele gânduri la traducerea articolului de P.F. Velleman și L. Wilkinson
Acest articol este scris sub forma unei recenzii a diverselor publicații, prezentarea este la nivel verbal, definițiile stricte, formulele, tabele și exemplele sunt aproape absente. Prin urmare, trebuie să ne dăm seama pentru autori ce au vrut să spună. Nu este întotdeauna posibil să dai sensul exact afirmațiilor lor.

La p. 173 sunt evidențiate trei domenii de critică:

1. Cerința de invarianță a concluziilor cu privire la transformările permise ale scalelor de măsurare „pare periculoasă pentru analiza datelor”.

2. Abordarea teoriei măsurătorii este „prea riguroasă pentru a fi aplicată datelor reale”.

3. Această abordare „conduce adesea la degradarea datelor prin transformări în ranguri și recurgerea ulterioară inutilă la metode neparametrice”.

Să începem prin a examina aceste trei linii de critică în termeni generali.

1. Dimpotrivă, renunțarea la cerința invarianței este periculoasă pentru obținerea unor concluzii bine întemeiate. Este posibil să ne bazăm pe concluzii care se schimbă cu o transformare la scară validă?

Desigur, în timpul analizei exploratorii inițiale a datelor, le puteți „rula” prin întregul arsenal de metode de procesare disponibile în produsul software - ce se întâmplă dacă reușiți să observați ceva interesant? „Descoperirile” obținute prin metode nerigoare trebuie apoi verificate folosind proceduri solide de analiză a datelor.

Practica forțează adesea utilizarea considerațiilor teoriei măsurătorii. Astfel, atunci când echipa noastră de cercetare a efectuat sondaje ale echipajelor de zbor ale companiilor aeriene Volga-Dnepr, s-a dovedit că este mai ușor pentru piloți să spună ce eveniment are loc mai des și care mai rar decât să estimeze numărul de evenimente la 1000 de zboruri. Piloții nu efectuează evaluări la scară absolută (evaluând probabilitățile evenimentelor), în timp ce sarcina de a compara evenimentele după frecvența de apariție sau de a evalua apariția lor prin puncte condiționate (valori ale caracteristicilor calitative) nu provoacă dificultăți. Astfel, evaluările obținute în urma anchetelor pilot sunt măsurate pe scale ordinale.

2. În munca practică, de obicei este destul de clar pe ce scale sunt măsurate datele. Dacă încercați să impuneți o scală incorectă respondenților, răspunsurile lor vor fi arbitrare, nu reflectă opinii adevărate sau ei pot refuza pur și simplu să răspundă, așa cum a fost cazul în sondajele echipajului de zbor al companiei Volga-Dnepr Airlines descrise mai sus.

Se poate recunoaște că, în unele cazuri rare, determinarea tipului de scară de măsurare a datelor necesită cercetări speciale.

3. Deja pe vremea când articolul lui P.F. Velleman și L. Wilkinson (1993), folosind metode neparametrice, s-au putut rezolva toate acele probleme de analiză a datelor pentru care metodele parametrice sunt încă folosite în unele lucrări. Conform paradigmei moderne a statisticii aplicate, în locul metodelor parametrice caracteristice paradigmei învechite de la mijlocul secolului al XX-lea, ar trebui folosite metode neparametrice.

Conform vederilor moderne, metodele parametrice sunt metode bazate pe modele statistice probabilistice în care distribuțiile variabilelor aleatoare aparțin uneia sau alteia dintre familiile parametrice - familia distribuțiilor normale, log-normale, gamma sau altele incluse în cei patru parametri. familia lui K. Pearson, introdusă de el la începutul secolului al XX-lea. Metodele neparametrice se bazează pe distribuții de tip arbitrar. „Conversia în ranguri” nu este necesară atunci când utilizați metode neparametrice. Ea corespunde cazului în care datele sunt măsurate pe o scară ordinală.

După cum au arătat numeroase studii, aproape toate distribuțiile de date reale nu aparțin nici uneia dintre familiile parametrice cunoscute. Teama de metodele neparametrice nu are o bază rațională; ea este generată de prejudecățile paradigmei învechite a statisticii aplicate de la mijlocul secolului al XX-lea.

De la analiza obiecțiilor generale la utilizarea teoriei măsurării în analiza datelor sociologice, să trecem la luarea în considerare a exemplelor specifice date de P.F. Velleman și L. Wilkinson. Pentru a nu umfla lungimea acestui articol, nu vom repeta formularea exemplelor, presupunând că cititorii au în fața lor o traducere a articolului lor original.

Să evidențiem câteva componente în critica Domnului. În primul rând, alegerea tipului de scară poate fi legată de problema rezolvată. Astfel, numerele de contracte ale unei întreprinderi servesc în primul rând pentru a face distincția între aceste contracte (și acțiunile asociate acestora), adică. este firesc să presupunem că sunt măsurate pe o scară de nume. Cu toate acestea, aceste numere cresc în timp (în conformitate cu datele încheierii contractelor), astfel încât în ​​unele probleme de luare a deciziilor de management este firesc să ne gândim la ele ca fiind măsurate la scară ordinală. În al doilea rând, procesarea datelor ordinale folosind algoritmi care nu sunt invarianți la scară ordinală poate da impresia că se trag concluzii valide. Lord vorbește despre aplicarea inegalității lui Chebyshev (testul Cramer-Welch ar fi putut fi folosit). Totuși, atunci când se aplică aceeași procedură de analiză datelor supuse unei transformări valide la scară ordinală, concluziile vor fi exact invers. Pentru a detecta diferențele dintre două probe independente, ar trebui aplicate teste neparametrice de omogenitate, cum ar fi testul Wilcoxon.

Baker, Hardik și Petrinovich, Borgatta și Borshtein nu doresc să folosească metode neparametrice, nu există o explicație. Velleman și Wilkinson îi critică inutil pentru reticența lor de a „se implica în problema robusteții”. Metode robuste, de ex. rezistente la mici abateri ale funcțiilor de distribuție a datelor, nu permit să facă față transformărilor arbitrare permise. Dacă trecem de la robustețe la un sistem mai general de concepte - la schema generală de stabilitate, atunci se dovedește că metodele de analiză a datelor care sunt rezistente la transformările la scară admisibile sunt metode de rang ca un caz special al celor neparametrice.

Gutman sugerează utilizarea „o funcție de pierdere aleasă pentru a verifica calitatea modelului”. Într-adevăr, dacă este dată funcția de pierdere, atunci nu este nevoie să implicăm teoria măsurării. Problema este să alegeți această caracteristică și să o alegeți cu înțelepciune. În cei peste 40 de ani de consultanță în domeniul analizei datelor, nu am întâlnit niciodată un astfel de practician. Oricine poate alege funcția de pierdere nu mai este un practician, ci un specialist calificat în domeniul statisticii matematice.

Potrivit lui Tukey, „ce cunoștințe nu se bazează pe o anumită aproximare”. Într-adevăr, în timpul unei analize exploratorii inițiale, o privire asupra datelor este adesea suficientă pentru ca un specialist să formuleze o concluzie. Cu toate acestea, atât practicienii, cât și teoreticienii insistă că concluziile intuitive trebuie susținute de raționamente riguroase.
Discuții despre statistici și tipuri de scale
Secțiunea astfel intitulată începe cu cuvintele: „Statisticienii au respins interdicțiile privind metodele bazate pe restricții privind transformările permise”. Acest lucru este complet fals. Statisticienii au acceptat această interdicție (vezi discuția în ). Acest lucru este deosebit de clar acum, la 20 de ani după ce a fost scris articolul. În prezent rămân îndoieli în rândul unora dintre cei care nu sunt profesioniști în domeniul analizei datelor, care sunt, de asemenea, înclinați să ia decizii simple și nu vor să se deranjeze cu studiul teoriei măsurătorilor și statisticii neparametrice. Această atitudine a practicanților este destul de naturală și rezonabilă, dar nu fructuoasă. Statistica aplicată modernă nu este simplă; stăpânirea ei necesită efort și timp.

Trebuie să recunoaștem că articolul include un număr mare de afirmații categorice care nu sunt susținute de argumente și contrazic practica analizei datelor. La pagina 176 scrie: „Argumentul cheie împotriva utilizării prescripției statistice de tip scară este: nu funcționează!” Așa funcționează - atât în ​​practică, cât și în dezvoltarea teoriei (în secțiunile inițiale ale acestui articol se arată că teoria măsurătorilor a făcut posibilă darea teoriei mediilor o formă completă). La pagina 177 se afirmă că „experiența arată că aplicarea statisticilor interzise la date duce la rezultate semnificative din punct de vedere științific, care sunt importante în luarea deciziilor și valoroase pentru cercetări ulterioare”. Nu există exemple. Aparent pentru că această afirmație este falsă.

Sunt adesea folosiți termeni fără definiții. Cititorul autohton poate fi surprins de afirmația despre „diferența fundamentală dintre matematică și știință” (p. 176). La noi, conform tradiției și actelor normative ale Ministerului Educației și Comisiei Superioare de Atestare, matematica este una dintre științe. Considerăm că metodele statistice și analiza datelor sunt una și aceeași. De aceea, cea mai recentă carte a noastră se numește „Metode statistice pentru analiza datelor”. Desigur, este posibil să se definească termeni astfel încât matematica să nu fie o știință, iar analiza datelor să devină diferită de statistica matematică. Discutarea termenilor este o activitate distractivă. Există aproximativ 200 de definiții ale termenului „statistici” într-o singură broșură. Cu toate acestea, este clar că utilizarea termenilor fără definiții, așa cum se face în , nu poate decât să deruteze cititorul.
Diferite tipuri de date
Nu putem decât să fii de acord cu Velleman și Wilkinson Ideea este că datele nu sunt întotdeauna numere. Elementele eșantioanelor pot fi vectori, funcții, diverse tipuri de obiecte de natură nenumerică - relații binare, mulțimi, mulțimi fuzzy, intervale etc. Acest lucru este valabil mai ales pentru rezultatele calculelor, cum ar fi fracții sau un set de puncte pe un plan obținut ca rezultat al scalarii multidimensionale. Vă rugăm să rețineți că atunci când vorbim despre aplicarea teoriei măsurătorii la analiza datelor, la începutul acestui articol am vorbit despre invarianța concluziilor trase din procesarea seturi de numere. În consecință, teoria măsurării nu este utilizată în toate secțiunile statisticii aplicate, ci doar în analiza statistică a mărimilor numerice. Această remarcă va fi necesară în timpul analizei ulterioare a articolului.

Este întotdeauna necesar să se facă distincția între analiza statistică exploratorie, care vizează „perspectivă intuitivă asupra tiparelor unui set de date” și statisticile probatorii bazate pe un raționament riguros. Este o analiză exploratorie care include metode de transformare a datelor și scalare multidimensională. În analiza exploratorie, nu este necesar să se respecte cerințele teoriei măsurătorii, dar în statistica probatorie, contrariul este adevărat.

În secțiunea „Analiză bună a datelor nu se bazează pe ipoteze despre tipul de date”, Velleman și Wilkinson subliniază pe bună dreptate importanța alegerii modelului statistic potrivit. În secțiunea următoare, „Categoriile Stevens nu descriu proprietăți fixe ale datelor”, vorbim de fapt despre același lucru: într-o serie de situații, „tipul de scară depinde de interpretarea datelor sau de disponibilitatea informațiilor suplimentare. .” Această afirmație este absolut corectă; un set de numere în sine nu face posibilă justificarea tipului de scară. Rezultatul măsurării este 2911397 - ce scară? Dacă acesta este un număr dintr-un raport contabil, atunci scara relațiilor (tranziția de la o monedă la alta este o transformare similară). Dacă acest număr este dintr-un agendă telefonică, atunci numărul de telefon este măsurat pe scara de nume. Am vorbit despre acest subiect mai devreme în legătură cu analiza lucrării Domnului. Deci, alegerea modelului statistic este foarte importantă; el determină scara de măsurare a datelor.

Secțiunea „Categoriile lui Steven sunt insuficiente pentru a descrie scalele de date” discută despre „scalele multidimensionale”. Ce este nu este clar, deoarece nu există definiții. Cu toate acestea, exemplul cvasi-practic dat de Tabelul 1 este destul de clar. Deoarece am lucrat cinci ani în instituții medicale (în „spitalul Kremlin” și la Institutul de Cercetare a Bolilor Profesionale și Igienă Muncii din cadrul Academiei de Științe Medicale a URSS), constat că numărul de simptome pe care le are un pacient nu poate fi considerat ca fiind un indicator al severității bolii, deoarece o astfel de luare în considerare presupune că toate simptomele sunt egale în contribuția la severitatea bolii. Acest lucru nu se întâmplă în medicină.

Ceea ce se discută în paragraful despre munca lui Anderson rămâne neclar, deoarece nu există definiții ale conceptelor folosite.
Robustitate, scale și analiza datelor
În secțiunea „Procedurile statistice nu pot fi clasificate după criteriile lui Stevens”, Velleman și Wilkinson discută problema inversă (în terminologie), în care, având în vedere o procedură de analiză a datelor, se cere să se determine la ce scară acea procedură produce concluzii invariante. Într-adevăr, am demonstrat că concluzia despre compararea valorilor funcției liniare a statisticilor de ordine calculate din două eșantioane, dată de formula (5) la p. 185, este invariantă pe scara ordinală dacă un singur coeficient de pondere este diferit. de la 0 (vezi și Teorema 1 la începutul articolului) și în scara intervalului (și în scalele cu grupuri mai înguste de transformări - rapoarte, diferențe, absolute), dacă cel puțin doi coeficienți de ponderare sunt diferiți de 0 (vezi ). Restul acestei secțiuni a articolului nu poate fi interpretat în termeni stricti. Să remarcăm doar că o sarcină diferită este luată în considerare decât înainte - conectarea procedurilor de calcul cu scalele de măsurare și nu stabilirea tipului de scară de măsurare pentru datele sursă.

În secțiunea „Tipurile de scară nu sunt categorii exacte”, se afirmă din nou, fără dovezi, că „datele reale nu satisfac cerințele tipurilor de scară”. În același timp, se remarcă corect că, în caz de îndoială, „nivelul” scalei ar trebui să fie coborât, de exemplu, de la interval la ordinal. Problema luată în considerare de Tukey în 1961 ar beneficia de statisticile de date pe intervale, dezvoltate încă de la începutul anilor 1980.

În secțiunea „Scale și analiza datelor”, discuția se bazează pe un amestec de analiză statistică exploratorie, în care se pot ignora scalele în care sunt măsurate datele, și analiza datelor în stadiul obținerii unor concluzii riguroase, de neconceput fără recurs. la teoria măsurării. Este ciudat că Velleman și Wilkinson consideră că doar analiza exploratorie este „bună”. Expresia: „O analiză bună a datelor urmează rareori o paradigmă formală de testare a ipotezelor” demonstrează nihilismul lor față de statistica matematică, ceea ce nu poate fi justificat.

În secțiunea „Semnificație”, termenul care a dat numele secțiunii rămâne nedefinit. După cum subliniază pe bună dreptate Velleman și Wilkinson, conform teoriei măsurătorii, semnificația este ceea ce se păstrează în cadrul transformărilor permise. Nu le place această definiție, dar nu pot da alta, angajându-se în discuții generale despre dreptul de a greși. Este ciudat să citești asta: „Dacă știința s-ar limita la judecăți care se dovedesc semnificative, ea nu s-ar putea dezvolta.” Matematica se dezvoltă cu succes!

Secțiunea „Rolul tipurilor de date” începe pe neașteptate - cu o recunoaștere a importanței teoriei măsurării: „Ar fi o greșeală să presupunem că tipurile de date nu contează... Conceptul de tip de scară este important, iar Stevens' terminologia (adică teoria măsurării - A.O.) este adesea poate fi convenabilă." Discuții ulterioare sunt din nou dedicate afirmării că, în terminologia noastră, tipul de scară este determinat nu de datele în sine, ci de modelul corespunzător problemei care se rezolvă (a se vedea mai sus pentru interpretarea numărului 2911397 ca rezultat al măsurătorilor). într-o scară de raport sau într-o scară ordinală, în funcție de formularea problemei). A doua idee, care a fost deja întâlnită, este accentul pus pe analiza exploratorie și minimalizarea rolului statisticii bazate pe dovezi.
Concluzie
Secțiunea „Concluzie” a articolului este scrisă într-o manieră echilibrată; punctele prezentate în ea sunt în general corecte. După cum sa menționat deja, nu se poate presupune „că tipul de scară este de la sine înțeles și nu depinde de întrebarea pe care cercetătorul o pune datelor sale”. La douăzeci de ani de la scrierea articolului, a devenit clar că, după ce a pus o întrebare, cercetătorul trebuie să descrie un model de analiză a datelor, de obicei probabilistic-statistic, inclusiv alegerea tipului de scale de măsurare a datelor, iar apoi, în cadrul acestui modelați, dezvoltați o metodă de rezolvare a problemei sau selectați una dintre cele deja disponibile.

Este absolut adevărat că „software-ul statistic care facilitează orice analiză pentru orice date permite și analize iresponsabile”. V.V. a avertizat despre acest lucru. Nalimov acum mai bine de 40 de ani. S-a referit, în primul rând, la tendința de a efectua calcule fără familiarizarea cu esența metodelor folosite.

Analiza articolului este finalizată.

Rezumând rezultatele acestui articol, este necesar să precizăm beneficiul comparării abordărilor teoriei măsurării și remarcilor critice despre aceasta, colectate în articolul lui Velleman și Wilkinson. Discuția a făcut posibilă clarificarea unui număr de aspecte privind utilizarea statisticii aplicate (analiza datelor). În primul rând, se identifică rolul problemei care se rezolvă și modelul de date utilizat pentru stabilirea tipurilor de scale de măsurare pentru aceste date, iar domeniile de aplicare ale analizei exploratorii și ale statisticilor bazate pe dovezi sunt împărțite. Adevărul proverbului a fost confirmat: „Adevărul se naște într-o dispută”.


LITERATURĂ
1. Orlov A.I. Metode statistice în sociologia rusă (treizeci de ani mai târziu) // Sociologie: metodologie, metode, modele matematice. 2005. Nr 20. P.32-53.

2. Orlov A.I. Noua paradigmă a statisticii aplicate // Laboratorul Fabricii. 2012. Volumul 78. Nr 1, partea I. P.87-93.

3. Orlov A.I. Statistici aplicate. Manual. - M.: Examen, 2006. - 672 p.

4. Orlov A.I. Modelare organizatorica si economica: manual: in 3 ore Partea 1: Statistica nenumerica. – M.: Editura MSTU im. N.E. Bauman. – 2009. – 541 p.

5. Velleman P.F., Wilkinson L. Tipologia scărilor nominale, ordinale, intervalale și relative este înșelătoare // Sociologie: metodologie, metode, modelare matematică. 2011. Nr 33. P.166 – 193.

6. Tolstova Yu.N. Măsurători în sociologie. - M.: Infra-M, 1998. - 352 p.

7. Orlov A.I. Sustenabilitatea în modelele socio-economice. - M.: Nauka, 1979. - 296 p.

8. Orlov A.I. Medii acceptabile în unele probleme de evaluări ale experților și agregare a indicatorilor de calitate. // Analiza statistică multivariată în cercetarea socio-economică. - M.: Nauka, 1974. P. 388-393.

9. Kolmogorov A.N. Despre determinarea mediei // Izbr. lucrări. Matematică și mecanică. M.: Nauka, 1985. p. 136–138.

10. Orlov A.I. Transformări admisibile în problema comparării mijloacelor. Statistici psi-permanente. // Algoritmi pentru analiza statistică multivariată și aplicațiile acestora. - M.: Editura TsEMI AN URSS, 1975. P.121-127.

11. Orlov A.I. Relația dintre valorile medii și transformările de scară admisibile // Note matematice. 1981. T. 30. Nr. 4. p. 561–568.

12. Barsky B.V., Sokolov M.V. Valori medii invariante în raport cu transformările admisibile ale scalei de măsurare // Laboratorul fabricii. 2006. Volumul 72. Nr 1. P.59-66.

13. Orlov A.I. Modelare organizatorica si economica: manual: in 3 ore Partea 3. Metode statistice de analiză a datelor. - M.: Editura MSTU im. N.E. Bauman, 2012. - 624 p.

14. Nikitina E.P., Freidlina V.D., Yarkho A.V. O colecție de definiții ale termenului „statistică”. – M.: MSU, 1972. – 46 p.

15. Nalimov V.V. Despre predarea matematicii experimentatorilor // Despre predarea statisticii matematice experimentatorilor. Preprint al Laboratorului Interfacultat de Metode Statistice Nr.17. – M.: Editura Universității de Stat din Moscova care poartă numele. M.V. Lomonosov, 1971. – P.5-39.

1Alexander Ivanovich Orlov, profesor, doctor în științe economice, doctor în științe tehnice, candidat în științe fizice și matematice, director al Institutului de Înalte Tehnologii Statistice și Econometrie al Universității Tehnice de Stat din Moscova. N.E. Bauman, profesor la MIPT, consilier al președintelui grupului de companii aeriene Volga-Dnepr, președinte al Asociației Ruse de Metode Statistice. E-mail: prof- orlov@ Poștă. ru .

Lucrarea a fost realizată cu sprijin financiar din partea Ministerului Educației și Științei al Federației Ruse în cadrul Decretului Guvernului Federației Ruse nr. 218.

Utilizarea anumitor metode statistice determină căreia scară statistică îi aparține materialul rezultat. L.S. Stevens a propus să distingă patru scale statistice:

1) scara numelor (sau nominale);

2) scară de ordine;

3) scara intervalului;

4) scara relațiilor.

Cunoscând caracteristicile tipice ale fiecărei scale, nu este dificil să se determine în care dintre ele ar trebui clasificat materialul supus prelucrării statistice.

Scala de nume. Această scară include materiale în care obiectele studiate diferă unele de altele prin calitatea lor.

La prelucrarea unor astfel de materiale, nu este nevoie să aranjați aceste obiecte în nicio ordine în funcție de caracteristicile lor. În principiu, obiectele pot fi aranjate în orice ordine.

Iată un exemplu: se studiază componența unei conferințe științifice internaționale. Printre participanți se numără francezi, englezi, danezi, germani și ruși. Ordinea în care sunt aranjați participanții contează atunci când examinăm compoziția unei conferințe? Le puteți aranja alfabetic, acest lucru este convenabil, dar este clar că nu există o semnificație fundamentală în acest aranjament. La traducerea acestor materiale într-o altă limbă (și, prin urmare, într-un alt alfabet), această ordine va fi perturbată. Puteți aranja grupuri naționale în funcție de numărul de participanți. Dar când comparăm acest material cu materialul unei alte conferințe, constatăm că este puțin probabil ca această ordine să fie aceeași. Obiectele atribuite scalei de denumire pot fi plasate în orice ordine în funcție de scopul studiului.

La prelucrarea statistică a acestui tip de material trebuie să se țină cont de numărul de unități prin care este reprezentat fiecare obiect. Există metode statistice foarte eficiente care vă permit să ajungeți la concluzii semnificative din punct de vedere științific din aceste date numerice (de exemplu, metoda chi-pătrat).

Scala de comandă. Dacă în scara de numire ordinea obiectelor studiate nu joacă practic niciun rol, atunci în scara de ordine - acest lucru este clar din numele său - este îndreptată toată atenția către această secvență.

Această scară în statistică include astfel de materiale de cercetare în care obiectele care aparțin uneia sau mai multor clase sunt supuse luării în considerare, dar diferă atunci când sunt comparate unele cu altele.„mai mult-mai puțin”, „mai sus-mai jos”, etc.

Cel mai simplu mod de a arăta caracteristicile tipice ale scalei de ordine este să te uiți la rezultatele publicate ale oricărei competiții sportive. Aceste rezultate listează secvenţial participanţii care au luat primul, al doilea, al treilea şi, respectiv, în ordinea locurilor. Dar în aceste informații despre rezultatele competițiilor, informațiile despre realizările reale ale sportivilor sunt adesea absente sau dispar în fundal, iar locurile lor ordinale sunt puse în prim-plan.


Să presupunem că șahul D. a ocupat primul loc în competiție. Care sunt realizările lui? Se pare că a marcat 12 puncte. Şahista E. a ocupat locul doi. Realizarea lui este de 10 puncte. Locul trei i-a revenit Zh. cu opt puncte, locul patru la Z. cu șase puncte etc. În rapoartele despre competiție, diferența de realizări la plasarea jucătorilor de șah dispare în fundal, iar locurile lor ordinale rămân în prim-plan. Faptul că locului ordinal i se acordă importanța principală are propriul său sens. De fapt, în exemplul nostru, Z. a marcat șase, iar D., 12 puncte. Acestea sunt realizările lor absolute – pariurile pe care le-au câștigat. Dacă am încerca să interpretăm această diferență de realizări pur aritmetic, ar trebui să admitem că Z. joacă de două ori mai rău decât D. Nu putem fi de acord cu asta. Circumstanțele competiției nu sunt întotdeauna simple, la fel cum nu este întotdeauna simplu felul în care un sau altul participant le-a desfășurat. Prin urmare, abținându-se de la absolutizarea aritmetică, se limitează la ceea ce stabilesc: șahista Z. rămâne în urma lui D., care a ocupat primul loc, cu trei locuri ordinale.

Scala intervalului. Acestea includ materiale care oferă o evaluare cantitativă a obiectului studiat în unități fixe.

Să revenim la experimentele pe care psihologul le-a efectuat cu Sasha. Experimentele au ținut cont de câte puncte puteau pune Sasha însuși și fiecare dintre colegii săi, lucrând la viteza maximă disponibilă. Unitățile de evaluare din experimente au fost numărul de puncte. După ce le-a numărat, cercetătorul a obținut numărul absolut de puncte pe care s-a dovedit a fi posibil să le pună în timpul alocat fiecărui participant la experimente. Principala dificultate în atribuirea materialelor la o scală de interval este că este necesar să existe o unitate care să fie identică cu ea însăși pentru toate măsurătorile repetate, de exemplu. la fel si neschimbat. În exemplul cu jucători de șah (scala de ordine), o astfel de unitate nu există.

De fapt, se ține cont de numărul de jocuri câștigate de fiecare participant la competiție. Dar este clar că jocurile sunt departe de a fi identice; este posibil ca participantul la competiție care a terminat pe locul patru - a câștigat șase jocuri - să câștige cel mai dificil joc împotriva liderului însuși! Dar în rezultatele finale se presupune că toate jocurile câștigătoare sunt la fel. În realitate, acesta nu există. Prin urmare, atunci când lucrați cu astfel de materiale, este oportun să le evaluăm în funcție de cerințele unei scale de comandă, mai degrabă decât de o scală de intervale. Materialele care urmează o scară de interval trebuie să aibă o unitate de măsură.

Scala de relații.Această scară include materiale care iau în considerare nu numai numărul de unități fixe, ca în scara intervalului, ci și relația dintre rezultatele totale rezultate între ele. Pentru a lucra cu astfel de relații, trebuie să ai un punct absolut de la care să numeri. Când studiezi subiecte psihologice, această scară este practic inaplicabilă.

Fiecare măsurătoare asupra unui obiect se face la o anumită scară. Diferitele coordonate ale aceluiași vector de observație pot fi exprimate pe scări diferite. Astfel, în § 5.1 este dat un exemplu de vector de observații (Tabelul 5.1), în care primele coordonate sunt de natura mărcilor convenționale (afilierea socială a familiei, genul și profesia capului de familie, calitatea de condițiile de viață), în timp ce restul sunt exprimate ca cifre (număr de membri ai familiei, numărul de copii, venitul mediu anual etc.). Proprietățile acestor cântare diferă foarte mult unele de altele. Astfel, despre genul capului de familie putem spune doar că este fie bărbat, fie femeie și că sexul masculin este diferit de sexul feminin; despre condițiile de viață – că sunt la fel sau diferite și că în unele cazuri unele condiții de viață sunt mai bune decât altele; despre cheltuieli, putem spune că cheltuielile pentru hrana unei familii sunt mai mici, egale sau mai mari decât cheltuielile alteia; puteți estima diferența de cheltuieli între familii și calcula de câte ori diferă cheltuielile unei familii de cheltuieli. a altuia.

Mai jos descriem principalele tipuri de scale și tehnici matematice de unificare a datelor exprimate în diferite scale, care de obicei preced utilizarea metodelor de analiză multivariată.

10.2.1. Scala nominala.

Această scară este folosită doar pentru a clasifica un individ sau un obiect într-o anumită clasă. Dacă sunt descrise în prealabil clase și reguli posibile de atribuire a unui obiect, atunci ele vorbesc despre o scară clasificată; dacă nu, atunci despre una necategorizată. Un exemplu de scară clasificată este genul. În studiu, unui individ i se atribuie unul dintre cele două semnificații: litera M sau F, un semn special sau numărul 1 sau 2. În principiu, alte litere și numere ar putea fi atribuite, este important doar ca un unu-la- să se mențină o corespondență între coduri. Pentru a introduce date clasificate, este convenabil să folosiți „meniul”, adică o listă de categorii posibile cu codurile lor. Exemple de variabile nominale necategorizate sunt numele, numele și locul nașterii.

O altă sursă importantă de date nominale neclasificate este listată în § 5.3. Acesta este cazul în care o observație este dată asupra unei perechi de obiecte, iar variabila indică doar dacă obiectele aparțin aceleiași clase sau nu și nu indică claselor cărora le aparțin.

Ultima împrejurare nu trebuie considerată o curiozitate. Desigur, dacă clasele sunt predefinite și nu este dificil să atribuiți fiecare obiect unei anumite clase, atunci acest lucru ar trebui făcut și înregistrat cărei clase îi aparține obiectul. Dar uneori clasele nu sunt descrise în avans, crearea clasificării lor complete este tocmai scopul lucrării și, în același timp, este posibil să se evalueze dacă obiectele aparțin unei clase. De exemplu, se poate vorbi despre un curs „apropiat”, „similar” al bolii la doi pacienți, deși nu sunt descrise toate variantele evoluției bolii. Mai mult, identificarea unor variante similare empiric ale evoluției bolii poate servi ca punct de plecare pentru identificarea și descrierea tuturor variantelor posibile ale dezvoltării procesului patologic. Același lucru este valabil și pentru identificarea grupurilor socio-economice etc.

Aceeași variabilă poate acționa în capacități diferite, în funcție de scopul utilizării. Deci, de exemplu, o variabilă nominală necategorizată - numele programului - servește doar la individualizarea programului și, dacă sunt puține programe, poate fi găsită prin vizualizarea directă a listei de programe. În același timp, dacă numele programelor din listă sunt ordonate într-un fel (de exemplu, în ordine alfanumerică), atunci numele programului ca imagine de căutare conține elemente de valoare ordinală. Pentru fiecare două nume putem spune că fie sunt aceleași, fie că unul dintre ele îl precede pe celălalt în modul acceptat de ordonare. Când se schimbă metoda de ordonare, se schimbă și următoarea relație.

Operațiile aritmetice pe mărimi măsurate la scară nominală sunt lipsite de sens. În consecință, atât mediana, cât și media aritmetică nu pot fi utilizate ca măsuri semnificative ale tendinței centrale. Mai multe statistici relevante aici sunt moda.

10.2.2. Scară ordinală (ordinală).

Pe lângă funcția de clasificare a obiectelor într-o anumită clasă, această scală aranjează și clase în funcție de gradul de exprimare al unei proprietăți date. Fiecărei clase i se atribuie propriul simbol, astfel încât ordinea predeterminată a simbolurilor să se potrivească cu ordinea claselor. Astfel, dacă claselor li se atribuie valori numerice, atunci clasele vor fi ordonate după succesiunea numerică; dacă sunt scrise, atunci clasele vor fi ordonate în ordine alfabetică, iar dacă sunt cuvinte, atunci clasele vor fi ordonate în funcție de semnificațiile cuvintelor.

De exemplu, § 5.3 oferă un exemplu de scară ordinală pentru a descrie calitatea condițiilor de locuit cu patru gradații (clase): „rău”, „satisfăcător”, „bun”, „foarte bun”. Desigur, aceste clase pot fi numerotate cu numerele 1,2,3,4 sau 4,3,2,1 sau cu literele a, b, c, d etc.

Alte exemple cunoscute de scale ordinale sunt: ​​în medicină - scara stadiilor de hipertensiune conform lui Myasnikov, scala gradelor de insuficiență cardiacă după Strazhesko-Vasilenko-Lang, scara severității insuficienței coronariene după Fogelson; în mineralogie - scara Mohs (talc - 1, gips - 2, calcit - 3, fluorit - 4, apatit - 5, ortoclază - 6, cuarț - 7, topaz - 8, corindon - 9, diamant - 10), conform care minerale sunt clasificate în funcție de criteriul durității; în geografie - scara vântului Beaufort („calm”, „vânt ușor”, „vânt moderat”, etc.).

Structura scării ordinale nu este distrusă de nicio transformare de cod unu-la-unu care păstrează ordinea. La fel ca în cazul unei scale nominale, operațiile aritmetice nu își păstrează semnificația la transformarea scalelor ordinale, de aceea este indicat să nu le folosiți. Nu este dificil să arătăm că dacă ne bazăm doar pe proprietățile scărilor și nu implicăm considerații suplimentare externe scalelor, atunci singurele statistici permise atunci când se folosesc scalele ordinale sunt membrii seriei de variații.

10.2.3. Scale cantitative.

O scară în care se poate reflecta cât de mult diferă un obiect de altul în ceea ce privește gradul de exprimare a unei proprietăți date se numește interval. Pentru a defini o scară de interval, trebuie să definiți obiectele corespunzătoare punctului de plecare și unității de măsură. Și apoi, atunci când măsurați, atribuiți fiecărui obiect un număr care să arate câte unități de măsură diferă acest obiect de obiectul luat ca punct de plecare. Cel mai simplu exemplu de scară de interval este temperatura în grade Celsius, unde 0° este punctul de plecare și 1° este unitatea de măsură.

Structura scării intervalului nu se modifică cu transformările liniare ale formei.Efectul unei astfel de transformări este de a muta punctul de plecare cu b unități și de a înmulți unitatea de măsură cu a.

De exemplu, transformând , unde este temperatura, puteți schimba temperatura în grade Fahrenheit.

Dacă începutul unei scale de interval este punctul zero absolut, atunci devine posibil să se reflecte pe scară de câte ori diferă o măsurătoare de alta. Scara corespunzătoare se numește scară de raport. Scala raportului permite transformări ale formei . Cele mai multe scale utilizate în fizică sunt fie scale de interval (temperatura, energie potențială) fie scale de raport (timp, masă, sarcină, distanță).

Deoarece scalele cantitative permit transformări aritmetice, media aritmetică poate fi folosită pentru a descrie tendința cumulativă în gruparea datelor.

10.2.4. Prezentarea unificată a diferitelor tipuri de date.

Fiecare tip de scară are propria sa tehnică statistică. Astfel, pentru variabilele măsurate la scară nominală, puteți utiliza criteriul - pentru distribuțiile polinomiale, criteriul - pentru verificarea absenței asociațiilor în tabelele de contingență și criteriile de testare a ipotezelor despre probabilitate într-o distribuție binomială. Scala ordinală corespunde metodelor bazate pe utilizarea rangurilor (corelarea rangurilor, teste neparametrice pentru testarea ipotezelor de tip) etc.). Cu o scară de interval, se poate folosi întregul arsenal de metode statistice.

Mai mult, au fost dezvoltate proceduri statistice pentru cazurile în care se observă vectori, unele dintre ale căror coordonate sunt măsurate pe o scară, iar altele pe alta. Un exemplu tipic este analiza obișnuită a varianței (vezi § 3.5), în care factorii sunt măsurați pe o scară nominală, iar răspunsurile corespunzătoare combinațiilor lor sunt măsurate pe o scară de interval.

Cu toate acestea, o serie de metode statistice, în special metodele moderne de analiză multivariată, presupun că datele sunt măsurate pe scale similare. Pentru a putea aplica aceste metode în cazul general al datelor eterogene, au fost propuse diverse tehnici de unificare a datelor. Să facem cunoștință cu cele mai importante dintre ele.

Reducerea la variabile binare. Această metodă se bazează pe introducerea, în locul fiecărei variabile aleatoare inițiale, a unei serii de variabile aleatoare care iau doar două valori: 0 și 1.

Pentru o valoare nominală cu k gradații, k valori sunt introduse astfel încât când când

Aceeași tehnică este uneori folosită atunci când se reduce o variabilă aleatoare măsurată pe o scară ordinală la variabile binare. Cu toate acestea, într-un număr de cazuri se dovedește a fi convenabil să evidențiezi nu evenimentul, ci evenimentul. Pentru a compara meritele relative ale acestor două metode, luăm în considerare următoarea problemă model. Fie o variabilă aleatoare distribuită uniform pe segment, fie un număr mic;

Funcția modelează în mod evident primul mod de a trece la variabile binare, iar funcția modelează al doilea. După calcule simple obținem:

Principalul dezavantaj al tehnicii descrise este introducerea unui număr mare de variabile noi și pierderea parțială a informațiilor conținute în date, atât din cauza cuantizării, cât și datorită unei reduceri artificiale a nivelului scalei utilizate.

Digitalizarea variabilelor nominale și ordinale. Această metodă este exact opusul a ceea ce tocmai s-a conturat; în ea, toate variabilele sunt ridicate, trase la nivelul celor cantitative, atribuindu-le gradații de valori numerice. Uneori, valorile atribuite se numesc etichete.

Alegerea etichetelor depinde în mod semnificativ de scopul pentru care se realizează digitizarea. Astfel, dacă se studiază mărimea conexiunii dintre două caracteristici nominale, atunci etichetele pot fi selectate din condiția maximizării coeficientului de corelație dintre ele , . Dacă vorbim de atribuirea observațiilor uneia dintre clasele predeterminate (analiza discriminantă), atunci alegerea etichetelor poate fi asociată cu condiția maximizării distanței normalizate în spațiul eșantionar multidimensional între centrele populațiilor studiate (distanțele Mahalanobis) . Uneori, această sarcină este simplificată și etichetele sunt atribuite coordonată cu coordonată, astfel încât să maximizeze doar distanța normalizată dintre valorile medii ale unei coordonate date. O comparație statistică folosind exemplul unei probleme particulare a eficacității abordărilor globale și coordonate cu coordonate ale digitizării în analiza discriminantă poate fi găsită în.

Tehnicile de digitizare prezentate, atunci când etichetele sunt selectate din condiția maximizării unui funcțional selectat corespunzător, se încadrează în cadrul abordării extreme a formulării principalelor probleme de statistică matematică menționată în § 1.2.

În general, digitizarea variabilelor calitative este o sarcină complexă atât în ​​termeni computaționali, cât și pur statistici. Anumite aspecte ale acestei probleme sunt discutate în lucrări.