Santykio skalei analizuoti naudojami statistikos tipai. Paskaitos apie matematinę statistiką. Kintamųjų matavimo svarstyklių tipai

Statistiniuose tyrimuose naudojami įvairių tipų ekonominio objekto būklę apibūdinantys ženklai. Ženklai gali turėti skirtingą išvaizdą, priklausomai nuo matavimo skalės, o tai dar labiau įtakoja statistinės analizės metodų pasirinkimą.

Priklausomai nuo matavimo skalės, skiriami kiekybiniai (skaitiniai) ir kategoriniai (neskaitiniai, kokybiniai) duomenys (žr. 3.1 pav.).

Kiekybinis (skaitinis) duomenys – tai rodikliai, įgaunantys skaitines reikšmes, kurios gaunamos atliekant tam tikrus matavimus ar skaičiavimus.

Kalbant apie matavimo skales, kiekybiniai duomenys laikomi matuojamais intervalų skalėje, kuri naudojama daiktų charakteristikų skirtumo dydžiui pavaizduoti. Intervalų (kiekybinė) skalė parodo, kiek viena reikšmė yra didesnė už kitą priimtais matavimo vienetais (pavyzdžiui, temperatūros, laiko, objektų skaičiaus skalė). Intervalų skalė gali turėti savavališką kilmę ir skalę. Tam tikros skalės leistinų transformacijų aibė susideda iš visų tiesinių transformacijų. Pagrindinė skalės savybė yra intervalų ilgių santykio išsaugojimas. Specialūs intervalų skalės atvejai yra santykio skalė (nulinis atskaitos taškas) ir skirtumo skalė (savavališkas atskaitos taškas ir vieneto skalė), taip pat absoliuti skalė (nulio atskaitos taškas ir vieneto atskaitos skalė). Kiekybinės skalės leidžia atlikti visas aritmetines matavimo rezultatų operacijas (pavyzdžiui, darbo užmokestį, banko sąskaitų likučius, darbuotojų skaičių įmonėje).

Jei duomenys gaunami matavimais ir gali įgyti absoliučiai bet kokias reikšmes iš tam tikro intervalo arba visos skaitinės ašies, jie vadinami tęstinis. Jei duomenys sudaro skaičiuojamą aibę ir skaičių ašyje užima tik kai kurias izoliuotas reikšmes, tarp kurių negali būti reikšmių, tada tokios savybės vadinamos diskretus.

Kiekybinių diskrečiųjų duomenų pavyzdžiai

  • Greitosios pagalbos iškvietimų į Maskvos ligonines skaičius kasdien.
  • Draudimo bendrovių, turinčių licencijas, skaičius Rusijos Federacijoje.
  • Per metus draudimo bendrovės automobilių kasko draudimo sutarčių portfelyje įvykusių draudžiamųjų įvykių skaičius.
  • Federalinės migracijos tarnybos oficialiai įregistruotų pabėgėlių ir šalies viduje perkeltųjų asmenų skaičius 2011 m.

Šaltinis: URL: http://rating.rbc.ru/article.shtml92008/09/30/32143066.

Duomenys pateikiami lentelės pavidalu, linijinės ir juostinės diagramos pavidalu.

Du kintamieji – „automobilių skaičius mieste“ ir „miesto gyventojų skaičius“ – yra atskiri kiekybiniai. Aiškumo dėlei grafike pavaizduotas kintamasis, apskaičiuotas kaip jų santykis – automobilių skaičius tūkstančiui gyventojų.

Kiekybinių tęstinių duomenų pavyzdžiai

  • Aukso apskaitos kainų dinamika Rusijoje per pastaruosius 20 metų.
  • Žmogaus ūgis, svoris, kraujospūdis ir kiti matuojami rodikliai.
  • Žemės ūkio augalų derlius Rusijos Federacijos ūkiuose.
  • Primilžis Centrinės federalinės apygardos gyvulininkystės ūkiuose.
  • Iš ginklo paleisto sviedinio skrydžio nuotolis.

Šaltinis: URL: http://rating.rbc.ru/articles/201 l/ll/09/33470757_tbl.shtml?2011/11/08/33470320.

Duomenims apie tęstinį kiekybinį kintamąjį „Grynieji aktyvai“ pateikti buvo naudojama lentelės forma ir juostinė diagrama.

Kitą grupę, gerokai besiskiriančią nuo kiekybinių duomenų, sudaro neskaitiniai - kategoriškas arba kokybės duomenis. Šiuo atveju objektas gali priklausyti tik vienai iš daugelio kategorijų (klasių). Ypač dažnai tai nutinka kuriant ir apdorojant anketas, anketas, reitingus ir kt. Net jei šias kategorijas pažymėsite skaičiais (pavyzdžiui, perkoduokite: 0 - moteris, 1 - vyras), vis tiek negalite dirbti su tokiais duomenimis kaip skaitiniai, o tik kaip kategoriniai.

Priklausomai nuo to, ar šias kategorijas galima užsakyti, charakteristikos matuojamos vardine arba eilės skale. Atitinkamai duomenys skirstomi į nominalus Ir eilinis.

Vardų skalė (vardinis arba klasifikavimo skalė).Šios skalės duomenys apibrėžiami pagal kategorijas, kurių negalima prasmingai suskirstyti (profesija; šalies regionas; miestas; studentų grupės skaičius; bankas, kuriame yra indėlis). Nominali skalė naudojamas apibūdinti elementų priklausymą tam tikrose klasėse. Visiems tos pačios klasės elementams priskiriama ta pati teksto reikšmė arba skaičius, o skirtingų klasių elementams – skirtingos reikšmės arba skaičiai. Bet koks skaičių pakeitimas klasėms žymėti yra priimtinas, jei tai yra „vienas su vienu“ transformacija ir kiekviena klasė gauna savo numerį. Ši aplinkybė nustato leistinų vardinės skalės transformacijų aibę kaip visų funkcijų „vienas su vienu“ aibę. Nėra pagrindo manyti, kad viena kategorija yra geresnė (ar blogesnė) už kitą, todėl apdorojant tokius duomenis naudojamos tik palyginimo operacijos: „lygus“ ir „nelygus“.

  • Rusijos Federacijos miestas (Vladivostokas, Surgutas, Tiumenė ir kt.).
  • Žmogaus kraujo grupė (O, A, B, AB).
  • Šeiminė padėtis (netekėjusi, vedusi, išsituokusi, civilinėje partnerystėje).
  • Rusijos bankas (Rusijos „Sberbank“, VTB, „Gazprombank“ ir kt.).
  • Rusijos federaliniai rajonai (Centrinis, Tolimųjų Rytų ir kt.).

3.12 pavyzdys


Duomenys apie vardinį kategorinį kintamąjį „akių spalva“ pateikiami lentelės ir skritulinės diagramos pavidalu. (skelbiama diagrama).

Kitas kategorinių kintamųjų tipas yra eilinis (eilinis) – skiriasi tuo, kad duomenys matuojami eilės skale. Eilinės svarstyklės naudojami elementams organizuoti pagal vieną ar kelias charakteristikas. Jie leidžia mums nustatyti, kad vienas elementas yra geresnis, svarbesnis, geresnis už kitą arba lygus kitam. Eilės skalė atspindi tik elementų atsiradimo tvarką ir neleidžia pasakyti, kiek ar kiek kartų vienas elementas yra geresnis už kitą. Kitaip tariant, šioje skalėje neįmanoma nustatyti pirmenybės laipsnio. Norint palyginti tokius duomenis, leidžiamos ne tik operacijos „lygus“ ir „nelygus“, bet ir „daugiau“ - „mažiau“ (nenustatant kiek).

  • Atsakymai į anketos klausimus, kuriuose pateikiami šie atsakymų variantai: taip; daugiau taip nei ne; ne daugiau kaip taip; Nr.
  • Egzamine mokinių gauti įvertinimai (puikiai, gerai, patenkinamai, nepatenkinamai).
  • Darbuotojo einamos pareigos mokslinėje laboratorijoje (jaunesnysis mokslo darbuotojas, mokslo darbuotojas, vyresnysis mokslo darbuotojas ir kt.);
  • Kariniai laipsniai Rusijos armijoje (leitenantas, kapitonas, majoras, pulkininkas ir kt.).

L (aukštas), IN(patenkinamai), B+(pakankamai), B++(priimtina),

SU(nepatenkinama), D(bankrotas), E(licencijos panaikinimas arba likvidavimas))


Viena iš dažniausiai pasitaikančių problemų, su kuriomis susiduriama kuriant apklausą ir naudojant įrangą, yra tai, kaip sudėtingam požiūriui ar elgesiui priskirti vieną reprezentatyvią vertę arba balą. Pavyzdžiui, apsvarstykite, kaip būtų galima įvertinti visuomenės šališkumą kolegijos studentų atžvilgiu. Toks šališkumas gali pasireikšti įvairiomis formomis, priklausomai nuo to, į kokias mokinių savybes yra nukreiptas konkretaus individo (respondento) dėmesys. Taigi vieni mokinius vertina pagal aprangą, kiti – pagal manieras, treti – pagal elgesį kasdieniame gyvenime, socialinę ir ekonominę padėtį ir net pagal asmens higienos lygį. Kiti galėjo susidaryti stereotipinę nuomonę, pagrįstą tik vienu ar dviem susitikimais (malonūs ar ne) su konkrečiais mokiniais; o kai kurie iš viso vos gali atskirti mokinį nuo kitų žmonių. Sprendimo elementai gali labai skirtis savo turiniu, dėmesiu ir vertinimo laipsniu, tačiau kiekvienas iš jų, bent jau potencialiai, yra platesnės „šališkumo“ sąvokos sudedamoji dalis.

Jei būtina atsižvelgti į visus šiuos dalykus, turime pasirinkti įrankį, kuris galėtų identifikuoti ir išmatuoti kuo daugiau šių sudedamųjų sąvokų elementų ir tuo pat metu būtų pakankamai tikslus, kad leistų prasmingai nustatyti bendrosios sąvokos pasireiškimo laipsnį vienu stebėjimu. Kitaip tariant, mums reikia įrankio, kuris užfiksuotų ir parodytų tokią sąvoką kaip „šališkumo“ sąvoka visose jos detalėse, be to, parodytų, kiek (kokią dalį) šios sąvokos yra konkrečiu atveju arba atsakovo atsakymas. Viena iš tokių priemonių vadinama mastelio keitimu.

Mastelio keitimas – tai procedūra, skirta kelių santykinai siaurų rodiklių (pavyzdžiui, apklausos elementų, susijusių su respondentų pastebėtomis individualiomis studentų savybėmis) sujungimas į vieną apibendrintą matą, kuris imamasi siekiant atspindėti platesnę pagrindinę koncepciją (mūsų atveju – išankstinį nusistatymą). , kurios dalis yra kiekviena individuali savybė. Taigi galima būtų išmatuoti respondento požiūrį į įvairaus pobūdžio mokinių elgesį (pavyzdžiui, kiek jie geria alkoholio ar triukšmingi jų vakarėliai) arba studentų manieras (kiek jie yra pasipūtę, arogantiški ar neapdairūs). bet mes negalėjome priimti nė vieno iš šių ženklų atskirai kaip visiško tokios plačios sąvokos kaip išankstinis nusistatymas atspindžio. Atvirkščiai, turėtume kažkaip sujungti visas šias priemones, kad galėtume padaryti išvadas apie bendresnį požiūrį, kurį kiekviena iš jų tam tikru būdu papildo ir atspindi. Be to, šią problemą turime išspręsti taip, kad galėtume palyginti vieno respondento atsakyme esantį šališkumo dydį (ar bet kokią mūsų vertinamą sąvoką) su kito respondento atsakyme esančiu šališkumo kiekiu ir galiausiai nuspręsti, kuris iš respondentų yra labiau nusiteikę.

Vienijantis matas, atspindintis tam tikrą pagrindinę sąvoką, vadinamas skale. Konkreti pasireiškimo laipsnio reikšmė kiekvienu konkrečiu pagrindinės koncepcijos atveju vadinama skalės vertinimu. Mastelio keitimas arba masto konstravimas yra procedūra, kurios metu tyrėjas sukuria skalę ir priskiria balus pagal šią skalę atskiriems atvejams.

Mastelio keitimas yra realių procesų modeliavimo metodas naudojant skales.

Mastelio keitimas yra skaitinių verčių priskyrimo atskiriems sistemos atributams metodas.

Mastelio keitimas leidžia suskaidyti sudėtingo proceso aprašymą į parametrų aprašą atskirose skalėse. Dėl to, pavyzdžiui, pritaikius ekonomines problemas, galima susidaryti vaizdą apie vartotojo interesų sritį ir ištirti kiekvienos skalės svarbą jam.

Skalė (lot. scala – kopėčios) – dydžio ir taškų matavimo rezultatų palyginimas skaičių tiesėje.

Skalė yra pavadinimų rinkinys, kurių ryšiai atspindi santykius tarp empirinės sistemos objektų. Skalėmis galima vadinti tyrimo metu gautus matavimo rezultatus, taip pat matavimo priemonę (t.y. klausimų sistema, anketą, testą).

1.2 Svarstyklių tipai ir mastelio keitimo tipai

Svarstyklės skirstomos pagal tipus, pagal jos atspindinčius ryšius. Be to, kiekviena skalė atitinka šiai skalei priimtinas matematines transformacijas. Svarstyklių tipai yra hierarchiškai suskirstyti pagal sudėtingumą. Psichometrikoje, ekonometrijoje ir taikomojoje statistikoje priimta tokia skalių klasifikacija, kurią 1946 m. ​​pasiūlė Stanley Smithas Stevensas:

– vardų skalė (nominalinė) – paprasčiausia skalė. Skaičiai naudojami objektams atskirti. Rodo tuos ryšius, per kuriuos objektai grupuojami į atskiras nepersidengiančias klases. Klasės numeris neatspindi jos kiekybinio turinio. Tokios skalės pavyzdys – tiriamųjų skirstymas į vyrus ir moteris, žaidėjų numeracija sporto komandose ir kt. Vardų skalėje matuojami telefono numeriai, pasai, prekių brūkšniniai kodai, individualūs mokesčių mokėtojų numeriai;

– eilės skalė – eilės santykių rodymas. Šios skalės dalykai yra reitinguojami. Tokiam mastui priimtina monotoninė transformacija. Tokia skalė yra neapdorota, nes neatsižvelgiama į skalės subjektų skirtumus. Tokios skalės pavyzdys: akademinių rezultatų balai (nepatenkinamai, patenkinamai, gerai, puikiai), Moso skalė;

– intervalų skalė – be pavadinimo ir eilės skalių nurodytų ryšių, rodo atstumo (skirtumo) tarp objektų ryšį. Skirtumai visuose šios skalės taškuose yra vienodi. Tam priimtina tiesinė transformacija. Tai leidžia sumažinti testų rezultatus iki įprastų skalių ir taip palyginti rodiklius. Pavyzdys: Celsijaus skalė.

– santykio skalė – skirtingai nei intervalų skalė, ji gali parodyti, kiek vienas rodiklis yra didesnis už kitą. Santykių skalė turi nulinį tašką, kuris apibūdina matuojamos kokybės nebuvimą. Ši skalė leidžia transformuoti panašumą (dauginti iš konstantos). Nulinio taško nustatymas yra sudėtinga psichologinių tyrimų užduotis ir nustato šios skalės naudojimo apribojimus. Naudojant tokias svarstykles galima išmatuoti masę, ilgį, stiprumą ir vertę (kainą). Pavyzdys: Kelvino skalė (temperatūra matuojama nuo absoliutaus nulio, o matavimo vienetas pasirinktas ekspertų susitarimu – Celsijaus laipsnis).

Skirtumo skalė – pradžios taškas yra savavališkas, nurodytas matavimo vienetas. Priimtinos transformacijos yra poslinkiai. Pavyzdys: laiko matavimas.

Absoliuti skalė – joje yra papildoma savybė – natūralus ir nedviprasmiškas matavimo vieneto buvimas. Ši skalė turi vieną nulinį tašką. Pavyzdys: žmonių skaičius auditorijoje.

Skalės tipo klausimas tiesiogiai susijęs su matavimo rezultatų matematinio apdorojimo metodų tinkamumo problema. Apskritai tinkama statistika yra ta, kuri yra nekintama leistinų naudojamų matavimo skalės transformacijų atžvilgiu.


Ryžiai. 1. Mastelio keitimo metodų klasifikacija

Sociologiniuose tyrimuose taikomi mastelio keitimo metodai gali būti skirstomi į lyginamuosius ir nelyginamuosius.

Lyginamosios skalės apima tiesioginį nagrinėjamų objektų palyginimą. Pavyzdžiui, respondentų klausiama, ar jiems labiau patinka koksas ar pepsi. Duomenys iš lyginamųjų skalių laikomi santykiniais ir turi tik eilės ir rango verčių savybes. Todėl lyginamasis mastelio keitimas dar vadinamas nemetriniu. Kaip parodyta pav. 1, lyginamosios skalės apima porinį palyginimą, eilės eiliškumą, pastovių sumų skales, Q rūšiavimą ir kitas operacijas.

Lyginamosios skalės yra vienas iš dviejų mastelio keitimo metodų, kurie apima tiesioginį nagrinėjamų objektų palyginimą.

Pagrindinis lyginamojo mastelio keitimo pranašumas yra galimybė atpažinti subtilius nagrinėjamų objektų skirtumus. Lyginant du objektus, respondentai turi pasirinkti vieną iš jų. Be to, respondentai užduotį atlieka pagal duotus pirmenybės balus. Tai leidžia lengvai suprasti ir taikyti lyginamąsias skales. Kitas šių skalių privalumas yra palyginti mažesnis naudojamų teorinių prielaidų skaičius, taip pat aureolės efekto, arba praėjimo efekto, įtakos pašalinimas, kai stiprus pirmenybė vienam produktui iškreipia lyginamąjį kitų vertinimą. Pagrindinis lyginamųjų skalių trūkumas yra jų eiliškumas ir analizės apsiribojimas tam tikru nagrinėjamų objektų skaičiumi. Pavyzdžiui, reikėtų atlikti naują tyrimą, kad būtų galima palyginti RC Cola su Coke ir Pepsi. Šie trūkumai iš esmės pašalinami naudojant nelyginamuosius mastelio keitimo metodus.

Naudojant nelyginamąsias skales, dar vadinamas monadinėmis arba metrinėmis skalėmis, kiekvienas objektas pradinėje nagrinėjamoje populiacijoje vertinamas nepriklausomai nuo kitų. Gauti duomenys laikomi išmatuotais intervalu arba santykine skale.

Nelyginamosios skalės yra vienas iš dviejų mastelio keitimo metodų, kurie apima kiekvieno objekto savęs vertinimą.

Pavyzdžiui, respondentų gali būti paprašyta įvertinti Soke pirmenybės skalėje nuo 1 iki 6 (1 = visai nepatinka, 6 = labai patinka). „Pepsi“ ir „RC Cola“ kainos yra vienodos. Iš pav. 1 parodyta, kad nelyginamosios vertinimo skalės gali būti ištisinės arba išsamios. Detalios vertinimo skalės savo ruožtu skirstomos į skales: Likert, semantical differential ir Stapel. Rinkodaros tyrimuose dažniausiai naudojamas nelyginamasis mastelio keitimas. Šiame skyriuje aptariami lyginamieji mastelio keitimo būdai.

1.3 Pagrindinės svarstyklių konstravimo problemos

Atsižvelgiant į tai, kas išdėstyta pirmiau, mastelio keitimas gali atrodyti gana paprasta, nesudėtinga procedūra, kai tyrėjo užduotis yra tiesiog nustatyti keletą pagrindinės sąvokos komponentų, nustatyti, kokiu rodikliu galima išmatuoti kiekvieną iš jų, tada sujungti šiuos rodiklius į totalinis įvertinimas „... ištarus keletą magiškų žodžių ar statistinių burtų, ir – vienas-du! - Padaryta". Deja, šis akivaizdus paprastumas yra apgaulingas, nes pasirinkdami ir interpretuodami skalės komponentus galime susidurti su daugybe spąstų, kuriems reikia ypatingo dėmesio. Pirma, yra problemų, susijusių su pagrįstumo ir patikimumo sąvokomis.

Galiojimas yra savybė, nulemta atsakymo į klausimą: „Ar tikrai matuojame tai, ką norime išmatuoti? Dabartiniame mūsų kontekste šis klausimas gali būti šiek tiek transformuotas taip: „Ar yra pagrindo manyti, kad kiekvienas atskiras skalės komponentas (kiekvienas konkretus klausimas) iš tiesų yra tiesiogiai susijęs su pagrindine sąvoka ir kad visi komponentai kartu visiškai suvokti šią koncepciją? Kitaip tariant, turime užduoti klausimą: „Ar yra prasminga derinti kelis dalinius rodiklius ir, kadangi mes jau tai padarėme, ar yra prasmės šią rodiklių seriją ženklinti etikete pagrindinę koncepciją, kurią pasirinkome? Taigi, vėl kreipiantis į mokinių pavyzdį, reikia išsiaiškinti, pirma, ar žmogaus nuomonė apie mokinių elgesį yra tiesiogiai susijusi su jo nuomone apie mokinio aprangos stilių ar apie mokinių manieras, antra, ar visos šios nuomonės kartu iš tikrųjų atspindi tam tikro asmens išankstinio nusistatymo prieš studentus laipsnį.

Kalbant apie patikimumą, tai lemia atsakymas į klausimą: „Nepriklausomai nuo to, ką tiksliai matuojame, ar tai darome nuosekliai? Taikant mastelio keitimą, ši problema reiškia susirūpinimą, kad įvairūs skalę sudarantys rodikliai yra nuosekliai ir prasmingai susiję vienas su kitu. Mus iš tikrųjų domina ne tai, ar pateiktas klausimų ar priemonių rinkinys leidžia atskirti obuolius nuo apelsinų, o tai, ar šis rinkinys leidžia nuosekliai rūšiuoti obuolius, kuriuos jau identifikavome pagal dydį, spalvą ir pan. pagal kažkokį standartą. Jei taip, tada skirtingų priemonių derinimas apie obuolius pasakys daugiau nei bet kuri kita priemonė. Bet jei mūsų standartai (spalva, dydis ir kt.) yra nenuoseklūs arba dviprasmiški, tai jais pagrįsti pastebėjimai gali pasirodyti klaidingi. 1

Galbūt kitas pavyzdys padės paaiškinti šiuos dalykus. Panagrinėkime tam tikrą skalę, skirtą kiekvienam respondentui išreikšti savo sutikimą ar nesutikimą su šiais teiginiais:

1. Kubiečiai yra blogi ir jais negalima pasitikėti.

2. Prancūzai yra blogi ir jais negalima pasitikėti

3. Japonai blogi ir jais negalima pasitikėti.

4. Kinai blogi ir jais negalima pasitikėti.

Įsivaizduokime, kad turime ksenofobijos, tai yra baimės ir nepasitikėjimo užsieniečiais, matavimo skalę. Tikėtina, kad kuo daugiau teiginių respondentas sutinka, tuo aukštesnį ksenofobijos lygį galime jam priskirti. Bet ar taip bus? Asmuo, manantis, kad tik kubiečiai yra blogi ir jais negalima pasitikėti, tai tvirtina labiau iš antikomunizmo, nei iš ksenofobijos. Savo ruožtu žmogus, manantis, kad tik japonai ir kinai yra blogi ir jais negalima pasitikėti, tai tvirtina labiau iš rasizmo, o ne iš ksenofobijos. Ir net tas respondentas, kuris mano, kad visos keturios grupės yra blogos ir jomis negalima pasitikėti, kaip paaiškėja atidžiau panagrinėjus, kenčia ne nuo ksenofobijos, o nuo jausmo, kad visi žmonės ar visos vyriausybės (net ir šalis, kurioje jis gyvena). ) yra blogi ir jais nereikėtų pasitikėti. Ir todėl, kadangi negalime užtikrintai teigti, kad ši skalė iš esmės matuoja ksenofobiją, ši skalė negalioja. Ir ar galime ja pasitikėti? Ar jis apgalvotai sukurtas netgi ksenofobijos lygiui išmatuoti? Pavyzdžiui, baimė ir nepasitikėjimas kinais gali būti bent dviejų labai skirtingų savybių rodiklis – viena ideologinė, o kita rasiškai motyvuota, o du respondentai gali pateikti tą patį atsakymą dėl labai skirtingų priežasčių. O ar antikomunistui ir rasistui ksenofobijos jausmas bus vienodas? Greičiausiai ne. Taigi mechaninis šių konkrečių taškų sujungimas, siekiant juos palyginti, geriausiu atveju bus beprasmiškumas, o blogiausiu – klaidingų išvadų šaltinis. 1

Tokio pobūdžio problemas ne visada lengva įveikti, todėl mastelį reikia elgtis labai atsargiai, viską apskaičiuojant iš anksto. Tačiau gebėjimas pavaizduoti sudėtingą požiūrį ar elgesį kaip vieną skaičių ar balą, o tai yra neabejotinas mastelio keitimo pranašumas, yra paskata naudoti šią techniką įvairiais atvejais.

2. SVARSLIŲ VAIDMUO DUOMENŲ ANALIZĖS PROCESE

Matavimo skalė yra algoritmas, skirtas objektui priskirti skaičių, atspindintį tam tikros savybės buvimą ar išraiškos laipsnį. Yra keturi pagrindiniai matavimo skalių tipai: pavadinimo skalė, užsakymo skalė, intervalų skalė ir santykio skalė. Vardų ir tvarkos skalės leidžia objektą priskirti vienai iš kelių nesutampančių klasių ir vadinamos „kokybinėmis“. Intervalų ir santykio skalės matuoja tam tikros savybės objekto „kiekį“ arba išraiškos laipsnį ir yra vadinamos „kiekybinėmis“. Įvardijimo skalė (nominalinė skalė) leidžia priskirti objektą į vieną iš kelių klasių, tarp kurių nenustatytas eilės ryšys, t.y. klasės, kurioms netaikomi palyginimai, tokie kaip „daugiau - mažiau“, „geriau - blogiau“ ir kt. Vardinėmis skalėmis matuojami tokie sociologiniai rodikliai kaip lytis, tautybė ar rasė, akių spalva, temperamentas ir kt. Kuriant vardinę skalę, sudaromas visas klasių sąrašas, kuris sunumeruojamas atsitiktine tvarka. Šiuo atveju klasių numerius žymintys skaičiai atlieka simbolių arba „etikečių“ vaidmenį, jiems negalima taikyti jokių aritmetinių operacijų. Kitaip tariant, vardinėje skalėje apibrėžiamas tik tapatumo santykis: vienai klasei priskirti objektai laikomi identiškais, skirtingoms klasėms priskirti objektai nėra tapatūs. Ypatingas vardinės skalės atvejis yra dichotominė skalė, fiksuojanti tam tikros savybės buvimą ar nebuvimą objekte. Kokybės buvimas paprastai žymimas skaičiumi „1“, jos nebuvimas – skaičiumi „0“. Užsakymo skalė skirta objektui priskirti vienai iš nevienodų klasių, išdėstytų pagal tam tikrą kriterijų. Užsakymo skalėje, be tapatumo santykio, yra apibrėžtas užsakymo santykis („daugiau yra mažiau“). Taigi apie objektus, priskiriamus skirtingoms klasėms, galime pasakyti, kad viename iš jų išmatuota savybė išreikšta stipriau nei kitoje, tačiau neįmanoma nustatyti, kiek stipresnė. Tipiški ordino skalės pavyzdžiai yra išsilavinimas, gyvenvietės tipas, socialinė padėtis, kariniai laipsniai ir kt. Kuriant eilės skalę, klasės numeruojamos atitinkamos charakteristikos didėjimo arba mažėjimo tvarka. Aritmetinės operacijos su klasių skaičiais neatliekamos. Ypatingas eiliškumo skalės atvejis yra rangų skalė, naudojama tais atvejais, kai kurio nors požymio negalima išmatuoti, bet objektus galima surikiuoti pagal atitinkamą kriterijų, arba kai objektų tvarka yra svarbesnė už tikslų matavimo rezultatą – pavyzdžiui, sporto varžybose užimtos vietos. Rangų skalės taip pat naudojamos tiriant pirmenybes, vertybines orientacijas, motyvus, nuostatas ir kt. Tokiu atveju atsakovo prašoma pagal tam tikrą kriterijų išdėstyti siūlomą objektų, sąvokų ar sprendimų sąrašą. Kitas ypatingas užsakymo skalės atvejis – vertinimo skalė, kurios pagalba pagal tam tikrą balų skaičių įvertinamos objekto savybės arba respondento požiūris į ką nors. Pavyzdžiui, akademiniai pasiekimai vertinami 5 balų sistema. Vertinimo skalės dažnai laikomos užsakymo skalių išimtimi, nes jos daro prielaidą, kad atstumas tarp skalės taškų yra maždaug vienodas. Pavyzdžiui, daroma prielaida, kad „puikus“ studentas dalyką išmano tiek pat geriau nei „geras“ studentas, kiek „geras“ studentas jį išmano geriau nei „C“ studentas. Ši savybė leidžia daugeliu atvejų vertinimų skales traktuoti kaip kvaziintervalines ir atitinkamai naudoti, pavyzdžiui, skaičiuojant GPA arba nustatyti vidutinį našumą klasėje. Intervalų ir santykio skalės yra S.I. Tiesiogine to žodžio prasme. Jiems būdingas matavimo vienetas, leidžiantis nustatyti, kiek vienas objektas yra didesnis ar mažesnis už kitą, pagal tiriamą kriterijų. Skirtumas tarp šių dviejų skalių tipų yra tas, kad santykio skalė turi „objektyvų“ nulį, nepriklausomą nuo stebėtojo savivalės, o tai, kaip taisyklė, atitinka visišką išmatuotos kokybės nebuvimą objekte. Intervalų skalėje nulis nustatomas savavališkai arba pagal kai kurias tradicijas ir susitarimą. Taigi amžius matuojamas santykio skalėje, o chronologija – intervalų skalėje, nors abiejose skalėse naudojamas tas pats matavimo vienetas – metai. Intervalų skalėje, be tapatumo ir tvarkos santykių, nusakomas ir skirtumo santykis: bet kuriai objektų porai galima nustatyti, kiek (matavimo vienetų) vienas objektas yra didesnis ar mažesnis už kitą. Intervalinės skalės plačiai naudojamos psichologiniuose testuose ir psichometrikoje, semantinėse diferencialinėse technikose ir kituose antrinių matavimų metoduose. Požiūrio skalės matuoja tokius rodiklius kaip ūgis, amžius, pajamos, darbo patirtis, surūkytų cigarečių skaičius ir kt. Tokiems kintamiesiems apibrėžiami ne tik tapatumo, tvarkos ir skirtumo santykiai, bet ir santykių santykis, leidžiantis nustatyti, kiek kartų vienas objektas yra didesnis ar mažesnis už kitą.

Matavimas – tai empirinės sistemos atvaizdavimas į skaitinę sistemą, kuri išsaugo santykių tarp objektų tvarką. Klasikinė matavimo koncepcija išskiria du būdus, kaip objektams priskirti kintamąsias reikšmes. Pirmasis metodas vadinamas vertinimu. Objekto savybių atvaizdavimas skalėje čia atliekamas įprastiniais vienetais. Pavyzdžiui, galima skirtingu tikslumu nustatyti asmens vietą „konservatizmo“ skalėje. Konservatyvumo vieneto tyrėjas nedisponuoja, gradacijos gali keistis savavališkai.

Pats matavimas reikalauja vieneto apibrėžimo – skalės etalono. Šiuo atveju galima išmatuoti tik erdvines ir laiko charakteristikas, taip pat skaičius – adityvinius dydžius. Tačiau platesnis požiūris į matavimą kaip reikšmių priskyrimą objektams pagal tam tikrą įvairių lygių santykių sistemą sulaukė pripažinimo socialiniuose ir elgesio moksluose.

Kintamasis nėra tas pats, kas tikrasis atributas ar savybė. Tai savotiškas valdovas – normų ir operacijų rinkinys, kuris yra būtinas ir pakankamas kvalifikuoti įvykį, nuosavybę, santykius, žodžiu, viską, kas įprastai suprantama kaip faktai. Liniuotei nėra labai svarbu, ar jos padalos dedamos ant medinės, plastikinės ar metalinės plokštės. Daug svarbiau yra skalės gradacija, taip pat vartotojo galimybė teisingai atlikti matavimus. Panaši situacija ir matuojant elgesį, tik „valdovas“ šiuo atveju turi anketos formą (arba stebėjimo formą), o jų „taikymas“ objektui yra ne kas kita, kaip operatyvinis apibrėžimas.

Kaip matavimo priemonę, kintamąjį sukuria tyrėjas, nustatydamas verčių kontinuumą (gradacijas). Minimalus kontinuumo minimumas, kaip jau žinome, yra dichotomija: „taip“ ir „ne“, pliusas ir minusas, teigimas ir neigimas. Tiesą sakant, beveik visada susiduriame su trichotomijomis, nes bet kuris kintamasis apima „atsakymo nėra“ (arba „nėra duomenų“) gradaciją.

Taigi kintamąjį sudaro trys komponentai: 1) tam tikra ne visada aiškiai suformuluota matuojamo požymio samprata, pavyzdžiui, „rinkiminės nuostatos“, „šeimos stabilumas“, „išsilavinimas“ ir kt.; 2) skalė - reikšmių rinkinys, apibrėžiantis objektų klasifikavimo kriterijus; 3) operacinis apibrėžimas - instrukcijų rinkinys, reguliuojantis objekto identifikavimo procesą pagal nustatytą reikšmių skalę.

Elementarus matavimo lygis yra nominalus. Šis lygis atitinka įvardijimo skalę, kurią sudaro būdingos reikšmės, kurios nėra išdėstytos didėjančiais ar mažėjančiais laipsniais. Tipiški vardų skalės pavyzdžiai: tautybė, profesija, politiniai įsitikinimai. Vardų skalės reikšmės sudaromos pagal logines klasifikavimo taisykles. Pirmasis iš jų yra neprieštaravimo taisyklė. Jame teigiama: „Objektas gali būti priskirtas vienai ir tik vienai klasei, kaip nurodyta kintamojo reikšme“. Kitaip tariant, tyrėjas įpareigotas vadinti kastuvus ir vengti dialektikos, kurioje objektas vienu metu pasirodo esąs abu. Tai padaryti nėra taip paprasta, kaip atrodo – vadinti daiktą tinkamu vardu. Reakcionieriai kartais atrodo liberalai, kvaili žmonės – protingi, moterys – vyrai. Tačiau net ir sudėtingiausiose situacijose analitikas privalo suteikti objekto nedviprasmišką kvalifikaciją. Čia daug kas leidžiama. Vienintelis draudžiamas dalykas yra vienu metu priskirti objektą baltai ir juodai.

Šios taisyklės pasekmė yra šimtaprocentinė visų kintamojo gradacijų dažnių suma. Jei dažnių suma viršija šimto procentų ribą, tai reiškia, kad bent kai kurie vienetai pateko į dvi klases vienu metu ir buvo skaičiuojami daugiau nei vieną kartą. Taip atsitinka, kai anketoje prašoma asorti skalę, kurioje galima pasirinkti vieną, kitą ir trečią. Pavyzdžiui, klausiama: „Ką tu labiausiai myli? su atsakymų variantais: matzo, šašlykas, liberalios demokratinės laisvės... Čia galite pasirinkti visus anketos patarimus, o 100% viso negausite, jei bent vienas iš respondentų pateks į klasę mylinčių abu matzo ir liberalios demokratinės laisvės. Iškraipymo priežastis yra ta, kad pateiktos pozicijos nėra kintamasis, priešingai, kiekviena iš jų yra „sutrumpinta“ kintamojo versija. Pilnai versijai reikia atsakyti „taip“, „ne“ ir „negaliu pasakyti“. Teisingai sukonstruotas kintamasis reiškia vienmatį kontinuumą. Skirtingai nuo kelių dalių matmenų, jo nereikia kaupti. Taigi antroji taisyklė – vieno klasifikavimo pagrindo taisyklė. Negalite skirstyti žmonių į protingus ir raudonplaukius, nes kartais raudonplaukiai pasirodo protingi. Viename klausime negalima maišyti dviejų skirtingų kintamųjų. Neįmanoma neatsižvelgti į kintamojo reikšmės pasikeitimą, kai jis perkeliamas į kitą kontekstą. Pavyzdžiui, Maskvoje ir Čikagoje užduotas klausimas apie požiūrį į intelektualus bus du skirtingi klausimai, nes rusų tradicijoje intelektualui įprasta priskirti moralės principų nešėjo vaidmenį, o tuo tarpu gyventojui. Čikaga ne iš karto atspės, kas yra „intelektualas“.

Trečioji taisyklė – užbaigtumo taisyklė. Tiriamoje populiacijoje neturėtų būti nei vieno objekto, kurio nebūtų galima identifikuoti pagal pateiktas vertes. Kitaip tariant, objektas turi būti paskirstytas kintamojo kontinuume ir gauti jam tinkamą vietą vienoje iš klasių. Jei taip neatsitiks, matavimo procesas „užšąla“ - tiesiog nėra nieko arba nėra kam pritaikyti liniuotės. Atkreipkite dėmesį, kad padėtis „Nėra duomenų“ išsprendžia išsamumo problemą, kai skalė neapima viso verčių diapazono. Pavyzdžiui, respondento atsisakymas pranešti apie savo amžių nereiškia, kad amžiaus skalė yra nereikšminga šiam dalykui. Yra daugybė mastelių, kurios neturi ryšio su objektu, kitaip tariant, nėra jam svarbios. Sociologai dažnai bando išmatuoti nuomones, nuostatas ir kitas asmenines savybes, manydami, kad kiekvienas turi tiriamą savybę. Pavyzdžiui, kai kurių viešosios nuomonės tyrimų centrų 1992 m. užduotas klausimas: „Koks jūsų požiūris į Burbulį?“ buvo pagrįstas įsitikinimu, kad savybė „Požiūris į Burbulį“ yra kiekviename, kuris buvo įtrauktas į imtį. Buvo atmesta pati galimybė, kad žmogus neturėjo nei teigiamo, nei neigiamo požiūrio į Burbulį. Atrodo, kad pozicija „negaliu pasakyti“ apima tokio tipo respondentus, tačiau tai apima ne tik tuos, kurie neturi nuomonės, bet ir tuos, kurie neturi paties požymio.

Sociologiniame matavime dažnai atsiranda dirbtinai sukurto atsirandančio kintamojo tipas – kintamieji, kuriuos sukuria pati procedūra. Žmonės, kurie iki interviu neturėjo jokio ryšio su tiriama savybe, šį ryšį konstruoja tarpasmeninio bendravimo su pašnekovu procese, atsakydami „teigiamai“, „neigiamai“ arba dažniausiai „neutraliai“. Iškylančių kintamųjų priežastys labiausiai susijusios su pašnekovo įtaka.

G. A. Pogosyanas parodo tipiškas aplinkybes, kuriomis kintamieji apibūdina ne tiek savarankišką respondento kalbos elgesį, kiek duomenų rinkimo situaciją. Visų pirma, Pogosyanas parodė, kad atsakymo raginimas žymiai pakeičia dažnio pasiskirstymą.

Lentelėje matyti, kad „užuomina“ gerokai padidina manančių, kad geri specialistai turi palankiausias galimybes paaukštinti, ir beveik tiek pat sumažina tų, kurie nurodo paklusnumą. Darant prielaidą, kad atvirieji klausimai suteikia didesnę galimybę savarankiškai išreikšti nuomonę, užuomina veda į artefaktą: 62% pasirinko tinkamą atsakymo variantą, o ne išreiškė savo nuomonę.

Kurdamas kintamuosius, sociologas siekia užtikrinti, kad jie atitiktų tikrąjį objekto elgesį. Tuo pačiu metu jis privalo juos organizuoti logiškai, nepaisydamas to, kad „gyvenimas“ dažnai yra nelogiškas ir dviprasmiškas. Čia iškyla dilema: arba aprašyti gyvenimą su visais jo nenuoseklumais, arba sudaryti diagramas. Pirmuoju atveju sociologui geriau rinktis rašytojo karjerą, antruoju – reikia stengtis, kad loginė schema atitiktų tikrovę.

Asmeninio susirašinėjimo ir vieno pagrindo reikalavimai apima tam tikrą smurtą prieš „žmogišką“ tikrovę. Gyvenime „taip“ dažnai virsta „ne“, „demokratai“ save vadina komunistais, bet pliusas pasirodo kaip minusas. Geriausia dirbti su vardais, kurie, kaip manoma, labiausiai atitinka socialinio bendravimo ir elgesio kalbą. Vardiniai sociologinių ir socialinių bei ekonominių tyrimų matavimai laikomi esminiais siekiant suprasti pačią socialinės tikrovės prigimtį. S.V. Šią išvadą Česnokovas grindžia prielaida, kad nominalūs kintamieji yra galutinis empirinio teorinių sąvokų patikrinimo procedūrų rezultatas, kai vienu ar kitu tyrimo objektu yra žmonės, jų sąmonė ir elgesys. „Taip yra dėl to, – rašo S.V. Česnokovas, „kad ir sociologas-tyrėjas, ir žmonės, išreiškę gerą valią susisiekti su sociologu respondentų vaidmenyje, išreiškia savo reakcijas, formuoja ir apibūdina socialinį vaizdiniais ir sąvokomis, kurių ženklai yra žodžiai, o ne skaičiai“8 . Tai reiškia, kad daroma prielaida, kad skaitmeninės duomenų analizės galimybės yra ribotos. Humanitarinė S.V. Česnokovas vadina bet kokį įvardijimą, o deterministinė analizė yra „jei a, tai b“ nustatymas, kur a ir b yra vardai.

Be jokios abejonės, vardiniai kintamieji, fiksuojantys konkrečias reikšmes, yra sociologinio žodyno pagrindas. Tačiau ši jų savybė yra įsišaknijusi ne tiek socialinio bendravimo „gyvoje kalboje“, kiek kintamųjų verčių lygiavertiškumu protokoliniams faktų fiksavimo teiginiams. Tokie vardiniai „protokolai“, nepaisant jų turinio, yra bet kokio mokslinio aprašymo pagrindas. Pačios skalės (kontinuumai) yra vardinių verčių organizavimo būdai idealizuotose metrikose, tačiau bet kuriuo atveju turi būti laikomasi vieneto ir kintamojo vertės atitikties vienas su vienu reikalavimu.

Reikalavimai vardiniams matavimams (identifikacijoms) turi atitikti ir aukštesnio lygio skalėms: eilinė, intervalinė ir metrinė.

Sutvarkyta skalė skiriasi nuo vardinės tuo, kad jos gradacijos yra išdėstytos tam tikra tvarka, atsižvelgiant į didėjantį ar mažėjantį savybės intensyvumą.

Užsakyta klasė apima vertinimo skales, nuostatas ir pageidavimus. Sociologijoje naudojamos dviejų tipų sutvarkytos skalės: rangai (reitingai) ir taškai. Reitingai nustatomi priskiriant objektui vietą taip, kad vietų skaičius būtų tiksliai lygus objektų skaičiui. Pavyzdžiui, galite paskirstyti mokinius pagal pasirengimo lygį ir kiekvienam priskirti vietą, pradedant nuo pirmos iki paskutinės. Kitaip tariant, mes juos reitinguojame, žinodami, kad nepriklausomai nuo žinių lygio grupėje turi būti pirmas ir paskutinis. Panaši gamybos skatinimo sistema, pagrįsta idėja atlyginti pirmiesiems antrųjų sąskaita, buvo naudojama septintajame dešimtmetyje. V.M. Jakuševas, eksperimentuodamas viename iš projektavimo biurų, eksperimentas tapo žinomas kaip „Pulsar“. Kadangi bet kuriuo atveju kas nors liks paskutinis, grupė patenka į konkurencijos ir kovos dėl išlikimo sąlygas.

Reitingas kaip socialinio vertinimo rūšis yra tam tikros rūšies kultūros norma, pagrįsta individualaus intereso prioritetu prieš kolektyvinius interesus. Gyvenimas ir profesinė sėkmė čia suvokiama kaip pergalė prieš kitus. Tokiame žaidime laikoma kvaila ir net amoralu leisti klasės draugui apgauti testą – juk tai reiškia jam pralaimėjimą varžybose. Galų gale varomi arkliai nušaunami, tiesa? Visa tai vyksta ne tik studijose, bet ir versle, šeimoje, bendraujant, religijoje. Racionalaus pasirinkimo teorija remiasi būtent individualaus elgesio optimizavimo ribotais ištekliais idėja.

Taškinės skalės veikia ne vietomis, o mokyklinėmis vertybėmis. Šios vertės nepriklauso viena nuo kitos. Tam tikra prasme taškų skalė turi egalitarinę kilmę. Visi studentai, įskaitant pirmąjį ir paskutinįjį, gali gauti C ir būti laimingi pagal santykinio nepritekliaus teoriją. Tačiau tokios skalės patikimumas yra labai abejotinas, ypač tais atvejais, kai pažymiams žymėti naudojami skaičiai. Atstumas nuo 4 iki 5 nėra tas pats, kas atstumas nuo 2 iki 3. Kiekvienas mokytojas turi savo pirmenybę tam, kurioje kontinuumo vietoje jis dės mokinius. Vienas deda 2 ir 3, kitas 4 ir 5. Kaip juos palyginti? Čia nėra didelių sunkumų, nes individualias vertes galima normalizuoti pagal kiekvieno mokytojo balų vidurkį arba standartinį balų nuokrypį.

Užsakytos vertinimo skalės apima loginį pozicijų subalansavimą neutralaus centro atžvilgiu. Šis reikalavimas atspindi bendresnę svarstyklių konstravimo taisyklę: kiekvienai skalės kategorijai turi būti būdinga vienoda tikimybė „atsitrenkti“ į objektą, atsitiktinai pasiskirstant. Kitaip tariant, gradacijų skaičius dešinėje nuo centro turi būti lygus gradacijų skaičiui kairėje. Dažnai reikšmė "Negaliu pasakyti" naudojama kaip skalės "centras". Tai sukuria akivaizdų duomenų interpretavimo dviprasmiškumą. „Negaliu pasakyti“ reiškia, kad respondentas negali pasirinkti nė vienos iš siūlomų pareigų; bet jei „negaliu pasakyti“ yra subalansuotos skalės centre, tai reiškia, kad „man sunku ką nors teikti pirmenybę“.

Kai užsakytos vertinimo skalės reikšmės neturi aiškiai apibrėžtų ribų, skalė tampa pusiau tvarkinga. Tiesą sakant, sociologiniuose ir psichologiniuose tyrimuose dažniausiai naudojamos pusiau sutvarkytos svarstyklės.

Intervalų skalės yra pagrįstos procedūromis, užtikrinančiomis vienodus arba maždaug vienodus atstumus tarp kintamojo gradacijų. Šiuo atveju lyginamos ne kintamųjų reikšmės, o atstumai tarp reikšmių. Kitaip tariant, bet kurie du tam tikros empirinės sistemos matavimai, atlikti intervalo skalėje, yra konvertuojami vienas į kitą naudojant tiesinę funkciją.

Jei nominalioje skalėje objektų seka nustatoma be didelių sunkumų, intervalo skalė apima atstumų tarp objektų palyginimo problemą. Šią tiesinių transformacijų savybę, būdingą intervalų skalėms, parodo skaitinis pavyzdys: 5 - 2 / 2 - 1 = 24 - 15 / 15 - 12 = 3. Skalės reikšmių skirtumų santykis yra pastovus. atvejis“. Jei vienas iš intervalų skalės objektų rodomas ties nuliu, galime kalbėti apie santykio skalę – specialų intervalo skalės atvejį. Šiuo atveju atgalinio skaičiavimo pradžia12 yra fiksuota.

Galite sudaryti intervalų skalę naudodami suporuotus palyginimus arba, kaip darė L. Thurstone, teismines procedūras. Pirma, sukuriamas atitinkamų sprendimų, apibūdinančių vertinamą požymį, pavyzdžiui, požiūrį, požiūrį ar vertinimą, masyvas. Tada ekspertų prašoma suskirstyti sprendimus į kategorijas nuo didžiausio požymio intensyvumo iki mažiausio. Daroma prielaida, kad teisėjų įvertinimų pasiskirstymas pagal skalės vertes priklauso nuo įprasto įstatymo. Atrenkami tie sprendimai, kurie gavo ir suderino teisėjų balus. Tai yra „lygių intervalų“ konstravimo metodas. Labiausiai žinomus intervalų skalių konstravimo metodus sukūrė L. Thurstone, R. Likert ir L. Guttman. Tačiau šiuolaikinėje sociologijoje jie naudojami retai.

Metrinės, arba absoliučios, svarstyklės atitinka visus žemesnių klasių svarstyklėms keliamus reikalavimus, turi ne tik nulinį atskaitos ženklą, bet ir laiko, atstumo ar vienetų skaičiaus matavimo vienetą. Čia leidžiamos visos transformacijos su skaičiais.

Reikšmės priskyrimas objektams pasireiškia trimis formomis: žodine, grafine ir skaitine. Žodinis kintamųjų aiškinimas dažniausiai yra masinėse apklausose. Skalės elementai čia yra sprendimai, nurodantys nuomones, vertybes ir būsenas. Tai, kiek šie įrodymai yra pakankami, yra ypatinga problema. Aišku viena: patys sprendimai yra ne kas kita, kaip tikrovės, kuri stovi už jų, įrodymas. Todėl žodinė skalės interpretacija atlieka savotiško zondo vaidmenį kasdienio gyvenimo kalboje. Esminis jos skirtumas nuo kasdieninės kalbos slypi aiškioje sąvokų struktūroje, pritaikytoje įvairioms kalbėjimo situacijoms ir kontekstams. Net atviras klausimas, atrodytų, maksimaliai orientuotas į respondento žodyną, veikia tik tuo atveju, jei yra vienareikšmiškas konceptualus kodavimas.

Žodžiu interpretuojamos skalės pozicijos suvokiamos gana aiškiai, jei jų nedaug. Tačiau jau renkantis iš penkių gradacijų prasideda sunkumai. Pavyzdžiui, kategorijos „patenkintas“ ir „greičiau patenkintas nei nepatenkintas“ labai skiriasi. Septynių balų skalėje žodinės interpretacijos galimybės yra išnaudotos. Čia pirmenybė teikiama grafiniam svarstyklių dizainui, sukuriančiam standartinio skaitymo galimybę. Grafinė skalės interpretacija naudojama vadinamosiose tarpkultūrinėse studijose, kur instrumento žodynas reikalauja vertimo į respondento kalbą. Vizualizavus kintamąjį figūroje, turėtų būti sukurtas universalus skalės „modelis“. Panašiai gestai naudojami ir tarptautinėje komunikacijoje. Vienas grafiniu raktu sukurto įrankio pavyzdžių yra teminio apercepcijos testo nuotraukos. Svarstyklės dažnai vaizduojamos kaip liniuotės ir piktogramos. Harvey Cantril sukūrė „laimės kopėčias“: kopėčių brėžinyje respondentas turi pažymėti savo dabartinę padėtį, palyginti su geriausiu (kopėčių viršus) ir blogiausiu (kopėčių apačia) aplinkybių deriniu, o tada nurodyti jo numatyto judėjimo „laimės laiptais“ kryptį. Vienoje iš ankstyvųjų požiūrio skalės versijų L. Thurstone'as pasiūlė vienuolikos taškų kontinuumą, padarytą termometro pavidalu.

Skaitinis aiškinimas kartais klaidingai tapatinamas su žodine interpretacija. Skaičių naudojimas kaip skaitmenų pavadinimai nereiškia metrikos įvedimo. Pavyzdžiui, kodavimo tikslais vyrai gali būti pažymėti kaip 1, o moterys - kaip 2. Šiuo atveju naudojamos etiketės, bet ne skaičiai. Skaičiai apima adityvumo ir aritmetinių operacijų įgyvendinimą. Skaitinių skalių diapazonas apsiriboja intervaliniais ir metriniais matavimo lygiais, kuriuose nustatomi savybių intensyvumo vienetai.

794. Orlovas A.I. Matavimo teorija kaip duomenų analizės metodų dalis: apmąstymai apie P.F. straipsnio vertimą. Velleman ir L. Wilkinson // Sociologija: metodika, metodai, matematinis modeliavimas. 2012. Nr.35. P. 155-174.
A.I. Orlovas

(Maskva)
MATAVIMO TEORIJOS VIETA DUOMENŲ ANALIZĖS METODUOSE 1


Pagal šiuolaikinę taikomosios statistikos paradigmą matavimo teorija yra neatsiejama duomenų analizės metodų dalis. Pasak P.F. Vellemano ir L. Wilkinsono nuomone, matavimo teorijos naudojimas „pasirenkant arba rekomenduojant tam tikrus statistinės analizės metodus yra netinkamas ir dažnai sukelia klaidų“. Straipsnyje pateikiama trumpa informacija apie matavimo skales ir matavimų teorijos taikymą renkantis vidurkius pagal duomenų matavimo skales, o vėliau kruopščiai analizuojami P.F. argumentai. Velleman ir L. Wilkinson. Diskusijos santrauka: „matavimo teorija svarbi statistinei analizei interpretuoti“. Diskusija leido išsiaiškinti keletą taikomosios statistikos taikymo (duomenų analizės) klausimų: buvo nustatytas sprendžiamos problemos vaidmuo ir duomenų modelis, naudojamas šių duomenų matavimo skalių tipams nustatyti; Atskiriamos tiriamosios analizės ir įrodymais pagrįstos statistikos taikymo sritys.
Raktažodžiai: matavimo teorija, duomenų analizė, taikomoji statistika, matavimo skalės, leistinos transformacijos, išvadų nekintamumas.
Duomenų analizės metodai (kitaip tariant, taikomoji statistika, statistiniai metodai) būtini sociologui masinių apklausų rezultatams apdoroti, taip pat ekspertinių apklausų rezultatams apibendrinti. Ši mokslo sritis sparčiai vystosi. Pagal naują taikomosios statistikos paradigmą matavimo teorija yra neatsiejama šiuolaikinių duomenų analizės metodų dalis. Mūsų vadovėliuose (ir kt.) kalbama apie matavimo teoriją ir jos taikymą renkantis adekvačius duomenų analizės metodus.

Yra ir kitų nuomonių apie matavimo teorijos panaudojimo tikslingumą analizuojant sociologinius duomenis. Pagrindinė straipsnio mintis P.F. Velleman ir L. Wilkinson išreiškiamas jos pavadinimu. Jų nuomone, matavimo teorijos naudojimas „renkantis ar rekomenduojant tam tikrus statistinės analizės metodus yra netinkamas ir dažnai sukelia klaidų“.

Prieš analizuodamas P. F. argumentus. Vellemano ir L. Wilkinsono, patartina pateikti trumpą informaciją apie diskusijos temą, visų pirma, apibrėžti vartojamus terminus ir suformuluoti pagrindines nuostatas vietinės tikimybinės-statistinės mokyklos, kurios įkūrėjas yra A.N., stiliumi. Kolmogorovas, kuris tikimybių teoriją ir matematinę statistiką pavertė matematikos šaka. Kartu patiksliname pristatymą ir aprašome matavimų teorijos taikymą vidurkių teorijoje, kas leido sukurti darnią ir galutinę vidurkių sistemą.
Matavimo teorijos pagrindai
Matavimų teorija kyla iš to, kad aritmetinės operacijos su skaičiais, naudojamos praktiniame darbe, ne visada turi prasmę. Pavyzdžiui, kodėl reikia pridėti arba dauginti telefono numerius? Be to, įprasti aritmetiniai ryšiai ne visada išsipildo. Pavyzdžiui, dviejų prastų mokinių žinių suma nėra lygi „gero“ mokinio žinioms, t.y. už žinių vertinimą 2+2 nelygu 4. Pateikti pavyzdžiai rodo, kad praktika naudojant skaičius apibūdinti stebėjimų (matavimų, testų, analizių, eksperimentų) rezultatus verta metodinės analizės.

Pagrindinės matavimo svarstyklės. Paprasčiausias būdas naudoti skaičius – juos naudoti objektams atskirti. Pavyzdžiui, telefono numeriai reikalingi vienam abonentui atskirti nuo kito. Taikant šį matavimo metodą, naudojamas tik vienas ryšys tarp skaičių – lygybė (du objektai apibūdinami arba vienodais skaičiais, arba skirtingais). Atitinkama matavimo skalė vadinama įvardijimo skale (naudojant lotynų kalbos terminą vardinė skalė; kartais dar vadinama klasifikavimo skale). Šia skale matuojami prekių brūkšniniai kodai, pasų numeriai, TIN (individualūs mokesčių mokėtojo numeriai) ir daugelis kitų skaičiais išreikštų kiekių. Taikomuoju požiūriu matavimo skalė yra būdas priskirti nagrinėjamiems objektams skaičius, atitinkančius tarp objektų egzistuojančius ryšius.

Atkreipkite dėmesį, kad numeriai objektams gali būti priskirti įvairiais būdais. Perėjimas nuo vieno metodo prie kito stebimas keičiant pasus ar telefono numerius. Kokios yra galiojančių transformacijų savybės? Vardų skalei natūralu reikalauti tik abipusio nedviprasmiškumo. Kitaip tariant, matavimo rezultatams pritaikę transformaciją vienas į vieną, gauname naują skalę, kuri taip pat gerai kaip ir ankstesnė skalė apibūdina originalių objektų sistemą.

Šeši pagrindiniai matavimo skalių tipai aprašyti 1 lentelėje.
1 lentelė. Pagrindinės matavimo skalės.


Skalės tipas

Mastelio apibrėžimas

Pavyzdžiai

Leidžiamų transformacijų grupė

Kokybinių savybių skalės

Daiktai

Skaičiai naudojami objektams atskirti

Telefono numeriai, pasai, TIN, brūkšniniai kodai

Visos konversijos „vienas su vienu“.

Eilinis

Skaičiai naudojami objektams užsakyti

Ekspertų įvertinimai, vėjo balai, pažymiai mokykloje, naudingumas, namų numeriai

Visos griežtai didėjančios transformacijos

Kiekybinių požymių skalės

(apibūdinama atskaitos tašku ir matavimo vienetu)



Intervalai

Kilmė ir matavimo vienetas yra savavališki

Potenciali energija, taško padėtis, temperatūra pagal Celsijaus ir Farenheito skales

Visos tiesinės transformacijos φ( x) = kirvis + b,

a Ir b savavališkas A>0


Santykiai

Nurodytas atskaitos taškas, matavimo vienetas yra savavališkas

Svoris, ilgis, galia, įtampa, varža, Kelvino temperatūra, kainos

Visos tokios transformacijos φ( x) = kirvis,

A savavališkai, A>0


Skirtumai

Pradinis taškas yra savavališkas, nurodytas matavimo vienetas

Laikas

Visos poslinkio transformacijos φ( x) = x + b,

b savavališkai


Absoliutus

Nurodoma kilmė ir matavimo vienetas

Žmonių skaičius tam tikrame kambaryje

Tik tapatybės transformacija φ( x) = x

Be išvardytų 1 lentelėje, naudojamos ir kitų tipų svarstyklės. Atkreipkite dėmesį, kad 1 lentelėje posakis „matavimo vienetas yra savavališkas“ reiškia, kad jis gali būti pasirinktas specialistų susitarimu, tačiau tai neišplaukia iš jokių esminių santykių. Matuojant laiką, natūralus matavimo vienetas nustatomas pagal dangaus kūnų apsisukimų periodus. Pradinis taškas matuojant ilgį nustatomas pagal atkarpos, kurios pradžia ir pabaiga sutampa, ilgį ir kt.

Šiuo metu manoma, kad prieš naudojant tam tikrus duomenų analizės algoritmus būtina nustatyti, kokio tipo svarstyklėse yra matuojami nagrinėjami dydžiai. Be to, laikui bėgant gali keistis tam tikro dydžio matavimo skalės tipas. Pavyzdžiui, temperatūra pirmiausia buvo matuojama eilės skalėje (šilčiau – šaltesnė). Išradus termometrus, jis buvo pradėtas matuoti intervalų skalėje (Celsijaus, Farenheito arba Reaumur). Temperatūra SU pagal Celsijaus skalę, išreikštą temperatūra F Farenheitas naudojant tiesinę transformaciją

Atradus absoliučią nulinę temperatūrą, tapo įmanomas perėjimas prie santykio skalės (Kelvino skalės).

Išvadų nekintamumo (adekvatumo) reikalavimas. Norint tinkamai parinkti duomenų analizės metodus, būtina išsiaiškinti naudojamų skalių tipus. Esminis reikalavimas yra išvadų, iš kurios konkrečios matavimo skalės naudojo tyrėjas, nepriklausomumas (tarp visų skalių, kurios leistinomis transformacijomis transformuojasi viena į kitą). Pavyzdžiui, jei kalbame apie ilgius, tai išvados neturėtų priklausyti nuo to, ar ilgiai matuojami metrais, aršinais, gyliais, pėdomis ar coliais.

Kitaip tariant, išvados turi būti nekintamos pagal leistinų matavimo skalės transformacijų grupę. Tik tada jas galima vadinti adekvačiomis, t.y. laisvas nuo tyrėjo, kuris pasirenka konkrečią skalę iš tam tikro tipo skalių rinkinio, susietos priimtinomis transformacijomis, subjektyvumo.

Išvados nekintamumo reikalavimas nustato daugelio galimų duomenų analizės algoritmų apribojimus. Kaip pavyzdį apsvarstykite eilės skalę. Vieni duomenų analizės algoritmai leidžia daryti adekvačias išvadas, kiti – ne. Pavyzdžiui, dviejų nepriklausomų imčių homogeniškumo tikrinimo uždavinyje rangų statistikos algoritmai (t. y. naudojant tik matavimo rezultatų rangus) pateikia adekvačias išvadas, o Cramer-Welch ir Studento statistika – ne. Tai reiškia, kad norint apdoroti duomenis, išmatuotus eilės skalėje, galima naudoti Smirnovo ir Wilcoxon testus, bet ne Cramer-Welch ir Studento testus.
Vidutinių verčių pasirinkimas pagal matavimo skales
Nekintamumo reikalavimas yra gana stiprus. Iš daugelio statistinių duomenų analizės algoritmų tik keli jį tenkina. Parodykime tai palyginę vidutines reikšmes.

Cauchy vidurkiai. Tarp visų duomenų analizės metodų svarbią vietą užima vidurkinimo algoritmai. Dar aštuntajame dešimtmetyje buvo galima visiškai išsiaiškinti, kokių tipų vidurkius galima naudoti analizuojant duomenis, išmatuotus tam tikromis skalėmis.

Leisti X 1 , X 2 ,…, X n - mėginių ėmimo tūris n. Dauguma bendrąją vidutinės vertės sampratą XIX amžiaus pirmoje pusėje įvedė prancūzų matematikas. O. Koši. Vidutinė reikšmė (pagal Cauchy) yra bet kokia funkcija f(X 1 , X 2 ,...,X n) taip, kad visoms galimoms argumentų reikšmėms šios funkcijos reikšmė būtų ne mažesnė už skaičių minimumą X 1 , X 2 ,...,X n, ir ne daugiau nei didžiausias šių skaičių. Cauchy vidurkiai yra aritmetinis vidurkis, mediana, režimas, geometrinis vidurkis, harmoninis vidurkis ir kvadratinis vidurkis.

Vidurkiai paprastai naudojami skaičių populiacijai (imtimi) pakeisti vienu skaičiumi ir tada palyginti populiacijas naudojant vidurkius. Tegu pvz. Y 1 ,Y 2 ,...,Y n- vienam tyrimo objektui „priskirtų“ ekspertų (arba respondentų) vertinimų rinkinys, Z 1 , Z 2 ,..., Z n- į antrą. Kaip šios populiacijos palyginamos? Lengviausias būdas yra naudoti vidutines vertes.

Esant priimtinam skalės transformavimui, vidurkio reikšmė akivaizdžiai pasikeičia. Tačiau išvados apie tai, kurios populiacijos vidurkis didesnis, o kurios mažesnis, neturėtų keistis (pagal išvadų nekintamumo reikalavimą, priimtą kaip pagrindinį matavimo teorijos reikalavimą). Suformuluokime atitinkamą matematinę problemą ieškant vidutinio dydžio reikšmių tipo, kurių palyginimo rezultatas yra stabilus leistinų skalės transformacijų atžvilgiu.

Leisti f(X 1 , X 2 ,...,X n) – vidutinio sunkumo. Tegul pirmosios populiacijos vidurkis yra mažesnis nei antrosios populiacijos vidurkis:

f(Y 1 ,Y 2 ,...,Y n) (Z 1 , Z 2 ,..., Z n).

Tada, remiantis matavimo teorija, norint, kad vidurkių palyginimo rezultatas būtų stabilus, būtina, kad bet kuriai leistinai transformacijai g(iš leistinų transformacijų grupės atitinkamoje skalėje) nelygybė taip pat buvo teisinga

f(g(Y 1), g(Y 2),...,g(Y n)) (Z 1),g(Z 2 ),...,g(Z n)),

tie. transformuotų verčių vidurkis iš pirmosios populiacijos buvo mažesnis nei transformuotų verčių vidurkis iš antrosios populiacijos. Be to, suformuluota sąlyga turi būti įvykdyta bet kuriems dviem rinkiniams Y 1 ,Y 2 ,...,Y n Ir Z 1 , Z 2 ,..., Z n. Ir, prisiminkite, dėl bet kokios leistinos transformacijos. Mes vadiname vidutines vertes, kurios atitinka suformuluotą sąlygą priimtina(atitinkama skalė). Remiantis matavimo teorija, analizuojant ekspertų nuomones ir kitus atitinkamoje skalėje išmatuotus duomenis, gali būti naudojamos tik priimtinos vidutinės vertės.

Naudojant monografijoje sukurtą matematinę teoriją, galima apibūdinti leistinų vidutinių verčių tipą pagrindinėse skalėse.

Vidutinės reikšmės eilės skalėje. Panagrinėkime, kaip apdorojami ekspertų nuomonės, išmatuotos eilės skale. Šis teiginys yra teisingas.

1 teorema. Iš visų Koši vidurkių tik variacijų eilučių nariai (eilės statistika) yra priimtini vidurkiai eilės skalėje.

Pirmą kartą straipsnyje gauta 1 teorema galioja su sąlyga, kad vidurkis f(X 1 , X 2 ,...,X n) yra ištisinė (virš kintamųjų aibės) ir simetrinė funkcija. Pastarasis reiškia, kad perstačius argumentus, funkcijos reikšmė f(X 1 , X 2 ,...,X n) nesikeičia. Ši sąlyga yra gana natūrali, nes mes randame vidutinę vertę kolekcijos (rinkiniai) skaičiai, o ne už sekos. Rinkinys nesikeičia priklausomai nuo to, kokia tvarka išvardijame jo elementus.

Visų pirma pagal 1 teoremą mediana gali būti naudojama kaip vidurkis duomenims, išmatuotiems eilės skalėje (jei imties dydis nelyginis). Jei tūris yra lygus, reikia naudoti vieną iš dviejų pagrindinių variacijų serijos terminų – kaip kartais vadinama, kairioji mediana arba dešinioji mediana. Galima naudoti ir madą – ji visada yra variacijų serijos narė. Galite naudoti imties kvartilius, mažiausią ir didžiausią, decilius ir kt. Bet jūs niekada negalite apskaičiuoti aritmetinio vidurkio, geometrinio vidurkio ir pan.

Vidurkiai pagal Kolmogorovą. Natūrali aksiomų sistema (reikalavimai vidutinėms reikšmėms) veda prie vadinamųjų asociatyvinių vidurkių. Jų bendrą išvaizdą 1930 m. rado A.N. Kolmogorovas. Dabar jie vadinami „Kolmogorovo vidurkiais“.

Dėl skaičių X 1 , X 2 ,...,X n Kolmogorovo vidurkis yra

G{(F(X 1) + F(X 2) +...+ F(X n))/n} ,

Kur F- griežtai monotoniška funkcija (t. y. griežtai didėjanti arba griežtai mažėjanti), G- funkcija atvirkštinė F. Tarp Kolmogorovo vidurkių yra daug gerai žinomų personažų. Taigi, jei F(x) = x, tada Kolmogorovo vidurkis yra aritmetinis vidurkis, jei F(x) = ln x, tada geometrinis vidurkis, jei F(x) = 1/x, tada harmoninis vidurkis, jei F(x) = x, tada vidutinis kvadratas ir kt. (paskutiniais trimis atvejais teigiamos reikšmės apskaičiuojamos vidurkiu).

Kolmogorovo vidurkis yra ypatingas Koši vidurkio atvejis. Kita vertus, tokie populiarūs vidurkiai kaip mediana ir režimas negali būti pateikiami kaip Kolmogorovo vidurkiai. Straipsnyje pirmą kartą įrodomi šie teiginiai.

2 teorema. Pagal intervalo skalę visų vidurkių pagal Kolmogorovą galioja tik aritmetinis vidurkis .

Taigi temperatūrų (Celsijaus), potencialių energijų ar taško koordinačių geometrinis vidurkis arba vidutinis kvadratas yra beprasmis. Aritmetinis vidurkis turi būti naudojamas kaip vidurkis. Taip pat galite naudoti medianą arba režimą.

3 teorema. Santykio skalėje iš visų Kolmogorovo vidurkių priimtini tik galios vidurkiai c ir geometrinis vidurkis.

Ar yra Kolmogorovo vidurkių, kurių negalima naudoti santykio skalėje? Žinoma turi. Pavyzdžiui, su F(x) = e 2 x .

1 pastaba. Geometrinis vidurkis yra galios reiškia riba .

Užrašas 2. 1 ir 2 teoremos galioja, jei tenkinamos tam tikros vidinio matematinio dėsningumo sąlygos. 1-3 teoremų įrodymai pateikti monografijoje. Perkėlimas į svertinių vidurkių atvejį pateiktas straipsnyje.

Panašiai kaip vidutinės reikšmės, galima tirti ir kitas statistines charakteristikas – sklaidos, ryšio, atstumo rodiklius ir pan. (žr., pvz.,). Nesunku parodyti, pavyzdžiui, kad koreliacijos koeficientas nesikeičia su jokia leistina transformacija intervalo skalėje, kaip ir dispersijų santykis. Skirtumo skalėje dispersija nekinta, santykio skalėje – variacijos koeficientas ir t.t. Straipsnyje aptariami tolesni vidutinių verčių rezultatai.

Pagal nagrinėjamą metodą pirmiausia reikia nustatyti, kokiomis skalėmis matuojami sociologiniai duomenys, o tada naudoti tik duomenų apdorojimo algoritmus, kurie yra nekintami šių skalių atžvilgiu.

Straipsnyje matavimo teorija vadinama „Stevenso apribojimais“, eilinė skalė – eilinė, santykio skalė – santykinė, nėra sąvokos „leistinų transformacijų grupė“ ir kt. Vartosime taikomojoje statistikoje nusistovėjusius terminus. Apskritai matavimo teorijos panaudojimo duomenų analizėje šalininkų pozicija aprašyta teisingai.

Yra gana daug publikacijų apie matavimo teoriją rusų kalba, parašytų griežtai kvalifikuotų autorių. Kadangi čia nesiekiame apžvelgti matavimo teorijos, skaitytojams remsimės ten esančiais kūriniais ir nuorodomis į literatūros šaltinius.
Pirmosios mintys apie straipsnio vertimą P.F. Velleman ir L. Wilkinson
Šis straipsnis parašytas įvairių publikacijų apžvalgos forma, pristatymas yra žodinis, griežtų apibrėžimų, formulių, lentelių, pavyzdžių beveik nėra. Todėl autoriams turime išsiaiškinti, ką jie norėjo pasakyti. Ne visada įmanoma tiksliai apibrėžti jų teiginius.

173 p. pabrėžiamos trys kritikos sritys:

1. Išvadų nekintamumo reikalavimas dėl leistinų matavimo skalių transformacijų „atrodo pavojingas duomenų analizei“.

2. Matavimo teorijos metodas yra „per griežtas, kad būtų taikomas tikriems duomenims“.

3. Šis metodas „dažnai veda prie duomenų pablogėjimo dėl transformacijos į rangus ir dėl to bereikalingą neparametrinių metodų naudojimą“.

Pradėkime bendrai išnagrinėdami šias tris kritikos eilutes.

1. Priešingai, nekintamumo reikalavimo atsisakymas yra pavojingas norint gauti pagrįstų išvadų. Ar galima remtis išvadomis, kurios keičiasi naudojant galiojančią masto transformaciją?

Žinoma, pradinės tiriamosios duomenų analizės metu galite juos „paleisti“ per visą programinės įrangos produkto apdorojimo metodų arsenalą – o jei pavyks pastebėti ką nors įdomaus? „Išvados“, gautos naudojant negriežtus metodus, turi būti patikrintos naudojant patikimas duomenų analizės procedūras.

Praktika dažnai verčia naudoti matavimo teorijos svarstymus. Taigi, kai mūsų tyrėjų komanda atliko Volga-Dnepr oro linijų skrydžių įgulų apklausas, paaiškėjo, kad pilotams lengviau pasakyti, kuris įvykis įvyksta dažniau, o kuris rečiau, nei įvertinti įvykių skaičių 1000 skrydžių. Pilotai nesiima vertinimų absoliučia skale (įvertina įvykių tikimybes), tuo tarpu užduotis lyginti įvykius pagal pasireiškimo dažnumą arba įvertinti jų atsiradimą sąlyginiais taškais (kokybinių charakteristikų reikšmėmis) nesukelia sunkumų. Taigi įvertinimai, gauti atlikus bandomąsias apklausas, yra matuojami eilės skalėmis.

2. Praktiniame darbe dažniausiai gana aišku, kokiomis skalėmis matuojami duomenys. Jei bandysite respondentams primesti neteisingą skalę, jų atsakymai bus savavališki, neatspindintys tikros nuomonės arba jie gali tiesiog atsisakyti atsakyti, kaip buvo anksčiau aprašytose Volga-Dnepr Airlines skrydžio įgulų apklausose.

Galima pripažinti, kad kai kuriais retais atvejais duomenų matavimo skalės tipo nustatymas reikalauja specialių tyrimų.

3. Jau tuo metu, kai pasirodė P.F. Velleman ir L. Wilkinson (1993), naudojant neparametrinius metodus, pavyko išspręsti visas tas duomenų analizės problemas, kurioms kai kuriuose darbuose tebenaudojami parametriniai metodai. Pagal šiuolaikinę taikomosios statistikos paradigmą, vietoj parametrinių metodų, būdingų pasenusiai XX amžiaus vidurio paradigmai, reikėtų naudoti neparametrinius metodus.

Remiantis šiuolaikinėmis pažiūromis, parametriniai metodai yra tikimybiniais statistiniais modeliais pagrįsti metodai, kuriuose atsitiktinių dydžių skirstiniai priklauso vienai ar kitai parametrinei šeimai – normaliųjų, lognormalių, gama skirstinių ar kitoms, įtrauktoms į keturių parametrų šeimą. XX amžiaus pradžioje jo pristatyta K. Pearsono šeima. Neparametriniai metodai yra pagrįsti savavališko tipo skirstiniais. „Konvertuoti į rangus“ nebūtina, kai naudojami neparametriniai metodai. Tai atitinka atvejį, kai duomenys matuojami eilės skalėje.

Kaip parodė daugybė tyrimų, beveik visi realių duomenų skirstiniai nepriklauso nė vienai iš žinomų parametrų šeimų. Baimė dėl neparametrinių metodų neturi racionalaus pagrindo, ją sukelia pasenusios XX amžiaus vidurio taikomosios statistikos paradigmos išankstiniai nusistatymai.

Nuo bendrų prieštaravimų analizės iki matavimo teorijos panaudojimo analizuojant sociologinius duomenis, pereikime prie konkrečių P.F. pateiktų pavyzdžių svarstymo. Velleman ir L. Wilkinson. Kad nepailgintume šio straipsnio, nekartosime pavyzdžių formuluočių, manydami, kad skaitytojai turi savo originalaus straipsnio vertimą.

Pabrėžkime keletą Viešpaties kritikos komponentų. Pirma, skalės tipo pasirinkimas gali būti susijęs su sprendžiama problema. Taigi įmonės sutarčių numeriai pirmiausia padeda atskirti šias sutartis (ir su jomis susijusius veiksmus), t.y. natūralu manyti, kad jie matuojami vardų skale. Tačiau šie skaičiai laikui bėgant didėja (atsižvelgiant į sutarčių sudarymo datas), todėl kai kuriose valdymo sprendimų priėmimo problemose natūralu, kad jie matuojami eilės skale. Antra, tvarkant eilinius duomenis naudojant algoritmus, kurie nėra eilės skalės invariantai, gali susidaryti įspūdis, kad daromos pagrįstos išvados. Lordas kalba apie Čebyševo nelygybės taikymą (galėjo būti naudojamas Cramerio-Welcho testas). Tačiau taikant tą pačią analizės procedūrą duomenims, kuriems taikoma kokia nors tinkama transformacija eilės skalėje, išvados bus visiškai priešingos. Norint nustatyti skirtumus tarp dviejų nepriklausomų mėginių, turėtų būti taikomi neparametriniai homogeniškumo testai, tokie kaip Wilcoxon testas.

Bakeris, Hardikas ir Petrinovičius, Borgatta ir Borshteinas nenori naudoti neparametrinių metodų, nėra jokio paaiškinimo. Vellemanas ir Wilkinsonas be reikalo kritikuoja juos už nenorą „įsitraukti į tvirtumo problemą“. Tvirti metodai, t.y. atsparūs nedideliems duomenų paskirstymo funkcijų nuokrypiams, neleidžia susidoroti su savavališkomis leistinomis transformacijomis. Jei pereitume nuo tvirtumo prie bendresnės sąvokų sistemos - prie bendros stabilumo schemos, tada paaiškėja, kad duomenų analizės metodai, atsparūs leistinoms mastelio transformacijoms, yra ranginiai metodai kaip ypatingas neparametrinių atvejis.

Gutmanas siūlo naudoti „praradimo funkciją, pasirinktą modelio kokybei patikrinti“. Iš tiesų, jei nuostolių funkcija yra pateikta, tada nereikia įtraukti matavimo teorijos. Problema yra šios funkcijos pasirinkimas ir protingas pasirinkimas. Per daugiau nei 40 konsultavimo metų duomenų analizės srityje nesutikau nė vieno tokio specialisto. Kiekvienas, kuris gali pasirinkti praradimo funkciją, yra jau ne praktikas, o kvalifikuotas matematinės statistikos srities specialistas.

Pasak Tukey, „kokios žinios nėra pagrįstos tam tikru apytiksliu įvertinimu“. Iš tiesų, atliekant pirminę tiriamąją analizę, specialistui išvadai suformuluoti dažnai pakanka vieno žvilgsnio į duomenis. Tačiau ir praktikai, ir teoretikai tvirtina, kad intuityvios išvados turi būti pagrįstos griežtu samprotavimu.
Diskusija apie statistiką ir masto tipus
Skyrius taip pavadintas prasideda žodžiais: „Statistikai atmetė metodų, pagrįstų leistinų transformacijų apribojimais, draudimus“. Tai visiškai klaidinga. Statistikai sutiko su šiuo draudimu (žr. diskusiją ). Tai ypač aišku dabar, praėjus 20 metų nuo straipsnio parašymo. Šiuo metu abejonių išlieka dalis tų, kurie nėra duomenų analizės srities profesionalai, kurie taip pat linkę priimti paprastus sprendimus ir nenori vargti studijuodami matavimų teoriją ir neparametrinę statistiką. Toks praktikų požiūris yra gana natūralus ir pagrįstas, bet nevaisingas. Šiuolaikinė taikomoji statistika nėra paprasta, jos įsisavinimas reikalauja pastangų ir laiko.

Tenka pripažinti, kad straipsnyje gausu kategoriškų, argumentais neparemtų ir duomenų analizės praktikai prieštaraujančių teiginių. 176 puslapyje rašoma: „Pagrindinis argumentas prieš skalės tipo statistikos receptą yra: tai neveikia! Taip tai veikia – tiek praktikoje, tiek kuriant teoriją (pradinėse šio straipsnio dalyse parodyta, kad matavimų teorija leido vidurkių teorijai suteikti pilną formą). 177 puslapyje teigiama, kad „patirtis rodo, kad draudžiamos statistikos taikymas duomenims leidžia pasiekti moksliškai reikšmingų rezultatų, kurie yra svarbūs priimant sprendimus ir vertingi tolesniems tyrimams“. Pavyzdžių nėra. Matyt, todėl, kad šis teiginys yra klaidingas.

Dažnai vartojami terminai be apibrėžimų. Buitiniam skaitytojui gali pritrenkti teiginys apie „pagrindinį matematikos ir gamtos skirtumą“ (p. 176). Mūsų šalyje pagal tradiciją ir Švietimo ministerijos bei Aukštosios atestacijos komisijos norminius dokumentus matematika yra vienas iš mokslų. Manome, kad statistiniai metodai ir duomenų analizė yra vienas ir tas pats. Štai kodėl mūsų naujausia knyga vadinasi „Duomenų analizės statistiniai metodai“. Žinoma, galima apibrėžti terminus, kad matematika nebūtų mokslas, o duomenų analizė skirtųsi nuo matematinės statistikos. Terminų aptarimas yra smagi veikla. Vien vienoje brošiūroje yra apie 200 termino „statistika“ apibrėžimų. Tačiau akivaizdu, kad terminų vartojimas be apibrėžimų, kaip daroma , gali tik suklaidinti skaitytoją.
Įvairių tipų duomenys
Negalima nesutikti su Vellemanu ir Wilkinsonu Esmė ta, kad duomenys ne visada yra skaičiai. Pavyzdžių elementais gali būti vektoriai, funkcijos, įvairaus tipo neskaitinio pobūdžio objektai – dvejetainiai ryšiai, aibės, neaiškios aibės, intervalai ir kt. Tai ypač pasakytina apie skaičiavimo rezultatus, pvz., trupmenas arba taškų rinkinį plokštumoje, gautą dėl daugiamačio mastelio. Atkreipkite dėmesį, kad kalbėdami apie matavimo teorijos taikymą duomenų analizei, šio straipsnio pradžioje kalbėjome apie išvadų, padarytų apdorojant skaičių rinkinius, invarianciją. Vadinasi, matavimo teorija naudojama ne visuose taikomosios statistikos skyriuose, o tik skaitinių dydžių statistinėje analizėje. Šios pastabos prireiks toliau analizuojant straipsnį.

Visada būtina atskirti tiriamąją statistinę analizę, kuria siekiama „intuityvios įžvalgos apie duomenų rinkinio modelius“, ir įrodomąją statistiką, pagrįstą griežtu samprotavimu. Tai yra tiriamoji analizė, apimanti duomenų transformavimo ir daugiamačio mastelio keitimo metodus. Tiriamojoje analizėje nebūtina laikytis matavimų teorijos reikalavimų, tačiau įrodomojoje statistikoje yra atvirkščiai.

Skyriuje „Gerų duomenų analizė nesiremia prielaidomis apie duomenų tipą“ Velleman ir Wilkinson teisingai nurodo tinkamo statistinio modelio pasirinkimo svarbą. Kitame skyriuje „Stevenso kategorijos neaprašo fiksuotų duomenų savybių“ mes iš tikrųjų kalbame apie tą patį: kai kuriose situacijose „skalės tipas priklauso nuo duomenų interpretacijos arba nuo papildomos informacijos prieinamumo. . Šis teiginys yra visiškai teisingas; skaičių rinkinys pats savaime neleidžia pagrįsti skalės tipo. Matavimo rezultatas 2911397 – kokia skalė? Jei tai yra skaičius iš apskaitos ataskaitos, tada santykių skalė (perėjimas iš vienos valiutos į kitą yra panaši transformacija). Jei šis numeris yra iš telefonų katalogo, telefono numeris matuojamas vardų skalėje. Šia tema kalbėjome anksčiau, analizuodami Viešpaties darbą. Taigi statistinio modelio pasirinkimas yra labai svarbus, jis lemia duomenų matavimo skalę.

Skyriuje „Stevenso kategorijų nepakanka duomenų skalėms apibūdinti“ aptariamos „daugiamatės skalės“. Kas tai yra, neaišku, nes nėra apibrėžimų. Tačiau 1 lentelėje pateiktas beveik praktinis pavyzdys yra gana aiškus. Kadangi penkerius metus dirbau gydymo įstaigose („Kremliaus ligoninėje“ ir SSRS medicinos mokslų akademijos Profesinių ligų ir darbo higienos tyrimo institute), atkreipiu dėmesį, kad paciento simptomų skaičius negali būti laikomas ligos sunkumo rodiklis, nes toks vertinimas daro prielaidą, kad visi simptomai yra lygūs ligos sunkumui. Medicinoje to nebūna.

Kas aptariama pastraipoje apie Andersono darbą, lieka neaišku, nes nėra vartojamų sąvokų apibrėžimų.
Tvirtumas, svarstyklės ir duomenų analizė
Skyriuje „Statistinių procedūrų negalima klasifikuoti pagal Stevenso kriterijus“ Vellemanas ir Wilkinsonas aptaria atvirkštinę problemą (terminologija), kurioje, atsižvelgiant į duomenų analizės procedūrą, reikia nustatyti, kokiais masteliais ta procedūra daro nekintamas išvadas. Iš tiesų, mes įrodėme, kad išvada apie eilės statistikos tiesinės funkcijos, apskaičiuotos iš dviejų imčių, reikšmių palyginimą, pateiktą pagal (5) formulę 185 p., yra nekintama eilės skalėje, jei skiriasi tik vienas svorio koeficientas. nuo 0 (taip pat žr. 1 teoremą straipsnio pradžioje), o intervalų skalėje (ir skalėse su siauresnėmis transformacijų grupėmis - santykiais, skirtumais, absoliučiai), jei bent du svoriniai koeficientai skiriasi nuo 0 (žr. ). Likusi šio straipsnio dalis negali būti aiškinama griežtai. Atkreipiame dėmesį tik į tai, kad svarstoma kitokia užduotis nei anksčiau – skaičiavimo procedūras susieti su matavimo skalėmis, o ne nustatyti šaltinio duomenų matavimo skalės tipą.

Skyriuje „Masto tipai nėra tikslios kategorijos“ dar kartą be įrodymų teigiama, kad „tikrieji duomenys neatitinka mastelių tipų reikalavimų“. Tuo pačiu teisingai pažymima, kad jei kyla abejonių, skalės „lygis“ turėtų būti sumažintas, pavyzdžiui, nuo intervalo iki eilės. Problemai, kurią Tukey nagrinėjo 1961 m., būtų naudinga intervalų duomenų statistika, sukurta nuo devintojo dešimtmečio pradžios.

Skyriuje „Skalės ir duomenų analizė“ aptariama tiriamosios statistinės analizės, kurioje galima nepaisyti skalių, kuriomis matuojami duomenys, ir duomenų analizės darant griežtas išvadas, neįsivaizduojama be kreipimosi, deriniu. į matavimo teoriją. Keista, kad Vellemanas ir Wilkinsonas „gera“ laiko tik tiriamąją analizę. Frazė: „Gera duomenų analizė retai vadovaujasi formalia hipotezės tikrinimo paradigma“ rodo jų nihilizmą matematinės statistikos atžvilgiu, kurio negalima pateisinti.

Skiltyje „Prasmingumas“ terminas, davęs skyriui pavadinimą, lieka neapibrėžtas. Kaip teisingai pažymi Vellemanas ir Wilkinsonas, pagal matavimo teoriją prasmingumas yra tai, kas išsaugoma esant leistinoms transformacijoms. Jiems nepatinka šis apibrėžimas, tačiau jie negali duoti kito, įsitraukdami į bendras diskusijas apie teisę klysti. Keista skaityti tai: „Jei mokslas apsiribotų pagrįstais sprendimais, jis negalėtų vystytis“. Matematika sėkmingai vystosi!

Skyrius „Duomenų tipų vaidmuo“ prasideda netikėtai – matavimo teorijos svarbos pripažinimu: „Būtų klaidinga manyti, kad duomenų tipai neturi reikšmės... Mastelio tipo sąvoka yra svarbi, o Stevensas terminologija (t. y. matavimo teorija – A.O.) dažnai gali būti patogi“. Tolesnės diskusijos vėl skiriamos teiginiui, kad, mūsų terminologijoje, skalės tipą lemia ne patys duomenys, o modelis, atitinkantis sprendžiamą problemą (žr. aukščiau, kaip interpretuoti skaičių 2911397 kaip matavimų rezultatą). santykio skalėje arba eilės skalėje, priklausomai nuo problemos formulavimo). Antroji idėja, su kuria taip pat jau buvo susidurta, yra tiriamosios analizės akcentavimas ir įrodymais pagrįstos statistikos vaidmens sumenkinimas.
Išvada
Straipsnio skyrius „Išvada“ parašyta subalansuotai, joje pateikti teiginiai paprastai yra teisingi. Kaip jau minėta, negalima daryti prielaidos, „kad skalės tipas yra savaime suprantamas ir nepriklauso nuo to, kokį klausimą tyrėjas kelia savo duomenims“. Praėjus 20 metų nuo straipsnio parašymo paaiškėjo, kad tyrėjas, uždavęs klausimą, turi aprašyti duomenų analizės modelį, dažniausiai tikimybinį-statistinį, įskaitant duomenų matavimo skalių tipo pasirinkimą, o po to, šio tyrimo metu. modelį, sukurkite problemos sprendimo metodą arba pasirinkite vieną iš jau turimų.

Visiškai tiesa, kad „statistinė programinė įranga, palengvinanti bet kokių duomenų analizę, taip pat leidžia atlikti neatsakingą analizę“. V. V. apie tai įspėjo. Nalimovas daugiau nei prieš 40 metų. Pirmiausia jis turėjo omenyje tendenciją atlikti skaičiavimus, nesusipažinus su naudojamų metodų esme.

Straipsnio analizė baigta.

Apibendrinant šio straipsnio rezultatus, būtina konstatuoti Vellemano ir Wilkinsono straipsnyje surinktų matavimo teorijos požiūrių ir kritinių pastabų apie ją palyginimo naudą. Diskusija leido išsiaiškinti keletą klausimų dėl taikomosios statistikos panaudojimo (duomenų analizės). Pirmiausia identifikuojamas sprendžiamos problemos vaidmuo ir duomenų modelis, naudojamas šių duomenų matavimo skalių tipams nustatyti, suskirstytos tiriamosios analizės ir įrodymais pagrįstos statistikos taikymo sritys. Pasitvirtino patarlės tiesa: „Tiesa gimsta ginče“.


LITERATŪRA
1. Orlovas A.I. Statistiniai metodai Rusijos sociologijoje (po trisdešimties metų) // Sociologija: metodika, metodai, matematiniai modeliai. 2005. Nr.20. P.32-53.

2. Orlovas A.I. Nauja taikomosios statistikos paradigma // Gamyklos laboratorija. 2012. 78 tomas Nr.1, I dalis P.87-93.

3. Orlovas A.I. Taikomoji statistika. Vadovėlis. - M.: Egzaminas, 2006. - 672 p.

4. Orlovas A.I. Organizacinis ir ekonominis modeliavimas: vadovėlis: per 3 val.1 dalis: Neskaitinė statistika. – M.: MSTU leidykla im. N.E. Baumanas. – 2009. – 541 p.

5. Velleman P.F., Wilkinson L. Vardinių, eilinių, intervalinių ir santykinių skalių tipologija klaidina // Sociologija: metodika, metodai, matematinis modeliavimas. 2011. Nr.33. P.166 – 193.

6. Tolstova Yu.N. Matavimai sociologijoje. - M.: Infra-M, 1998. - 352 p.

7. Orlovas A.I. Tvarumas socialiniuose ir ekonominiuose modeliuose. - M.: Nauka, 1979. - 296 p.

8. Orlovas A.I. Priimtini vidurkiai kai kuriose ekspertinių vertinimų ir kokybės rodiklių agregavimo problemose. // Daugiamatė statistinė analizė socialiniuose ir ekonominiuose tyrimuose. - M.: Nauka, 1974. P. 388-393.

9. Kolmogorovas A.N. Dėl vidurkio nustatymo // Izbr. darbai. Matematika ir mechanika. M.: Nauka, 1985. 136–138 p.

10. Orlovas A.I. Priimtinos transformacijos sprendžiant priemonių palyginimo problemą. Psi-nuolatinė statistika. // Daugiamatės statistinės analizės algoritmai ir jų taikymas. - M.: leidykla TsEMI AN SSRS, 1975. P.121-127.

11. Orlovas A.I. Ryšys tarp vidutinių verčių ir leistinų skalės transformacijų // Matematinės pastabos. 1981. T. 30. Nr. 4. 561–568 p.

12. Barsky B.V., Sokolovas M.V. Vidutinės vertės nekintamos leistinų matavimo skalės transformacijų atžvilgiu // Gamyklos laboratorija. 2006. 72 tomas Nr.1. P.59-66.

13. Orlovas A.I. Organizacinis ir ekonominis modeliavimas: vadovėlis: per 3 val.3 dalis. Statistiniai duomenų analizės metodai. - M.: MSTU leidykla im. N.E. Bauman, 2012. - 624 p.

14. Nikitina E.P., Freidlina V.D., Yarkho A.V. Sąvokos „statistika“ apibrėžimų rinkinys. – M.: MSU, 1972. – 46 p.

15. Nalimovas V.V. Apie matematikos mokymą eksperimentuotojams // Apie matematikos statistikos mokymą eksperimentuotojams. Tarpfakultetinės statistinių metodų laboratorijos preprintas Nr.17. – M.: Maskvos valstybinio universiteto leidykla. M.V. Lomonosovas, 1971. – P.5-39.

1Aleksandras Ivanovičius Orlovas, profesorius, ekonomikos mokslų daktaras, technikos mokslų daktaras, fizinių ir matematikos mokslų kandidatas, Maskvos valstybinio technikos universiteto Aukštųjų statistinių technologijų ir ekonometrijos instituto direktorius. N.E. Baumanas, MIPT profesorius, oro linijų bendrovės „Volga-Dnepr“ prezidento patarėjas, Rusijos statistinių metodų asociacijos prezidentas. El. paštas: prof- orlovas@ Paštas. ru .

Darbas buvo atliktas finansiškai remiant Rusijos Federacijos švietimo ir mokslo ministerijai pagal Rusijos Federacijos Vyriausybės dekretą Nr. 218.

Taikant tam tikrus statistinius metodus nustatoma, kokiai statistinei skalei priklauso gauta medžiaga. L.S. Stevensas pasiūlė išskirti keturias statistines skales:

1) vardų skalė (arba vardinė);

2) užsakymo skalė;

3) intervalų skalė;

4) santykių skalė.

Žinant tipines kiekvienos skalės ypatybes, nesunku nustatyti, kuriai iš jų statistiškai apdorota medžiaga priskirtina.

Vardų skalė. Ši skalė apima medžiagas, kuriose tiriami objektai skiriasi vienas nuo kito savo kokybe.

Apdorojant tokias medžiagas, nereikia šių objektų išdėstyti jokia tvarka pagal jų savybes. Iš esmės objektai gali būti išdėstyti bet kokia tvarka.

Štai pavyzdys: tiriama tarptautinės mokslinės konferencijos sudėtis. Dalyviai – prancūzai, anglai, danai, vokiečiai ir rusai. Ar nagrinėjant konferencijos sudėtį svarbi dalyvių išdėstymo tvarka? Galite juos išdėstyti abėcėlės tvarka, tai patogu, tačiau aišku, kad šiame išdėstyme nėra esminės reikšmės. Verčiant šią medžiagą į kitą kalbą (taigi ir į kitą abėcėlę), ši tvarka bus sutrikdyta. Nacionalines grupes galite organizuoti pagal dalyvių skaičių. Tačiau palyginę šią medžiagą su kitos konferencijos medžiaga, pastebime, kad ši tvarka vargu ar bus tokia pati. Objektai, priskirti pavadinimų skalei, gali būti išdėstyti bet kokia tvarka, atsižvelgiant į tyrimo tikslą.

Statistiškai apdorojant šios rūšies medžiagą, reikia atsižvelgti į kiekvieno objekto vienetų skaičių. Yra labai veiksmingi statistiniai metodai, leidžiantys iš šių skaitinių duomenų padaryti moksliškai reikšmingas išvadas (pavyzdžiui, chi kvadrato metodas).

Užsakymo skalė. Jei įvardijimo skalėje tiriamų objektų tvarka praktiškai nevaidina jokio vaidmens, tai eilės skalėje – tai aišku iš pavadinimo – būtent į šią seką nukreipiamas visas dėmesys.

Ši statistikos skalė apima tokią tyrimų medžiagą, kurioje nagrinėjami objektai, priklausantys vienai ar kelioms klasėms, tačiau skiriasi, kai jie lyginami vienas su kitu.„daugiau-mažiau“, „aukščiau-žemiau“ ir kt.

Lengviausias būdas parodyti tipines užsakymų skalės ypatybes – pažvelgti į paskelbtus bet kurių sporto varžybų rezultatus. Šiuose rezultatuose iš eilės išvardijami dalyviai, kurie atitinkamai užėmė pirmą, antrą, trečią ir kitą vietą. Tačiau šioje informacijoje apie varžybų rezultatus informacijos apie tikruosius sportininkų pasiekimus dažnai nėra arba ji nublanksta į antrą planą, o jų eilės vietos iškeliamos į pirmą planą.


Tarkime, šachmatininkas D. varžybose užėmė pirmąją vietą. Kokie jo pasiekimai? Pasirodo, jis pelnė 12 taškų. Šachmatininkas E. užėmė antrąją vietą. Jo pasiekimas – 10 taškų. Trečioji vieta atiteko Ž. su aštuoniais taškais, ketvirta – Z. su šešiais taškais ir t.t. Pranešimuose apie varžybas šachmatininkus skiriant pasiekimų skirtumas nublanksta į antrą planą, o jų eilės vietos lieka pirmame plane. Tai, kad eilinei vietai suteikiama pagrindinė reikšmė, turi savo reikšmę. Tiesą sakant, mūsų pavyzdyje Z. surinko šešis, o D. – 12 taškų. Tai yra absoliutus jų pasiekimas – laimėti statymai. Jei pabandytume šį pasiekimų skirtumą aiškinti grynai aritmetiškai, turėtume pripažinti, kad Z. žaidžia dvigubai blogiau nei D. Su tuo negalime sutikti. Varžybų aplinkybės ne visada yra paprastos, kaip ir tai, kaip tas ar kitas dalyvis jas pravedė, ne visada paprasta. Todėl, susilaikydami nuo aritmetinio suabsoliutinimo, apsiriboja tuo, ką nustato: šachmatininkas Z. nuo pirmąją vietą užėmusio D. atsilieka trimis eilės vietomis.

Intervalų skalė. Tai apima medžiagas, kuriose pateikiamas kiekybinis tiriamo objekto įvertinimas fiksuotais vienetais.

Grįžkime prie eksperimentų, kuriuos psichologas atliko su Sasha. Eksperimentuose buvo atsižvelgta į tai, kiek taškų pats Sasha ir kiekvienas jo bendraamžis galėjo įdėti, dirbdami maksimaliu jiems prieinamu greičiu. Vertinimo vienetai eksperimentuose buvo taškų skaičius. Juos suskaičiavęs tyrėjas gavo absoliutų taškų skaičių, kurį, kaip paaiškėjo, buvo galima skirti kiekvienam eksperimentų dalyviui per skirtą laiką. Pagrindinis sunkumas priskiriant medžiagas intervalų skalei yra tas, kad reikia turėti tokį vienetą, kuris būtų identiškas jam pačiam visiems kartotiniams matavimams, t.y. tas pats ir nepakitęs. Pavyzdyje su šachmatininkais (tvarkos skalė) tokio vieneto nėra.

Tiesą sakant, atsižvelgiama į kiekvieno konkurso dalyvio laimėtų žaidimų skaičių. Tačiau akivaizdu, kad žaidimai toli gražu nėra identiški, gali būti, kad varžybų dalyvis, kuris finišavo ketvirtas - laimėjo šešias partijas - laimėjo sunkiausią partiją prieš patį lyderį! Tačiau galutiniuose rezultatuose daroma prielaida, kad visi laimėti žaidimai yra vienodi. Tiesą sakant, šis neegzistuoja. Todėl dirbant su tokiomis medžiagomis tikslinga jas vertinti pagal užsakymo skalės, o ne intervalų skalės reikalavimus. Medžiagos, kurios atitinka intervalų skalę, turi turėti matavimo vienetą.

Santykių skalė.Ši skalė apima medžiagas, kuriose atsižvelgiama ne tik į fiksuotų vienetų skaičių, kaip ir intervalo skalėje, bet ir į gautų bendrų rezultatų santykį vienas su kitu. Norėdami dirbti su tokiais santykiais, turite turėti absoliutų tašką, nuo kurio galėtumėte skaičiuoti. Studijuojant psichologinius dalykus ši skalė praktiškai netaikoma.

Kiekvienas objekto matavimas atliekamas tam tikru mastu. To paties stebėjimo vektoriaus skirtingos koordinatės gali būti išreikštos skirtingomis mastelėmis. Taigi § 5.1 pateikiamas stebėjimų vektoriaus pavyzdys (5.1 lentelė), kuriame pirmosios koordinatės yra sutartinių ženklų pobūdžio (šeimos socialinė priklausomybė, šeimos galvos lytis ir profesija, gyvenimo sąlygos), o likusi dalis išreiškiama skaičiais (šeimos narių skaičius, vaikų skaičius, vidutinės metinės pajamos ir kt.). Šių svarstyklių savybės labai skiriasi viena nuo kitos. Taigi apie šeimos galvos lytį galime pasakyti tik tiek, kad jis yra vyras arba moteris ir kad vyriškoji lytis skiriasi nuo moteriškos lyties; apie gyvenimo sąlygas – kad jos vienodos arba skirtingos ir kad kai kuriais atvejais vienos gyvenimo sąlygos yra geresnės už kitas; apie išlaidas galima teigti, kad vienos šeimos išlaidos maistui yra mažesnės, lygios arba didesnės nei kitos, galite įvertinti šeimų išlaidų skirtumą ir apskaičiuoti, kiek kartų vienos šeimos išlaidos skiriasi nuo išlaidų kito.

Žemiau aprašome pagrindinius skalių tipus ir matematinius metodus, skirtus skirtingomis mastelėmis išreikštiems duomenims suvienodinti, kurie paprastai yra prieš tai, kai naudojami daugiamatės analizės metodai.

10.2.1. Nominali skalė.

Ši skalė naudojama tik priskiriant individą ar objektą į tam tikrą klasę. Jei galimos klasės ir objekto priskyrimo joms taisyklės yra aprašytos iš anksto, tada jose kalbama apie suskirstytą skalę, jei ne, tai apie nekategorizuotą. Suskirstytos į kategorijas skalės pavyzdys yra lytis. Tyrime asmeniui priskiriama viena iš dviejų reikšmių: raidė M arba F, specialus ženklas arba skaičius 1 arba 2. Iš esmės galima būtų priskirti ir kitokias raides ir skaičius, tik svarbu, kad vienas su- išlaikomas vienas kodų atitikimas. Norint įvesti suskirstytus duomenis, patogu naudoti „meniu“, t. y. galimų kategorijų sąrašą su jų kodais. Nekategorizuotų vardinių kintamųjų pavyzdžiai yra vardas, pavardė ir gimimo vieta.

Kitas svarbus nekategorizuotų vardinių duomenų šaltinis yra nurodytas 5.3 punkte. Taip yra tada, kai stebima objektų pora, o kintamasis tik nurodo, ar objektai priklauso tai pačiai klasei, ar ne, bet nenurodo, kurioms klasėms jie priklauso.

Paskutinė aplinkybė neturėtų būti vertinama kaip kuriozas. Žinoma, jei klasės yra iš anksto nustatytos ir nesunku kiekvieną objektą priskirti tam tikrai klasei, tai reikėtų tai padaryti ir įrašyti, kuriai klasei objektas priklauso. Bet kartais klasės nėra aprašomos iš anksto, sukurti pilną jų klasifikaciją yra būtent darbo tikslas, o kartu galima įvertinti, ar objektai priklauso vienai klasei. Pavyzdžiui, galima kalbėti apie „artimą“, „panašią“ dviejų pacientų ligos eigą, nors visi ligos eigos variantai nėra aprašyti. Be to, empiriškai panašių ligos eigos variantų nustatymas gali būti atskaitos taškas nustatant ir apibūdinant visus galimus patologinio proceso vystymosi variantus. Tas pats pasakytina apie socialinių ir ekonominių grupių identifikavimą ir kt.

Tas pats kintamasis gali veikti skirtingais pajėgumais, priklausomai nuo naudojimo tikslo. Taigi, pavyzdžiui, nekategorizuotas vardinis kintamasis – programos pavadinimas – skirtas tik programai individualizuoti ir, jei programų mažai, jį galima rasti tiesiogiai peržiūrint programų sąrašą. Tuo pačiu metu, jei programų pavadinimai sąraše yra kažkaip išdėstyti (pavyzdžiui, raidžių ir skaičių tvarka), tada programos pavadinime kaip paieškos paveikslėlyje yra eilės reikšmės elementų. Dėl kiekvienų dviejų pavadinimų galime pasakyti, kad jie yra vienodi, arba kad vienas iš jų yra prieš kitą pagal priimtą tvarką. Pasikeitus užsakymo būdui, pasikeičia ir šis santykis.

Aritmetinės operacijos su dydžiais, išmatuotais vardine skale, yra beprasmiai. Todėl tiek mediana, tiek aritmetinis vidurkis negali būti naudojami kaip reikšmingi centrinės tendencijos matai. Aktualesnė statistika čia yra mada.

10.2.2. Eilinė (eilės) skalė.

Be objektų klasifikavimo į tam tikrą klasę funkcijos, ši skalė taip pat išdėsto klases pagal tam tikros savybės išraiškos laipsnį. Kiekvienai klasei priskiriamas atskiras simbolis, kad iš anksto nustatyta simbolių tvarka atitiktų klasių tvarką. Taigi, jei klasėms priskiriamos skaitinės reikšmės, tai klasės bus rikiuojamos pagal skaitinę seką; jei raidės, tai klasės bus rikiuojamos abėcėlės tvarka, o jei žodžiai, tai klasės bus rikiuojamos pagal žodžių reikšmes.

Pavyzdžiui, § 5.3 pateikiamas eilės skalės pavyzdys būsto sąlygų kokybei apibūdinti su keturiomis gradacijomis (klasėmis): „bloga“, „patenkinama“, „gera“, „labai gera“. Natūralu, kad šios klasės gali būti sunumeruotos skaičiais 1,2,3,4 arba 4,3,2,1 arba raidėmis a, b, c, d ir kt.

Kiti gerai žinomi eilinių skalių pavyzdžiai: medicinoje - hipertenzijos stadijų skalė pagal Myasnikovas, širdies nepakankamumo laipsnių skalė pagal Strazhesko-Vasilenko-Lang, koronarinio nepakankamumo sunkumo skalė pagal Fogelsoną; mineralogijoje – Moso skalė (talkas – 1, gipsas – 2, kalcitas – 3, fluoritas – 4, apatitas – 5, ortoklazas – 6, kvarcas – 7, topazas – 8, korundas – 9, deimantas – 10), pagal. kurie mineralai klasifikuojami pagal kietumo kriterijų; geografijoje - Beaufort vėjo skalė („ramus“, „lengvas vėjas“, „vidutinis vėjas“ ir kt.).

Eilės skalės struktūros nesunaikina jokia viena su viena kodo transformacija, kuri išsaugo tvarką. Kaip ir vardinės skalės atveju, aritmetiniai veiksmai neišsaugo savo reikšmės transformuojant eilės skales, taip ir patartina jų nenaudoti. Nesunku parodyti, kad jei pasikliaujame tik svarstyklių savybėmis ir neįtraukiame papildomų svarstymų, nesusijusių su svarstyklėmis, tada vienintelė leistina statistika naudojant eilės skales yra variacijų eilutės nariai.

10.2.3. Kiekybinės svarstyklės.

Skalė, kurioje galima atspindėti, kiek vienas objektas skiriasi nuo kito tam tikros savybės išraiškos laipsniu, vadinama intervalu. Norint apibrėžti intervalo skalę, reikia apibrėžti objektus, atitinkančius pradinį tašką ir matavimo vienetą. Ir tada, matuojant, kiekvienam objektui priskirkite skaičių, rodantį, kiek matavimo vienetų šis objektas skiriasi nuo objekto, paimto kaip pradinį tašką. Paprasčiausias intervalo skalės pavyzdys yra temperatūra Celsijaus laipsniais, kur 0° yra pradžios taškas, o 1° yra matavimo vienetas.

Atliekant tiesines formos transformacijas intervalo skalės struktūra nesikeičia Tokios transformacijos rezultatas – pradžios taškas pasislenka b vienetais ir matavimo vienetas padauginamas iš a.

Pavyzdžiui, konvertuodami , kur yra temperatūra, galite pakeisti temperatūrą Farenheito laipsniais.

Jei intervalo skalės pradžia yra absoliutus nulinis taškas, tada skalėje tampa įmanoma atspindėti, kiek kartų vienas matavimas skiriasi nuo kito. Atitinkama skalė vadinama santykio skale. Santykio skalė leidžia transformuoti formą. Dauguma fizikoje naudojamų skalių yra intervalinės (temperatūra, potenciali energija) arba santykio skalės (laikas, masė, krūvis, atstumas).

Kadangi kiekybinės skalės leidžia atlikti aritmetines transformacijas, aritmetinis vidurkis gali būti naudojamas apibūdinti kaupiamą duomenų grupavimo tendenciją.

10.2.4. Vieningas įvairių tipų duomenų pateikimas.

Kiekvienas skalės tipas turi savo statistinę techniką. Taigi, kintamiesiems, išmatuotiems vardine skale, galite naudoti -kriterijų polinominiams skirstiniams, -kriterijų, skirtus patikrinti, ar nenumatytų atvejų lentelėse nėra asociacijų, ir hipotezių apie tikimybę binominiame skirstinyje tikrinimo kriterijus. Eilės skalė atitinka metodus, pagrįstus rangų naudojimu (rangų koreliacija, neparametriniai tipo hipotezių tikrinimo testai) ir kt.). Naudojant intervalų skalę, galima naudoti visą statistinių metodų arsenalą.

Be to, buvo sukurtos statistinės procedūros atvejams, kai stebimi vektoriai, kurių vienos koordinatės matuojamos vienoje skalėje, kitos – kitoje. Tipiškas pavyzdys yra įprastinė dispersijos analizė (žr. § 3.5), kai faktoriai matuojami vardine skale, o jų derinius atitinkantys atsakai – intervalų skalėje.

Tačiau daugelis statistinių metodų, ypač šiuolaikiniai daugiamatės analizės metodai, daro prielaidą, kad duomenys matuojami panašiomis skalėmis. Kad šiuos metodus būtų galima taikyti bendram heterogeninių duomenų atveju, buvo pasiūlytos įvairios duomenų suvienodinimo technikos. Susipažinkime su svarbiausiais iš jų.

Sumažinimas į dvejetainius kintamuosius. Šis metodas pagrįstas tuo, kad vietoj kiekvieno pradinio atsitiktinio dydžio įvedama atsitiktinių dydžių serija, kuri turi tik dvi reikšmes: 0 ir 1.

Vardinei vertei, turinčiai k gradacijų, įvedamos k vertės taip, kad kada kada

Ta pati technika kartais naudojama redukuojant atsitiktinį dydį, išmatuotą eilės skalėje, į dvejetainius kintamuosius. Tačiau kai kuriais atvejais yra patogu pabrėžti ne įvykį, o įvykį.Norėdami palyginti šių dviejų metodų santykinius privalumus, apsvarstykite šią modelio problemą. Leisti būti atsitiktinis dydis tolygiai paskirstytas segmente, tegul būti mažas skaičius;

Funkcija akivaizdžiai modeliuoja pirmąjį būdą pereiti prie dvejetainių kintamųjų, o funkcija modeliuoja antrąjį. Atlikę paprastus skaičiavimus gauname:

Pagrindinis aprašytos technikos trūkumas yra daugybės naujų kintamųjų įvedimas ir dalinis duomenyse esančios informacijos praradimas tiek dėl kvantavimo, tiek dėl dirbtinio naudojamos skalės lygio sumažinimo.

Vardinių ir eilinių kintamųjų skaitmeninimas. Šis metodas yra visiškai priešingas ką tik aprašytam – jame visi kintamieji pakeliami, pakeliami iki kiekybinio lygio, priskiriant jiems skaitinių reikšmių gradacijas. Kartais priskirtos reikšmės vadinamos etiketėmis.

Etikečių pasirinkimas labai priklauso nuo to, kokiu tikslu atliekamas skaitmeninimas. Taigi, jei tiriamas dviejų vardinių požymių ryšio dydis, tada etiketes galima pasirinkti iš sąlygos maksimizuoti koreliacijos koeficientą tarp jų , . Jei kalbame apie stebėjimų priskyrimą vienai iš iš anksto nustatytų klasių (diskriminacinė analizė), tada etikečių pasirinkimas gali būti siejamas su sąlyga, kad būtų maksimaliai padidintas normalizuotas atstumas daugiamatėje mėginio erdvėje tarp tiriamų populiacijų centrų (Mahalanobis atstumai). . Kartais ši užduotis supaprastinama ir etiketėms priskiriamos koordinatės pagal koordinates, kad būtų maksimaliai padidintas tik normalizuotas atstumas tarp tam tikros koordinatės vidutinių verčių. Statistinį palyginimą, naudojant vieną konkrečią globalizacijos ir koordinatės požiūrio skaitmeninimo metodų veiksmingumo diskriminacinėje analizėje problemos pavyzdį, galima rasti.

Pateiktos skaitmeninimo technikos, kai etiketės parenkamos iš tinkamai parinktos funkcijos maksimizavimo sąlygos, atitinka 1.2 punkte nurodytą kraštutinį požiūrį į pagrindinių matematinės statistikos problemų formulavimą.

Apskritai kokybinių kintamųjų skaitmeninimas yra sudėtinga užduotis tiek skaičiavimo, tiek grynai statistiniu požiūriu. Darbuose aptariami tam tikri šios problemos aspektai.