У статистичних дослідженнях використовують різноманітні типи ознак, що характеризують стан економічного об'єкта. Ознаки можуть мати різний вигляд залежно від шкали виміру, що у подальшому позначається вибір методів статистичного аналізу.

Залежно від шкали вимірювання розрізняють кількісні (числові) та категоріальні (нечислові, якісні) дані (див. рис. 3.1).

Кількісні (числові) дані - це показники, що приймають числові значення, які виходять шляхом деяких вимірів чи підрахунків.

З точки зору шкал вимірювань, кількісні дані вважають виміряними в інтервальній шкалі, яка застосовується для відображення різниці між характеристиками елементів. Інтервальна (кількісна) шкала показує, наскільки одне значення більше за інше в прийнятих одиницях вимірювання (наприклад, шкала температур, часу, кількості об'єктів). Інтервальна шкала може мати довільні початок відліку та масштаб. Безліч допустимих перетворень цієї шкали становлять усі лінійні перетворення. Основна властивість шкали – збереження відношення довжин інтервалів. Приватними випадками шкали інтервалів є шкала відносин (нульовий початок відліку) і шкала різниць (довільний початок відліку та одиничний масштаб), а також абсолютна шкала (нульовий початок відліку та одиничний масштаб відліку). Кількісні шкали допускають всі арифметичні дії над результатами виміру (наприклад, вести, залишки банківського рахунку, кількість працівників фірмі).

Якщо дані отримані шляхом вимірювань і можуть приймати будь-які значення з деякого проміжку або всієї числової осі, їх називають безперервними.Якщо дані утворюють лічильна множина і приймають лише деякі ізольовані значення на числовій осі, між якими значень бути не може, то такі ознаки називають дискретними.

Приклади кількісних дискретних даних

Число викликів «швидкої допомоги», які надходять до лікарень м. Москви щодня.
Кількість страхових компаній у Російській Федерації, які мають ліцензії.
Число страхових випадків, що настали у портфелі договорів страхування автокаско страхової компанії протягом року.
Число біженців та вимушених переселенців, офіційно зареєстрованих Федеральною міграційною службою за 2011 р.

Джерело: URL: http://rating.rbc.ru/article.shtml92008/09/30/32143066.

Дані представлені у табличній формі, у вигляді лінійного графіка та стовпчикової діаграми.

Дві змінні – «кількість автомобілів у місті» та «населення міста» – дискретні кількісні. Для наочності на графіку представлена змінна, розрахована як їхнє відношення - кількість автомобілів на тисячу мешканців.

Приклади кількісних безперервних даних

Динаміка облікових цін на золото у Росії за останні 20 років.
Зростання, вага, тиск крові та інші вимірювані показники людини.
Урожайність сільськогосподарських культур фермерських господарств Російської Федерації.
Надої молока у тваринницьких господарствах Центрального федерального округу.
Дальність польоту снаряда, що випускається зі зброї.

Джерело: URL: http://rating.rbc.ru/articles/201 l/ll/09/33470757_tbl.shtml?2011/ 11/08/33470320.

Для представлення даних щодо безперервної кількісної змінної «Чисті активи» використано табличну форму та стовпцеву діаграму.

Іншу групу, що істотно відрізняється від кількісних даних, становлять нечислові - категоріальніабо якіснідані. У цьому випадку об'єкт може належати лише до однієї з багатьох категорій (класів). Особливо це має місце під час створення та обробці анкет, опитувальників, рейтингів тощо. Навіть якщо позначити ці категорії числами (наприклад, перекодувати: 0 – жіноча, 1 – чоловіча стать), то з такими даними все одно не можна працювати як з числовими, а лише як з категоріальними.

Залежно від цього, чи можна ці категорії упорядковувати, розрізняють ознаки, виміряні у номінальної чи порядкової шкалах. Відповідно, дані поділяють на номінальніі порядкові.

Шкала найменувань (номінальнаабо класифікаційна шкала).Дані за цією шкалою визначаються в термінах категорій, які не можна змістовно впорядкувати (професія; регіон країни; місто; номер студентської групи; банк, у якому є вклад). Номінальна шкалавикористовується для опису належності елементів до певних класів. Всім елементам одного й того ж класу присвоюється те саме текстове значення чи число, а елементам різних класів - різні значення чи числа. Допустима будь-яка заміна чисел для позначення класів, аби це було взаємно однозначне перетворення, і кожен клас отримав би своє число. Ця обставина визначає безліч допустимих перетворень номінальної шкали як безліч всіх взаємооднозначних функцій. Немає підстав вважати, що одна категорія краща (або гірша), ніж інша, тому при обробці таких даних застосовуються тільки операції порівняння: «рівно» і «не дорівнює».

Місто Російської Федерації (Владивосток, Сургут, Тюмень та ін.).
Група крові людини (О, А, В, АВ).
Сімейний стан (холост, одружений, розлучений, у цивільному шлюбі).
Банк Росії (Сбербанк Росії, ВТБ, Газпромбанк тощо).
Федеральні округи Росії (Центральний, Далекосхідний і т.д.).

Приклад 3.12

Дані номінальної категоріальної змінної «колір очей» представлені в табличній формі і у вигляді кругової діаграми (Piechart).

Інший тип категоріальних змінних - порядкові (ординальні) - відрізняються тим, що дані вимірюються у порядковій шкалі. Порядкові шкаливикористовуються для впорядкування елементів за однією або декількома ознаками. Вони дозволяють встановити, що один елемент краще, важливіше, краще іншого або рівноцінний іншому. Порядкова шкала відображає лише порядок прямування елементів і не дає можливості сказати, на скільки або в скільки разів один елемент кращий за інший. Іншими словами, у цій шкалі не можна визначити міру ступеня переваги. Для порівняння таких даних допускаються не тільки операції «рівно» і «не одно», а й «більше» - «менше» (без визначення скільки).

Відповіді питання анкети, що містить такі варіанти відповідей: так; більше так, аніж ні; більше ні, ніж так; ні.
Оцінки, отримані студентами на іспиті (відмінно, добре, задовільно, незадовільно).
Посада, яку займає співробітник у науковій лабораторії (молодший науковий співробітник, науковий співробітник, старший науковий співробітник тощо);
Військові звання Російської армії (лейтенант, капітан, майор, полковник тощо.).

Л (високий), У(задовільний), В+(достатній), В++(прийнятний),

З(незадовільний), D(банкрутство), Е(відкликання ліцензії або ліквідація))

Одна з проблем, що найчастіше зустрічаються при плануванні опитування та підготовці інструментарію для нього, полягає в тому, як слід приписувати єдине репрезентативне значення або оцінку (score) деякому складному відношенню або поведінці. Як приклад, розглянемо, як можна було б виміряти упередженість населення проти студентів коледжів. Така упередженість може виявлятися в різних формах залежно від того, на яких ознаках студентів зосереджено увагу конкретного індивіда (респондента). Так, деякі люди судять про студентів по одязі, інші – за манерами, треті – за поведінкою у повсякденному житті, за соціально-економічним статусом і навіть за рівнем особистої гігієни. В інших стереотипна думка могла скластися на підставі лише однієї-двох зустрічей (приємних чи ні) з якимись конкретними студентами; а хтось, можливо, взагалі навряд чи може відрізнити студента від інших людей. Елементи судження можуть сильно варіювати за змістом, спрямованістю, ступенем оцінки, але кожен із них є – принаймні потенційно – компонент ширшого поняття «упередженість».

Якщо необхідно врахувати всі ці моменти, то нам треба підібрати такий інструмент, який зуміє виявляти та вимірювати якнайбільше подібних складових елементів понять і одночасно буде досить точний, щоб дозволяти осмисленим чином визначати ступінь прояву загального поняття в одиничному спостереженні. Іншими словами, необхідний такий засіб, який би вловлював і відображав поняття, подібне до поняття «упередженість», у всіх деталях, а крім того, показувало б нам, скільки (яка частка) цього поняття міститься в тому чи іншому випадку чи відповіді респондента. Один із таких засобів називається шкалюванням.

Шкалювання – це процедура об'єднання низки щодо вузьких показників (наприклад, це пункти опитування, що стосуються окремих зазначених респондентами ознак студентів) в єдиний сумарний захід, який приймається за відображення ширшого основного поняття (у нашому випадку – упередженості), частиною якого є кожна окрема ознака . Так, можна було б виміряти ставлення респондента до різних видів поведінки студентів (наприклад, до того, скільки вони вживають алкогольних напоїв, або до того, наскільки галасливі їхні вечірки) або до манер студентів (до того, наскільки вони чванливі, самовпевнені або неуважні до іншим людям), але жодна з цих ознак окремо ми не могли б прийняти за повноцінне відображення такого широкого поняття, як упередженість. Нам скоріше слід якимось чином звести всі ці заходи воєдино, щоб мати можливість робити висновки про більш загальну точку зору, яку кожна з них у чомусь доповнює та відображає. Більш того, нам потрібно вирішити це завдання так, щоб можна було порівнювати кількість упередженості (або будь-якого іншого поняття, що вимірюється нами), що міститься у відповіді одного респондента, з кількістю її, що міститься у відповіді іншого респондента, і в кінцевому підсумку судити про те, хто з респондентів упереджено більше.

Уніфікуючий захід, що відображає певне основне поняття, називається шкалою. Приватне значення ступеня прояви у кожному даному випадку основного поняття називається шкільною оцінкою. Шкалювання, чи побудова шкали, – це процедура, з допомогою якої дослідник формує шкалу і приписує окремим випадкам оцінки у цій шкалі.

Шкалювання – метод моделювання реальних процесів за допомогою шкал.

Шкалювання - метод присвоєння числових значень окремим атрибутам певної системи.

Шкалювання дозволяє розбити опис складного процесу опис параметрів за окремими шкалами. В результаті у застосуванні до економічних завдань, наприклад, можна отримати уявлення про сферу інтересів споживача, дослідити важливість кожної шкали для нього.

Шкала (лат. scala - сходи) - зіставлення результатів вимірювання будь-якої величини і точок числової прямої.

Шкала - це безліч позначень, відносини між якими відбивають відносини між об'єктами емпіричної системи. Шкалою можна назвати результати вимірювання, отримані у дослідженні, а також інструмент вимірювання (тобто систему запитань), опитувальник, тест).

1.2 Види шкал та типи шкалювання

Шкали поділяються на кшталт, відповідно до тим, які відносини вони відбивають. Крім того, кожній шкалі відповідають допустимі для цієї шкали математичні перетворення. Типи шкал мають ієрархічну впорядкованість за складністю. У психометрії, економетриці, прикладній статистиці прийнято наступну класифікацію шкал, запропоновану в 1946 році Стенлі Смітом Стівенсом:

– шкала найменувань (номінальна) – найпростіша зі шкал. Числа використовуються для розрізнення об'єктів. Відображає ті відносини, за допомогою яких об'єкти групуються в окремі класи, що не перетинаються. Номер класу не відбиває його кількісного змісту. Прикладом шкали такого роду може бути класифікація піддослідних на чоловіків і жінок, нумерація гравців спортивних команд та ін.

- Порядкова шкала - відображення відносин порядку. Суб'єкти у цій шкалі ранжировані. Для цієї шкали допустимо монотонне перетворення. Така шкала груба, тому що не враховує різниці між суб'єктами шкали. Приклад такої шкали: бальні оцінки успішності (незадовільно, задовільно, добре, добре), шкала Мооса;

- інтервальна шкала - крім відносин зазначених для шкал найменування та порядку, відображає відношення відстані (різниці) між об'єктами. Різниці у всіх точках цієї шкали рівні. Для неї допустимим є лінійне перетворення. Це дозволяє приводити результати тестування до загальних шкал і здійснювати, в такий спосіб порівняння показників. приклад: шкала Цельсія.

– шкала відносин – на відміну від шкали інтервалів може відбивати те, скільки один показник більше іншого. Шкала відносин має нульову точку, яка характеризує відсутність вимірюваної якості. Ця шкала припускає перетворення подібності (множення на константу). Визначення нульової точки — складне завдання психологічних досліджень, накладає обмеження використання цієї шкали. За допомогою таких шкал можуть бути виміряні маса, довжина, сила, вартість (ціна). Приклад: шкала Кельвіна (температур, відрахованих від абсолютного нуля, з обраною за згодою фахівців одиницею виміру – градус Цельсія).

Шкала різниць – початок відліку довільно, одиниця виміру задана. Допустимі перетворення - зрушення. Приклад: час.

Абсолютна шкала – в ній присутня додаткова ознака – природна та однозначна присутність одиниці виміру. Ця шкала має єдину нульову точку. Приклад: кількість людей аудиторії.

З питанням про тип шкали безпосередньо пов'язана проблема адекватності методів математичної обробки результатів виміру. Загалом адекватними є статистики, які інваріантні щодо допустимих перетворень використовуваної шкали вимірів.

Мал. 1. Класифікація методів шкалювання

Використовувані в соціологічних дослідженнях методи шкалювання умовно можна поділити на порівняльні та незрівнянні.

Порівняльні шкали (comparative scales) припускають пряме порівняння об'єктів, що розглядаються. Наприклад, респондентів запитують, чи воліють вони Соке або Pepsi. Дані порівняльних шкал вважаються відносними і мають властивості лише порядкових та рангових величин. Тому порівняльне шкалювання також називають неметричним. Як показано на рис. 1, порівняльні шкали включають попарне порівняння, порядкове ранжування, шкали постійної суми, Q-copy та інші операції.

Порівняльні шкали (comparative scales) – одне із двох методів шкалирования, полягає у прямому порівнянні об'єктів, що розглядаються.

Основна перевага порівняльного шкалювання полягає в можливості розпізнавання незначних відмінностей між об'єктами, що розглядаються. У порівнянні двох об'єктів респондентам доводиться обирати між ними. Крім того, респонденти виконують завдання виходячи із заданих балів переваги. Завдяки цьому порівняльні шкали легко сприймати та застосовувати. Інша перевага цих шкал - порівняно менша кількість теоретичних припущень, що використовуються, а також усунення впливу гало-ефекту, або ефекту перенесення, коли через сильну перевагу одного товару спотворюється порівняльна оцінка інших. Основний недолік порівняльних шкал - їх порядкова природа та обмеження аналізу рамками певної кількості об'єктів, що розглядаються. Наприклад, для порівняння RC Cola із Соке та Pepsi слід проводити нове дослідження. Ці недоліки значною мірою усуваються під час використання незрівнянних методів шкалування.

При використанні незрівнянних шкал (noncomparative scales), також званих монадичними або метричними, кожен об'єкт початкової аналізованої сукупності оцінюється незалежно від інших. Отримані дані вважаються виміряними в інтервальній або відносній шкалі.

Незрівняльні шкали (noncomparative scales) – один із двох методів шкалювання, що полягає у самостійній оцінці кожного об'єкта.

Наприклад, респондентів можуть попросити оцінити Соке за шкалою переваг від 1 до 6 (1 – абсолютно не подобається, 6 – дуже подобається). Так само оцінюються Pepsi і RC Cola. З рис. 1 видно, що незрівнянні рейтингові шкали можуть бути безперервними або деталізованими. Деталізовані рейтингові шкали, у свою чергу, поділяються на шкали: Лайкерта (Likert), семантичного диференціалу та Степела (Stapel). У маркетингових дослідженнях найчастіше використовується незрівнянне шкалювання. У розділі розглядаються порівняльні методики шкалирования.

1.3 Основні проблеми при побудові шкал

З вищевикладеного шкалювання може здатися досить простою, прямолінійною процедурою, коли завдання дослідника входить просто ідентифікувати ряд компонентів основного поняття, встановити, яким показником можна виміряти кожен з них, потім об'єднати ці показники в сумарну оцінку «...за допомогою вимовлення кількох чарівних слів або статистичних заклинань, і – раз-два! - справу зроблено". На жаль, ця видима простота оманлива, тому що при відборі та інтерпретації компонентів шкали нам може зустрітися ціла низка підводних каменів, що потребують особливої уважності. По-перше, це проблеми, пов'язані з поняттями валідності (обґрунтованості) та надійності.

Валідність - це властивість, що визначається відповіддю на запитання: «Чи дійсно ми вимірюємо саме те, що хочемо виміряти?». У нашому контексті це питання може бути дещо трансформовано так: «Чи є підстави вважати, що кожен із окремих компонентів шкали (кожен із конкретних питань) справді безпосередньо пов'язані з основним поняттям і всі компоненти разом повністю охоплюють це поняття?». Інакше кажучи, необхідно поставити запитання: «А чи є реальний сенс у тому, щоб поєднувати між собою ряд приватних показників, і – коли ми вже це зробили – чи є сенс навішувати на цей ряд показників обраний нами ярлик основного поняття?». Так, звертаючись знову до прикладу зі студентами, необхідно дізнатися, по-перше, чи дійсно думка людини про поведінку студентів безпосередньо пов'язана з її думкою про студентський стиль одягу або про манери студентів, і по-друге, чи справді всі ці думки в сукупності відображають ступінь упередженості цієї особи проти студентів.

Що ж до надійності, вона визначається відповіддю питанням: «Незалежно від цього, що ми вимірюємо, чи послідовно ми це робимо?». Стосовно шкалювання це питання трансформується у турботу про те, щоб різні показники, що є компонентами шкали, були пов'язані один з одним послідовним та осмисленим чином. Насправді нас цікавить тут не те, чи дозволяє цей набір питань чи показників відрізнити яблука від апельсинів, а скоріше те, чи дозволяє цей набір послідовно сортувати вже ідентифіковані нами яблука за розміром, кольором тощо відповідно до деякого стандарту. Якщо так, то об'єднання різних заходів говоритиме про яблука більше, ніж будь-яка окрема міра. Але якщо наші стандарти (кольору, розміру тощо) непослідовні або двозначні, то засновані на них спостереження можуть виявитися хибними. 1

Можливо, інший приклад допоможе зробити ці положення зрозумілішими. Розглянемо якусь шкалу, призначену для того, щоб кожен респондент висловив свою згоду чи незгоду з такими твердженнями:

1. Кубинці погані, і їм не можна вірити

2. Французи погані, і їм не можна вірити

3. Японці погані, і їм не можна вірити

4. Китайці погані, і їм не можна вірити.

Давайте уявімо, що перед нами шкала для вимірювання ксенофобії, тобто страху та недовіри до іноземців. Імовірно, що з більшою кількістю тверджень погодиться респондент, то вищий рівень ксенофобії, який ми можемо йому приписати. Але чи буде справа саме так? Людина, яка вважає, що тільки кубинці погані і їм не можна вірити, стверджує це більше через антикомунізму, ніж ксенофобії. У свою чергу людина, яка вважає, що тільки японці та китайці погані і їм не можна вірити, стверджує це більше через расизм, ніж ксенофобії. І навіть респондент, який вважає, що всі чотири групи погані і їм не можна вірити, як з'ясовується при найближчому розгляді, страждає не на ксенофобію, а скоріше на почуття, що всі люди, або всі уряди (навіть тієї країни, де він живе) погані і їм не можна вірити. І отже, оскільки ми не можемо з упевненістю стверджувати, що ця шкала вимірює ксенофобію по суті, ця шкала неспроможна. І чи можемо ми взагалі довіряти їй? Чи складено її продумано навіть для вимірювання рівня ксенофобії? Страх і недовіра до китайців, наприклад, можливо, є індикатором щонайменше двох абсолютно різних особливостей, одна з яких ідеологічна, друга ж має своєю причиною расизм, і два респонденти можуть дати однакову відповідь з різних причин. І чи буде однаковим почуття ксенофобії у антикомуніста та расиста? Скоріш за все ні. Таким чином, механічне з'єднання цих конкретних пунктів з метою їх порівняння в кращому разі буде марною вправою, а в гіршому – стане джерелом помилкових висновків. 1

Проблеми такого роду подолати не завжди просто, і тому при шкалюванні потрібно діяти дуже уважно, заздалегідь все прораховуючи. Проте можливість уявлення складного відношення або поведінки у вигляді окремого числа або оцінки, що є незаперечною перевагою шкалювання, є стимулом до використання цієї методики в безлічі найрізноманітніших випадків.

2. РОЛЬ ШКАЛ У ПРОЦЕСІ АНАЛІЗУ ДАНИХ

Шкала вимірювальна є алгоритм присвоєння об'єкту числа, що відображає наявність або ступінь виразності у нього деякої властивості. Розрізняють чотири основні типи вимірювальних щкали: шкала найменувань, шкала порядку, шкала інтервалів та шкала відносин. Шкали найменувань і порядку дозволяють віднести об'єкт до одного з кількох класів, що не перетинаються, і називаються «якісними». Шкали інтервалів та відносин вимірюють «кількість» або ступінь виразності в об'єкта деякої властивості і називаються «кількісними». Шкала найменувань (номінальна шкала) дозволяє віднести об'єкт одного з кількох класів, між якими встановлено ставлення порядку, тобто. класів, стосовно яких не застосовуються порівняння типу «більше — менше», «краще — гірше» тощо. За номінальними шкалами вимірюються такі соціологічні показники як стать, національність чи раса, колір очей, темперамент тощо. Під час розробки номінальної шкали складається повний перелік класів, що нумерується у довільному порядку. У цьому числа, які мають номери класів, грають роль символів чи «міток», до них що неспроможні застосовуватися жодні арифметичні операції. Іншими словами, на номінальній шкалі визначено лише відношення тотожності: об'єкти, віднесені до одного класу, вважаються тотожними, віднесені до різних класів не тотожними. Приватним випадком номінальної шкали є дихотомічна шкала, що фіксує наявність або відсутність об'єкта деякої властивості. Наявність якості прийнято позначати числом "1", його відсутність - числом "0". Шкала порядку призначена для віднесення об'єкта до одного з класів, що не перетинаються, упорядкованих за деяким критерієм. На шкалі порядку, окрім відношення тотожності, визначено відношення порядку (“більше – менше”). Таким чином, об'єкти, віднесені до різних класів, можна сказати, що в одного з них вимірювана властивість виражена сильніше, ніж в іншого, але при цьому не можна визначити, наскільки сильнішим. Типовими прикладами шкали порядку є освіта, тип поселення, соціальний стан, військові звання тощо. При побудові шкали порядку класи нумеруються в порядку зростання або зменшення відповідної ознаки. Арифметичні операції над номерами класів не провадяться. Приватним випадком шкали порядку є рангова шкала, що застосовується в тих випадках, коли деяка ознака не може бути виміряна, але об'єкти можуть бути впорядковані за відповідним критерієм, або коли порядок об'єктів важливіший, ніж точний результат вимірювання, наприклад, місця, зайняті на спортивних змаганнях. Рангові шкали використовуються також щодо переваг, ціннісних орієнтацій, мотивів, установок тощо. Респонденту у разі пропонується впорядкувати запропонований список об'єктів, понять чи суджень за певним критерієм. Іншим окремим випадком шкали порядку є оцінна шкала, за допомогою якої властивості об'єкта або ставлення респондента до чогось оцінюється виходячи з певної кількості балів. Наприклад, академічна успішність оцінюється за 5-бальною шкалою. Оціночні шкали часто розглядаються як виняток із шкал порядку, оскільки передбачається, що між балами на шкалі існує приблизно однакова відстань. Наприклад, передбачається, що «відмінник» знає предмет настільки ж краще, ніж «хорошист», наскільки «хорошист» знає його краще, ніж «трієчник». Ця властивість дозволяє в багатьох випадках розглядати оціночні шкали як квазіінтервальні та використовувати їх відповідним чином, наприклад, обчислювати середній бал за атестатом зрілості або визначати середню успішність у класі. Шкали інтервалів та відносин є Ш.І. у прямому значенні цього слова. Для них характерна наявність одиниці виміру, що дозволяє визначити, наскільки один об'єкт більше або менше, ніж інший, за критерієм, що вивчається. Відмінність між цими двома типами шкал полягає в тому, що шкала відносин має «об'єктивний» нуль, що не залежить від свавілля спостерігача, який, як правило, відповідає повній відсутності вимірюваної якості об'єкта. На шкалі інтервалів нуль встановлюється довільно або відповідно до деяких традицій і домовленостей. Так, вік вимірюється за шкалою відносин, а літочислення - за шкалою інтервалів, хоча в обох шкалах використовується однакова одиниця виміру - рік. На шкалі інтервалів, крім відносин тотожності та порядку, визначено відношення різниці: для будь-якої пари об'єктів можна визначити, на скільки (одиниць виміру) один об'єкт більший або менший за інший. Шкали інтервалів широко використовуються у психологічних тестах та психометрії, методиках семантичного диференціалу, інших методах вторинних вимірів. За шкалами відносин вимірюються такі показники, як зростання, вік, доходи, стаж роботи, кількість викурених сигарет тощо. Для таких змінних визначені не лише відносини тотожності, порядку та різниці, а й відношення відносин, що дозволяє визначати, у скільки разів один об'єкт більший чи менший за інший.

Вимір - відображення емпіричної системи в числову систему, що зберігає порядок відносин між об'єктами. Класична концепція виміру розрізняє два способи приписування об'єктам значень змінних. Перший спосіб називається оцінюванням. Відображення якості об'єкта на шкалу здійснюється тут у умовних одиницях. Наприклад, можна з тим чи іншим ступенем точності визначити місце людини на шкалі «консерватизму». Жодної одиниці консерватизму в розпорядженні дослідника немає, градації можуть змінюватися довільно.

Власне вимір вимагає визначення одиниці - зразка шкали. І тут виміру піддаються лише просторові і часові ознаки, і навіть чисельність — адитивні величини. Однак у соціальних та поведінкових науках отримав визнання ширший погляд на вимір як на приписування об'єктам значень відповідно до заданої системи відносин на різних рівнях.

Змінна — не те саме, що реальні ознака чи властивість. Це свого роду лінійка — сукупність і операцій, які потрібні й достатні для кваліфікації події, властивості, відносини, словом, всього те, що прийнято розуміти під фактами. Для лінійки не дуже важливо, чи нанесені її поділу на дерев'яну, пластмасову або металеву пластинку. Набагато важливіше градуювання шкали, а також вміння користувача правильно проводити вимірювання. Аналогічно і при вимірі поведінки, лише «лінійка» у разі має вигляд запитальника (чи бланка спостереження), а «прикладання» їх до об'єкту є що інше, як операційне визначення.

Як вимірювальний інструмент змінна конструюється дослідником шляхом встановлення континууму значень (градацій). Minimum minimorum континууму, як ми вже знаємо, - дихотомія: так і ні, плюс і мінус, твердження і заперечення. Фактично ми майже завжди маємо справу з трихотоміями, оскільки у складі будь-якої змінної покладено градацію «немає відповіді» (або «немає даних»).

Таким чином, змінна містить три компоненти: 1) деяку не завжди чітко сформульовану концепцію вимірюваної ознаки, наприклад, "електоральні переваги", "стабільність сім'ї", "освіта" тощо; 2) шкалу - сукупність значень, що задають критерії класифікації об'єктів; 3) операційне визначення - сукупність інструкцій, що регламентують процес ідентифікації об'єкта за встановленою шкалою значень.

Елементарний рівень виміру – номінальний. Цьому рівню відповідає шкала найменувань, яка складається із значень ознак, не впорядкованих за ступенем зростання чи спаданням. Типові приклади шкали найменувань: національність, професія, політичні переконання. Значення шкали найменувань конструюються відповідно до логічних правил класифікації. Перше — правило несуперечності. Воно говорить: «Об'єкт то, можливо віднесено до одного і лише одному класу, передбаченому значенням змінної». Іншими словами, дослідник зобов'язаний називати речі своїми іменами і уникати діалектики, коли об'єкт одночасно виявляється і тим, і іншим. Зробити це не так легко, як здається, назвати річ своїм ім'ям. Реакціонери іноді здаються лібералами, дурні розумними, жінки чоловіками. Але навіть у найважчих ситуаціях аналітик повинен дати однозначну кваліфікацію об'єкту. Тут багато дозволено. Єдине, що заборонено, це кваліфікувати об'єкт як білий і чорний одночасно.

Наслідком цього правила є стовідсоткова сума частот всіх градацій змінної. Якщо сума частот перевищує стовідсоткову позначку, то принаймні деякі одиниці потрапили одночасно у два класи і пораховані неодноразово. Так буває, коли в запитальнику задають шкалу-асорті, де можна вибрати і те, й інше, і третє. Наприклад, питається: «Що ви найбільше любите?» з варіантами відповідей: мацу, шашлик, ліберально-демократичні свободи… Тут можна віддати перевагу всім підказкам запитальника, і стовідсоткової суми не вийде, якщо хоча б один із респондентів потрапив до класів тих, хто любить одночасно мацу і ліберально-демократичні свободи. Причина спотворення в тому, що наведені позиції не становлять змінну, навпаки, кожна з них є «обрізаною» версією змінної. Повноцінна версія передбачає відповіді «Так», «Ні» та «Не можу сказати». Правильно побудована змінна є одномірним континуумом. На відміну від багатоскладових вимірів він вимагає агрегації. Звідси друге правило - правило єдиної основи класифікації. Не можна розділяти людей на розумних і рудих, бо й руді іноді виявляються розумними. Не можна змішувати дві різні змінні в одному питанні. Не можна не враховувати і зміна змісту змінної при переміщенні в інший контекст. Наприклад, питання ставлення до інтелігентів, заданий у Москві Чикаго, виявиться двома різними питаннями, оскільки у російської традиції прийнято приписувати інтелігенту роль носія морального початку, тоді як житель Чикаго відразу здогадається, хто мають на увазі під «інтелігентом».

Третє правило - правило повноти. У сукупності не повинно бути жодного об'єкта, що не піддається ідентифікації за заданими значеннями. Іншими словами, об'єкт повинен бути розподілений на континуумі змінної і отримати місце в одному з класів. Якщо ж цього не відбувається, процес вимірювання «зависає» — лінійку прикласти просто нема до чого і нема до кого. Зауважимо, що позиція «Немає даних» вирішує проблему повноти, коли шкала не охоплює весь діапазон значень. Наприклад, відмова респондента повідомити свій вік не означає, що шкала віку не має відношення до цього об'єкта. Приклади шкал, які мають відношення до об'єкта, інакше кажучи, не релевантні йому, численні. Соціологи часто намагаються здійснити виміри думок, установок, інших особистісних характеристик, припускаючи, що властивість, що вивчається, є у всіх. Наприклад, питання: «Як ви ставитеся до Бурбулісу?», який ставився деякими центрами вивчення громадської думки в 1992 р., ґрунтувався на переконанні, що властивість «Ставлення до Бурбуліса» є у всіх, хто потрапив у вибірку. Виключалася можливість того, що людина немає ні позитивного, ні негативного ставлення до Бурбулису. Позиція «Не можу сказати», здавалося б, включає в себе такого роду респондентів, проте сюди потрапляють не тільки думки, але й не мають самої ознаки.

У соціологічних вимірах нерідко виникає різновид штучно створених емерджентних змінних - змінних, породжених процедурою. Люди, які не мали до моменту інтерв'ювання ніякого відношення до ознаки, що вивчається, конструюють це відношення в процесі міжособистісної комунікації з інтерв'юером, відповідаючи «позитивно», «негативно» або найчастіше «нейтрально». Причини емерджентних змінних пов'язані найбільше впливом інтерв'юера.

Г. А. Погосян показує про типові обставини, за яких змінні описують не стільки самостійну мовленнєву поведінку респондента, скільки ситуацію збору даних. Зокрема, Погосян показав, що підказка відповіді суттєво змінює частотний розподіл.

З таблиці видно, що «підказка» істотно збільшує кількість тих, хто вважає, що хороші фахівці мають найбільш сприятливі шанси на просування по службі, і майже настільки ж знижує кількість тих, хто вказав на догідливість. Якщо припустити, що відкриті питання дають велику можливість висловити самостійну думку, підказка призводить до артефакту: 62% обрали відповідну версію відповіді, а не висловили свою думку.

Проектуючи змінні, соціолог прагне забезпечити їхню відповідність фактичному поведінці об'єкта. У той самий час він має організувати в логічному відношенні, нехтуючи тим обставиною, що «життя» часто буває нелогічною і багатозначною. Тут намічається дилема: або описувати життя у всій суперечливості, або конструювати схеми. У першому випадку соціологу краще обрати собі кар'єру письменника, у другому випадку потрібно постаратися, щоб логічна схема відповідала дійсності.

Вимоги взаємооднозначної відповідності та єдиної підстави містять певне насильство над «людською» реальністю. У житті «так» часто переходить у «ні», «демократи» називають себе комуністами, а плюс виявляється мінусом. Найкраще працювати з номіналіями, які, як передбачається, найбільше відповідають мові соціальної взаємодії та поведінки. Номінальні виміри у соціологічних і соціально-економічних дослідженнях розцінюються як фундаментальні розуміння самої природи соціальної реальності. С.В. Часників засновує такий висновок на припущенні, що номінальні змінні є кінцевим результатом процедур емпіричної верифікації теоретичних понять завжди, коли об'єктом досліджень у тому мірою є люди, їх свідомість і поведінка. «Це зумовлено тим, – пише С.В. Часників, що і соціолог-дослідник, і люди, які висловили добру волю контактувати з соціологом у ролі респондентів, виражають свої реакції, формують і описують соціальне в образах і поняттях, знаками яких є слова, а не числа »8. Звідси випливає припущення про обмежені можливості числового аналізу даних. Гуманітарним виміром С.В. Часників називає будь-яке ім'я, а детермінаційним аналізом - встановлення слідування «якщо а, то b», де а і b - імена.

Поза сумнівом, номінальні змінні, що фіксують конкретні значення, лежать у фундаменті соціологічного словника. Однак ця їхня особливість коріниться не так у «живій мові» соціального спілкування, як у еквівалентності значень змінних протокольним фактофіксуючим висловлюванням. Такі номінальні «протоколи» незалежно від їх змісту лежать у фундаменті будь-яких наукових описів. Власне шкали (континууми) являють собою способи організації номінальних значень в ідеалізованих метриках, але в будь-якому випадку має дотримуватися вимога однозначної відповідності одиниці і значення змінної.

Вимоги, що пред'являються номінальним вимірам (ідентифікаціям), повинні виконуватися і для шкал вищого рівня: впорядкованих, інтервальних і метричних.

Упорядкована шкала відрізняється від номінальної тим, що її градації розташовуються у порядку щодо зростання чи зменшення інтенсивності якості.

До класу впорядкованих відносяться оціночні шкали, установки та переваги. У соціології використовуються два види впорядкованих шкал: ранги (рейтинги) та бали. Ранги встановлюються шляхом приписування об'єкту місця таким чином, що кількість місць точно дорівнює кількості об'єктів. Наприклад, можна розподілити студентів за рівнем підготовки та приписати кожному його місце, починаючи від першого і закінчуючи останнім. Інакше кажучи, ми ранжуємо їх, знаючи, що незалежно від рівня знань у групі мають бути перші та останні. Аналогічну систему виробничого стимулювання, засновану на ідеї заохочення перших за рахунок останніх, застосував у 1960-ті роки. В.М. Якушев, експериментуючи в одному з конструкторських бюро, експеримент отримав популярність під назвою «Пульсар». Оскільки у будь-якому разі хтось виявиться останнім, група ставиться в умови конкуренції та боротьби за виживання.

Рейтинг як тип соціального оцінювання є нормою певного типу культури, що ґрунтується на пріоритеті індивідуального інтересу перед інтересами колективними. Життєвий та професійний успіх осмислюється тут як перемога над іншими. У такій грі вважається дурним і навіть аморальним дати товаришу по класу списати контрольну роботу — це означає поступитися йому в змаганні. Зрештою загнаних коней пристрілюють, чи не так? Усе це відбувається у навчанні, а й у бізнесі, сім'ї, спілкуванні, релігії. Теорія раціонального вибору заснована на ідеї оптимізації індивідуального поведінки при обмежених ресурсах.

Бальні шкали оперують не місцями, а шкільними значеннями. Ці значення залежать друг від друга. У певному сенсі бальна шкала має егалітарне походження. Всі студенти, включаючи першого та останнього, можуть отримати трійки та бути щасливими відповідно до теорії відносної депривації. Однак надійність такого роду шкал дуже сумнівна, особливо у випадках, коли для позначення міток використовуються цифри. Відстань від 4 до 5 — не та сама, що відстань від 2 до 3. У кожного викладача є власні переваги щодо ділянки континууму, на якій він розподіляє студентів. Один ставить 2 та 3, інший 4 та 5. Як порівнювати їх? Великих труднощів тут немає, оскільки індивідуальні значення можна нормувати щодо середнього бала чи стандартного відхилення балів в кожного викладача.

Упорядковані шкали оцінювання передбачають логічне балансування позицій щодо нейтрального центру. Ця вимога відображає загальне правило побудови шкал: кожна категорія шкали повинна характеризуватись рівною ймовірністю «попадання» об'єкта за умови випадкового розподілу. Іншими словами, кількість градацій праворуч від центру має дорівнювати кількості градацій зліва, Часто як «центр» шкали використовується значення «Не можу сказати». Так створюється очевидна двозначність інтерпретації даних. "Не можу сказати" означає, що респондент не може вибрати жодну із запропонованих позицій; але якщо «Не можу сказати» стоїть у центрі збалансованої шкали, мається на увазі «Важко віддати перевагу будь-що».

Коли значення впорядкованої шкали оцінювання немає чітко визначених меж, шкала перетворюється на напівупорядковану. Фактично в соціологічних та психологічних дослідженнях найчастіше використовуються напівупорядковані шкали.

Інтервальні шкали ґрунтуються на процедурах, що забезпечують рівні або приблизно рівні відстані між градаціями змінної. У разі порівнюються не значення змінних, а відстані між значеннями. Іншими словами, будь-які два виміри даної емпіричної системи, здійснені за шкалою інтервалів, перекладаються один в одного за допомогою лінійної функції.

Якщо за номінальною шкалою послідовність об'єктів встановлюється без особливих труднощів, інтервальна шкала передбачає вирішення проблеми порівняння відстаней між об'єктами. Ця властивість лінійних перетворень, характерна для інтервальних шкал, демонструється числовим прикладом: 5 - 2/2 - 1 = 24 - 15 / 15 - 12 = 3. Відношення різниць між шкальними значеннями є в цьому випадку постійним». Якщо один з об'єктів інтервальної шкали відображається в нуль, можна говорити про шкалу відносин - окремий випадок інтервальної шкали. У разі фіксується початок отсчета12.

Побудувати інтервальну шкалу можна з допомогою парних порівнянь чи використовуючи, як це робив Л. Терстоун, суддівські процедури. Спочатку створюється масив релевантних суджень, що описують вимірюваний ознака, наприклад ставлення, установку чи оцінку. Потім експертам пропонується розташувати судження за категоріями від найбільшої інтенсивності до найменшої ознаки. Передбачається, що розподіл суддівських оцінок довкола шкальних значень підпорядкований нормальному закону. Відбираються ті судження, які одержав і узгоджені оцінки суддів. Такий спосіб побудови «інтервалів, які здаються рівними». Найбільш відомі методи побудови шкал інтервалів розроблені Л. Терстоуном, Р. Лікертом, Л. Гуттманом. Однак у сучасній соціології вони використовують рідко.

Метричні, або абсолютні, шкали відповідають усім вимогам, що висуваються до шкал нижчих класів, вони мають як нульову мітку відліку, а й одиницю виміру часу, відстані чи чисельності одиниць. Тут допустимі усі перетворення з числами.

Приписування значень об'єктам здійснюється у трьох формах: вербальної, графічної та числової. Вербальна інтерпретація змінних найпоширеніша у масових опитуваннях. Як елементи шкали тут виступають судження, що свідчать про думки, цінності, стани. Наскільки адекватним є це свідчення — особлива проблема. Ясно одне: самі судження не більше ніж свідчення про реальність, яка стоїть за ними. Тому вербальна інтерпретація шкали виконує у мові повсякденності роль своєрідного зонда. Її важлива відмінність від повсякденної мови полягає в чіткій концептуальній структурі, адаптованій до різноманітних мовних ситуацій та контекстів. Навіть відкрите питання, здавалося б, максимально орієнтоване на лексику респондента, працює лише за умови однозначного концептуального кодування.

Вербально інтерпретовані позиції шкали сприймаються досить чітко, якщо їх небагато. Але вже при виборі з п'яти градацій починаються труднощі. Наприклад, категорії «задоволений» і «швидше задоволений, ніж незадоволений» різняться із значним ступенем умовності. У семипунктовій шкалі можливості вербальної інтерпретації виявляються вичерпаними. Тут краще графічне оформлення шкали, що створює можливість стандартного прочитання. Графічна інтерпретація шкали застосовується у про крос-культурних дослідженнях, де лексика інструменту вимагає перекладу мову респондента. Передбачається, що візуалізація змінної малюнку створює універсальний «патерн» шкали. Аналогічним чином використовуються жести у міжнаціональному спілкуванні. Один із прикладів інструменту, виконаного в графічному ключі, - картинки тесту тематичної апперцепції. Часто шкали зображуються у вигляді лінійок та піктограм. Герві Кентріл розробив «сходи щастя»: на малюнку сходів респондент повинен відзначати своє нинішнє положення щодо найкращого (верх сходів) і найгіршого (низу сходів) збігу обставин, а потім вказувати напрямок свого передбачуваного руху по «сходах щастя». В одній із ранніх версій шкали установки Л. Терстоуном пропонувався одинадцятипунктовий континуум, виконаний у вигляді термометра.

Числова інтерпретація іноді помилково ототожнюється з вербальною. Використання цифр як іменників не означає введення метрики. Наприклад, для кодування чоловіків можна позначити цифрою 1, а жінок — цифрою 2. У разі застосовані мітки, але з числа. Числа передбачають здійснення операцій адитивності, арифметичних процесів. Коло числових шкал обмежено інтервальним та метричним рівнями вимірювання, де встановлені одиниці інтенсивності властивості.

794. Орлов А.І. Теорія вимірів як частину методів аналізу даних: роздуми над перекладом статті П.Ф. Веллемана та Л. Уілкінсона // Соціологія: методологія, методи, математичне моделювання. 2012. № 35. С. 155-174.
А.І. Орлов

(Москва)
МІСЦЕ ТЕОРІЇ ВИМІРЮВАНЬ У МЕТОДАХ АНАЛІЗУ ДАНИХ 1

Відповідно до сучасної парадигми прикладної статистики, теорія вимірів є невід'ємною частиною методів аналізу даних. На думку П.Ф. Веллемана та Л. Уілкінсона, застосування теорії вимірювань «при виборі або для рекомендації тих чи інших методів статистичного аналізу недоречно і часто призводить до помилок». У статті наведено короткі відомості про шкали вимірювання та застосування теорії вимірювань при виборі середніх величин відповідно до шкал вимірювання даних, а потім скрупульозно аналізуються аргументи П.Ф. Веллемана та Л. Вілкінсона. Підсумок дискусії: «теорія вимірів важлива інтерпретації статистичного аналізу» . Дискусія дозволила уточнити низку питань застосування прикладної статистики (аналізу даних): виявлено роль розв'язуваної задачі та застосовуваної моделі даних для встановлення типів шкал вимірювання цих даних; розділені області застосування розвідувального аналізу та доказової статистики.
Ключові слова: теорія вимірів, аналіз даних, прикладна статистика, шкали виміру, допустимі перетворення, інваріантність висновків.
Методи аналізу даних (тобто прикладна статистика, статистичні методи) необхідні соціологу для обробки результатів масових обстежень, а також для підбиття підсумків експертних опитувань. Ця наукова галузь бурхливо розвивається. Згідно з новою парадигмою прикладної статистики, теорія вимірювань є невід'ємною частиною сучасних методів аналізу даних. У наших підручниках (, та ін.) розказано про теорію вимірювань та її застосування при виборі адекватних методів аналізу даних.

Є й інші думки щодо доцільності використання теорії вимірів під час аналізу соціологічних даних. Основна ідея статті П.Ф. Веллемана та Л. Уілкінсона виражена в її назві. На їхню думку, застосування теорії вимірювань «при виборі або рекомендації тих чи інших методів статистичного аналізу недоречно і часто призводить до помилок» .

Перш ніж розбирати аргументи П.Ф. Веллемана і Л. Уілкінсона, доцільно навести короткі відомості про предмет дискусії, зокрема, визначити терміни, що використовуються, і сформулювати основні положення в стилі вітчизняної імовірнісно-статистичної школи, основоположником якої є О.М. Колмогоров, що перетворив теорію ймовірностей та математичну статистику на розділ математики. При цьому уточнюємо виклад і описуємо застосування теорії вимірювань в теорії середніх величин, що дозволило створити струнку і остаточну систему середніх.
Основи теорії вимірів
Теорія вимірювань виходить з того, що арифметичні дії з числами, що використовуються в практичній роботі, не завжди мають сенс. Наприклад, навіщо складати чи множити номери телефонів? Далі, не завжди виконані звичні арифметичні співвідношення. Наприклад, сума знань двох двієчників не дорівнює знанням «хорошиста», тобто. для оцінок знань 2+2 не дорівнює 4. Наведені приклади показують, що практика використання чисел для опису результатів спостережень (вимірювань, випробувань, аналізів, дослідів) заслуговує на методологічний аналіз.

Основні шкали виміру.Найбільш простий спосіб використання чисел - застосування для розрізнення об'єктів. Наприклад, телефонні номери потрібні для того, щоб відрізняти одного абонента від іншого. При такому способі виміру використовується лише одне відношення між числами - рівність (два об'єкти описуються або рівними числами, або різними). Відповідну шкалу вимірювання називають шкалою найменувань (при використанні терміна на основі латини - номінальною шкалою; іноді називають також класифікаційною шкалою). У цій шкалі виміряно штрих-коди товарів, номери паспортів, ІПН (індивідуальні номери платників податків) та багато інших величин, виражених числами. З прикладної точки зору шкала вимірювання - це спосіб приписування чисел об'єктам, що розглядаються, відповідний наявним між об'єктами відносинам.

Зазначимо, що числа можуть бути приписані об'єктам у різний спосіб. Перехід від одного способу до іншого спостерігаємо під час заміни паспортів або телефонних номерів. Якими є властивості допустимих перетворень? Для шкали найменувань природно вимагатиме лише взаємної однозначності. Іншими словами, застосувавши до результатів вимірювань взаємно-однозначне перетворення, отримуємо нову шкалу, яка так само добре описує систему вихідних об'єктів, як і колишня шкала.

Шість основних типів шкал вимірювання описані у табл.1.
Таблиця 1. Основні шкали виміру.

Тип шкали	Визначення шкали	Приклади	Група допустимих перетворень
Шкали якісних ознак
Найменувань	Числа використовують для розрізнення об'єктів	Номери телефонів, паспортів, ІПН, штрих-коди	Усі взаємно-однозначні перетворення
Порядкова	Числа використовують для впорядкування об'єктів	Оцінки експертів, бали вітрів, позначки у школі, корисність, номери будинків	Усі строго зростаючі перетворення
Шкали кількісних ознак (описуються початком відліку та одиницею виміру)
Інтервалів	Початок відліку та одиниця виміру довільні	Потенційна енергія, положення точки, температура за шкалами Цельсія та Фаренгейту	Усі лінійні перетворення φ( x) = ax + b, a і bдовільні, а>0
Відносин	Початок відліку задано, одиниця виміру довільна	Маса, довжина, потужність, напруга, опір, температура по Кельвіну, ціни	Усі подібні перетворення φ( x) = ax, адовільно, а>0
Різниця	Початок відліку довільно, одиниця виміру задана	Час	Усі перетворення зсуву φ( x) = x + b, bдовільно
Абсолютна	Початок відліку та одиниця виміру задані	Кількість людей у цьому приміщенні	Тільки тотожне перетворення φ( x) = x

Крім перерахованих у табл.1, використовують інші типи шкал . Зазначимо, що в табл.1 вираз «одиниця виміру довільна» означає, що вона може бути обрана за згодою фахівців, але не випливає з фундаментальних співвідношень. При вимірі часу природна одиниця виміру визначається періодами звернення небесних тіл. Початок відліку при вимірі довжини визначається довжиною відрізка, у якого початок і кінець збігаються, і т.д.

В даний час вважається за необхідне перед застосуванням тих чи інших алгоритмів аналізу даних встановити, в шкалах яких типів виміряно аналізовані величини. При цьому з часом тип шкали вимірювання певної величини може змінюватись. Наприклад, температура спочатку вимірювалася в порядковій шкалі (тепліше – холодніше). Після винаходу термометрів вона почала вимірюватися в шкалі інтервалів (за шкалами Цельсія, Фаренгейта або Реомюра). Температура Зза шкалою Цельсія виражається через температуру Fза шкалою Фаренгейта за допомогою лінійного перетворення

З відкриттям абсолютного нуля температур став можливим перехід до шкали відносин (шкала Кельвіна).

Вимога інваріантності (адекватності) висновків.З'ясування типів використовуваних шкал необхідне адекватного вибору методів аналізу даних. Основною вимогою є незалежність висновків від того, якою саме шкалою виміру скористався дослідник (серед усіх шкал, що переходять один в одного при допустимих перетвореннях). Наприклад, якщо мова про довжини, то висновки не повинні залежати від того, чи виміряні довжини в метрах, аршинах, сажнях, футах чи дюймах.

Іншими словами, висновки мають бути інваріантними щодо групи допустимих перетворень шкали вимірювання. Тільки їх можна назвати адекватними, тобто. позбавленими суб'єктивізму дослідника, вибирає певну шкалу з безлічі шкал заданого типу, пов'язаних допустимими перетвореннями.

Вимога інваріантності висновків накладає обмеження безліч можливих алгоритмів аналізу даних. Як приклад розглянемо порядкову шкалу. Одні алгоритми аналізу даних дозволяють отримувати адекватні висновки, інші – ні. Наприклад, завдання перевірки однорідності двох незалежних вибірок алгоритми рангової статистики (тобто. використовують лише ранги результатів вимірювань) дають адекватні висновки, а статистики Крамера-Уэлча і Стьюдента - немає. Отже, для обробки даних, виміряних у порядковій шкалі, критерії Смирнова та Вілкоксона можна використовувати, а критерії Крамера-Уелча та Стьюдента – ні.
Вибір середніх величин відповідно до шкал вимірювання
Вимога інваріантності є досить сильною. З багатьох алгоритмів аналізу статистичних даних йому задовольняють лише деякі. Покажемо це з прикладу порівняння середніх величин.

Середні по Коші.Серед усіх методів аналізу даних важливе місце посідають алгоритми усереднення. Ще 1970-х роках вдалося повністю з'ясувати, якими видами середніх можна скористатися під час аналізу даних, виміряних у тих чи інших шкалах.

Нехай Х 1 , Х 2 ,…, Х n - вибірка обсягу n. Найбільш загальне поняття середньої величини запроваджено французьким математиком першої половини ХIХ ст. О. Коші. Середньою величиною (за Кошою) є будь-яка функція f(X 1 , X 2 ,...,X n) така, що за всіх можливих значеннях аргументів значення цієї функції не менше, ніж мінімальне з чисел X 1 , X 2 ,...,X nі не більше, ніж максимальне з цих чисел. Середні по Коші є середнє арифметичне, медіана, мода, середнє геометричне, середнє гармонійне, середнє квадратичне.

Середні величини зазвичай використовуються для того, щоб замінити сукупність чисел (вибірку) одним числом, а потім порівнювати сукупності за допомогою середніх. Нехай, наприклад, Y 1 , Y 2 ,...,Y n- сукупність оцінок експертів (або респондентів), «виставлених» одному об'єкту експертизи, Z 1 , Z 2 ,...,Z n- Другому. Як порівнювати ці сукупності? Найпростіший спосіб – за середніми значеннями.

При допустимому перетворенні шкали значення середньої величини очевидно змінюється. Але висновки про те, для якої сукупності середнє більше, а для якої - менше, не повинні змінюватися (відповідно до вимог інваріантності висновків, прийнятої як основна вимога в теорії вимірювань). Сформулюємо відповідне математичне завдання пошуку виду середніх величин, результат порівняння яких є стійким щодо допустимих перетворень шкали.

Нехай f(X 1 , X 2 ,...,X n) - Середнє по Коші. Нехай середнє за першою сукупністю менше середнього за другою сукупністю:

f(Y 1 , Y 2 ,...,Y n) (Z 1 , Z 2 ,...,Z n).

Тоді згідно теорії вимірювань для стійкості результату порівняння середніх необхідно, щоб для будь-якого допустимого перетворення g(з групи допустимих перетворень у відповідній шкалі) була справедлива також нерівність

f(g(Y 1), g(Y 2),...,g(Y n)) (Z 1),g(Z 2 ),..., g (Z n)),

тобто. середнє перетворених значень із першої сукупності було менше середнього перетворених значень для другої сукупності. Причому сформульована умова має бути виконана для будь-яких двох сукупностей Y 1 , Y 2 ,...,Y nі Z 1 , Z 2 ,...,Z n.І, нагадаємо, для будь-якого допустимого перетворення. Середні величини, що задовольняють сформульованій умові, назвемо допустимими(У відповідній шкалі). Відповідно до теорії вимірів лише допустимими середніми величинами можна скористатися під час аналізу думок експертів та інших даних, виміряних у аналізованої шкалою.

За допомогою математичної теорії, розвиненої в монографії, вдається описати вид допустимих середніх величин в основних шкалах.

Середні величини у порядковій шкалі.Розглянемо обробку, для визначеності, думок експертів, виміряних у порядковій шкалі. Справедливим є наступне твердження.

Теорема 1.З усіх середніх по Коші допустимими середніми у порядковій шкалі є лише члени варіаційного ряду (порядкові статистики).

Теорема 1, вперше отримана у статті, справедлива за умови, що середня f(X 1 , X 2 ,...,X n) є безперервною (за сукупністю змінних) та симетричною функцією. Останнє означає, що при перестановці аргументів значення функції f(X 1 , X 2 ,...,X n) не змінюється. Ця умова є цілком природною, бо середню величину знаходимо для сукупності (множини)чисел, а не для послідовності. Безліч не змінюється залежно від цього, як і послідовності ми перераховуємо його елементи.

Відповідно до теореми 1 як середній для даних, виміряних у порядковій шкалі, можна використовувати, зокрема, медіану (при непарному обсязі вибірки). При парному обсязі слід застосовувати один із двох центральних членів варіаційного ряду - як їх іноді називають, ліву медіану або праву медіану. Моду теж можна використовувати – вона завжди є членом варіаційного ряду. Можна використовувати вибіркові квартілі, мінімум і максимум, децилі тощо. Але ніколи не можна розраховувати середнє арифметичне, середнє геометричне тощо.

Середні за Колмогоровим.Природна система аксіом (вимог до середніх величин) призводить до так званих асоціативних середніх. Їхній загальний вигляд знайшов у 1930 р. О.М. Колмогоров. Тепер їх називають «середніми за Колмогоровим».

Для чисел X 1 , X 2 ,...,X nсереднім за Колмогоровим є

G{(F(X 1) + F(X 2) +...+ F(X n))/n} ,

де F- суворо монотонна функція (тобто строго зростаюча або строго спадна), G- функція, зворотна до F. Серед середніх за Колмогоровим - багато добре відомих персонажів. Так, якщо F(x) = x, то середнє по Колмогорову - це середнє арифметичне, якщо F(x) = ln x, то середнє геометричне, якщо F(x) = 1/x, то середнє гармонійне, якщо F(x) = x, то середнє квадратичне, і т.д. (В останніх трьох випадках усереднюються позитивні величини).

Середнє по Колмогорову - окремий випадок середнього по Коші. З іншого боку, такі популярні середні, як медіана та мода, не можна уявити у вигляді середніх за Колмогоровим. У статті вперше доведено такі твердження.

Теорема 2.У шкалі інтервалів з всіх середніх за Колмогоровим допустимим є лише середнє арифметичне .

Таким чином, середнє геометричне або середнє квадратичне температур (в шкалі Цельсія), потенційних енергій або координат точок немає сенсу. Як середнє треба застосовувати середнє арифметичне. А також можна використовувати медіану чи моду.

Теорема 3.У шкалі відносин із усіх середніх за Колмогоровим допустимими є лише статечні середні з і середнє геометричне.

Чи є середні за Колмогоровим, якими не можна користуватися в шкалі відносин? Звичайно є. Наприклад, з F(x) = e 2 x .

Зауваження 1.Середнє геометричне є межею статечних середніх при .

Примітка 2.Теореми 1 та 2 справедливі при виконанні деяких внутрішньоматематичних умов регулярності. Докази теорем 1-3 наведені у монографії. Перенесення на випадок виважених середніх дано у статті.

Аналогічно середнім величинам може бути вивчені інші статистичні характеристики - показники розкиду, зв'язку, відстані та інших. (див., наприклад, ). Неважко показати, наприклад, що коефіцієнт кореляції не змінюється за будь-якого допустимого перетворення в шкалі інтервалів, як і відношення дисперсій. Дисперсія не змінюється у шкалі різниць, коефіцієнт варіації – у шкалі відносин, тощо. У статті розглянуто подальші результати про середні величини.

Згідно з підходом, що розглядається, спочатку треба встановити, в яких шкалах виміряні соціологічні дані, а потім використовувати тільки інваріантні щодо цих шкал алгоритми обробки даних.

У статті теорія вимірів називається «обмеження Стівенса», порядкова шкала названа ординальною, шкала відносин – відносною, немає поняття «група допустимих перетворень», тощо. Будемо користуватися усталеними в прикладній статистиці термінами. У цілому нині позиція прибічників використання теорії вимірів під час аналізу даних описано правильно.

Російською є досить багато публікацій з теорії вимірів, написаних суворо, кваліфікованими авторами. Оскільки ми не ставимо за мету дати тут огляд теорії вимірів, відішлемо читачів до робіт і наявних там посилань на літературні джерела.
Перші міркування над перекладом статті П.Ф. Веллемана та Л. Вілкінсона
Ця стаття написана як огляд різних публікацій, виклад йде на словесному рівні, суворі визначення, формули, таблиці, приклади майже відсутні. Тому доводиться додумувати за авторів, що вони хотіли сказати. Не завжди вдається надати точний зміст їхнім висловлюванням.

На с.173 виділено три напрями критики:

1. Вимога інваріантності висновків щодо допустимих перетворень шкал вимірювання «небезпечна для аналізу даних».

2. Підхід на основі теорії вимірювань «занадто суворий, щоб його можна було застосовувати для реальних даних».

3. Цей підхід «часто веде до зниження рівня даних через їх перетворення на ранги та подальше непотрібне звернення до непараметричних методів».

Почнемо з розбору у загальних термінах цих трьох напрямів критики.

1. Небезпечним для отримання обґрунтованих висновків є навпаки відмова від вимоги інваріантності. Хіба можна спиратися на висновки, що змінюються при допустимому перетворенні шкали?

Звичайно, при початковому розвідувальному аналізі даних можна їх «прогнати» через весь арсенал методів обробки, що є в програмному продукті – раптом вдасться щось цікаве помітити? Отримані нестрогими методами знахідки необхідно потім перевірити за допомогою обґрунтованих процедур аналізу даних .

Практика часто змушує використовувати міркування теорії вимірів. Так, під час проведення нашим науковим колективом опитувань льотного складу авіакомпанії «Волга-Дніпро» з'ясувалося, що пілотам легше сказати, яка подія зустрічається частіше, а яка рідша, ніж оцінити кількість здійснень подій на 1000 польотів. Проводити оцінювання в абсолютній шкалі (оцінювати ймовірності подій) пілоти не беруться, у той час як завдання порівняння подій за частотою народження або оцінки їх за умов умовними балами (значеннями якісних ознак) не викликають складнощів. Таким чином, отримані при опитуваннях пілотів оцінки виміряні у порядкових шкалах.

2. При практичній роботі зазвичай цілком зрозуміло, у яких шкалах виміряно дані. Якщо спробувати нав'язати респондентам неправильну шкалу, їхні відповіді будуть довільними, що не відображають справжніх думок, або ж вони можуть просто відмовитися давати відповіді, як це було в описаних вище опитуваннях льотного складу авіакомпанії «Волга-Дніпро».

Можна визнати, що в окремих випадках визначення типу шкали вимірювання даних вимагає спеціальних досліджень.

3. Вже на час появи статті П.Ф. Веллемана і Л. Уилкинсона (1993 р.) з допомогою непараметричних методів можна було вирішувати всі завдання аналізу даних, котрим усе ще окремих роботах використовуються параметричні методи. Відповідно до сучасної парадигми прикладної статистики замість параметричних методів, характерних для застарілої парадигми середини ХХ ст., слід застосовувати непараметричні методи.

Відповідно до сучасних поглядів, параметричні методи – це методи, засновані на імовірнісно-статистичних моделях, у яких розподіл випадкових величин належать тому чи іншому з параметричних сімейств – сімейству нормальних, логарифмічно-нормальних, гамма-розподілів або інших, що входять до чотирьохпараметричного сімейства К. Пірсона , запроваджене ним на початку ХХ ст. Непараметричні методи виходять із розподілів довільного вигляду. "Перетворення в ранги" не обов'язково при застосуванні непараметричних методів. Воно відповідає випадку, коли дані виміряні в порядковій шкалі.

Як показали численні дослідження, майже всі розподіли реальних даних не належать жодному з відомих параметричних сімейств. Побоювання непараметричних методів немає раціонального обгрунтування, вона породжена забобонами застарілої парадигми прикладної статистики середини ХХ в.

Від аналізу загальних заперечень проти застосування теорії вимірів під час аналізу соціологічних даних перейдемо до розгляду конкретних прикладів, наведених П.Ф. Веллеманом та Л. Вілкінсоном. Щоб не роздувати обсяг цієї статті, не будемо повторювати формулювання прикладів, припускаючи, що читачі мають перед собою переклад їх вихідної статті.

У критиці Лорда виділимо кілька складових. По-перше, вибір типу шкали може бути пов'язаний із розв'язуваним завданням. Так, номери договорів підприємства служать насамперед у тому, щоб розрізняти ці договори (і пов'язані із нею дії), тобто. Звичайно прийняти, що вони виміряні в шкалі найменувань. Однак ці номери зростають з часом (відповідно до дат укладення договорів), тому в деяких завданнях прийняття управлінських рішень природно вважати, що вони виміряні в порядковій шкалі. По-друге, при обробці порядкових даних за допомогою алгоритмів, що не є інваріантними в порядковій шкалі, може скластися враження, що отримані обґрунтовані висновки. Лорд розповідає про застосування нерівності Чебишева (можна було використати критерій Крамера-Уелча). Однак при застосуванні тієї ж процедури аналізу даних, підданим деякому допустимому перетворення в порядковій шкалі, висновки будуть прямо протилежними. Для виявлення різницю між двома незалежними вибірками слід було застосувати непараметричні критерії однорідності, наприклад, критерій Вилкоксона .

Бейкер, Хардик та Петринович, Боргатта та Боршштейн не хочуть застосовувати непараметричні методи, пояснень немає. Веллеман та Вілкінсон даремно критикують їх за небажання «пов'язуватися з проблемою робастності». Робастні способи, тобто. стійкі до малих відхилень функцій розподілу даних, що не дозволяють впоратися з довільним допустимими перетвореннями. Якщо ж від робастності перейти до більш загальної системи понять – до загальної схеми стійкості, то виявляється, що стійкі до допустимих перетворень шкал методи аналізу даних – це рангові методи як окремий випадок непараметричних.

Гутман пропонує використовувати «функцію втрат, обрану для перевірки якості моделі». Справді, якщо задана функція втрат, немає необхідності залучати теорію вимірів. Проблема полягає в тому, щоб вибрати цю функцію, причому обґрунтовано. З жодним таким практиком за більш ніж 40 років консультування в галузі аналізу даних мені зустрітися не довелося. Той, хто зможе вибрати функцію втрат, вже не практик, а кваліфікований фахівець у галузі математичної статистики.

На думку Тьюкі, «яке знання не ґрунтується на деякій приблизності» . Справді, при початковому розвідувальному аналізі одного погляду дані фахівцю буває достатньо формулювання висновку. Однак і практики, і теоретики наполягають на тому, щоб інтуїтивні висновки були обґрунтовані суворими міркуваннями.
Дискусія про статистики та шкальні типи
Названий розділ починається словами: «Статистики відкинули заборона на методи, заснований на обмеженнях, пов'язаних з допустимими перетвореннями». Це зовсім не так. Статистики прийняли цю заборону (див. обговорення). Особливо зрозуміло це зараз, через 20 років після написання статті. В даний час сумніви залишаються у деяких з тих, хто не є професіоналом у галузі аналізу даних, до того ж схильний до прийняття простих рішень і не хоче турбувати себе вивченням теорії вимірювань та непараметричної статистики. Такий настрій практиків цілком природний і розумний, але не плідний. Сучасна прикладна статистика не є простою, для її засвоєння потрібно докласти зусиль та витратити час.

Доводиться констатувати, що до статті включено велику кількість категоричних тверджень, які не підтверджені аргументами та суперечать практиці аналізу даних. На с.176 сказано: "Ключовий аргумент проти використання припису статистик на основі шкального типу говорить: це не працює!". Ще як працює - і на практиці, і при розвитку теорії (у початкових розділах цієї статті показано, що теорія вимірів дозволила надати теорії середніх закінчений вигляд). На с.177 говориться, що «досвід показує, що застосування заборонених статистик до даних призводить до науково значущих результатів, важливих при прийнятті рішень та цінних для подальших досліджень». Прикладів немає. Мабуть тому, що це твердження неправильне.

Часто використовуються терміни без визначень. Вітчизняного читача може вразити заяву про «фундаментальну різницю між математикою та наукою» (с.176). У нашій країні згідно з традицією та нормативними документами Міносвіти та ВАК математика – одна з наук. Ми вважаємо, що статистичні методи та аналіз даних – це те саме. Саме тому наша крайня книга називається "Статистичні методи аналізу даних". Звичайно, можна визначити терміни так, що математика не буде наукою, а аналіз даних відрізнятиметься від математичної статистики. Дискусія про терміни – цікаве заняття. Тільки в одній брошурі наведено близько 200 термінів «статистика». Однак ясно, що використання термінів без визначень, як це зроблено в , може лише заплутати читача.
Різні види даних
Не можна не погодитися з Веллеманом та Вілкінсоном в тому, що дані - це не завжди числа. Елементами вибірок можуть бути вектори, функції, різні види об'єктів нечислової природи – бінарні відносини, множини, нечіткі множини, інтервали та ін. Тим більше, це стосується результатів розрахунків, таких, як частки або набір точок на площині, отриманих в результаті багатовимірного шкалювання. Зверніть увагу: при розповіді про застосування теорії вимірювань при аналізі даних на початку цієї статті йшлося про інваріантність висновків, зроблених на основі обробки наборів чисел. Отже, теорія вимірювань використовується не у всіх розділах прикладної статистики, а лише за статистичного аналізу числових величин . Це зауваження знадобиться при подальшому розгляді статті.

Необхідно завжди розрізняти розвідувальний статистичний аналіз, націлений на «інтуїтивне проникнення закономірності масиву даних», і доказову статистику, засновану на суворих міркуваннях. Саме до розвідувального аналізу належать методи перетворення даних та багатовимірного шкалювання. При розвідувальному аналізі дотримуватись вимог теорії вимірювань не обов'язково, а в доказовій статистиці – навпаки.

У розділі «Гарний аналіз даних не ґрунтується на припущеннях про тип даних» Веллеман і Вілкінсон справедливо звертають увагу на важливість правильного вибору статистичної моделі. У наступному розділі «Стивенсівські категорії не описують фіксованих властивостей даних» фактично йдеться про те саме: у ряді ситуацій «шкільний тип залежить від інтерпретації даних або від наявності додаткової інформації» . Це твердження цілком вірно, набір чисел сам собою не дає можливості обгрунтувати тип шкали. Результат виміру дорівнює 2911397 – яка шкала? Якщо це число із бухгалтерського звіту, то шкала відносин (перехід від однієї валюти до іншої – подібне перетворення). Якщо це число – з телефонного довідника, то номер телефону виміряний у шкалі найменувань. На цю тему ми говорили раніше у зв'язку з розбором роботи Лорда. Отже, дуже важливим є вибір статистичної моделі, їм визначаються шкали вимірювання даних.

У розділі "Категорії Стівенса недостатні для опису шкал даних" розглядаються "багатомірні шкали". Що це таке – незрозуміло, оскільки визначень немає. Однак квазіпрактичний приклад, заданий табл.1, досить зрозумілий. Оскільки я п'ять років пропрацював у медичних закладах (у «кремлівській лікарні» та в НДІ професійних захворювань та гігієни праці АМН СРСР), то зазначу, що кількість наявних у пацієнта симптомів не можна розглядати як показник тяжкості захворювання, оскільки такий розгляд передбачає, що всі симптоми рівноцінні за вкладом у тяжкість захворювання. Такого у медицині не буває.

Про що йдеться в абзаці, присвяченому роботі Андерсона, залишається незрозумілим, оскільки визначень понять, що використовуються, немає.
Робастність, шкали та аналіз даних
У розділі «Статистичні процедури не можуть класифікуватися за критеріями Стівенса» Веллеман і Вілкінсон обговорюють обернену задачу (у термінології), в якій для заданої процедури аналізу даних потрібно встановити, в яких шкалах ця процедура дає інваріантні висновки. Справді, нами доведено, що висновок про порівняння розрахованих за двома вибірками значень лінійної функції від порядкових статистик, заданою формулою (5) на с.185 інваріантний у порядковій шкалі, якщо тільки один ваговий коефіцієнт відмінний від 0 (див. і теорему 1 в на початку статті), і в шкалі інтервалів (і в шкалах з більш вузькими групами перетворень – відносин, різниць, абсолютної), якщо принаймні два вагові коефіцієнти відмінні від 0 (див. ). Решта цього розділу статті не піддається інтерпретації в строгих термінах. Відзначимо тільки, що розглядається інше завдання, ніж раніше, - ув'язування процедур розрахунків зі шкалами вимірювання, а не встановлення типу шкали вимірювання вихідних даних.

У розділі «Шкальні типи – не точні категорії» в черговий раз стверджується, що «реальні дані не задовольняють вимогам шкальних типів». Водночас правильно зазначено, що за сумнівів «слід здійснити зниження рівня» шкали, наприклад, з інтервальної до порядкової. У задачі, розглянутій Тьюкі в 1961 р., була корисна статистика інтервальних даних, що розвивається з початку 1980-х років.

У розділі «Шкали та аналіз даних» міркування побудовані на змішуванні розвідувального статистичного аналізу, при якому можна не звертати увагу на шкали, в яких виміряні дані, та аналізу даних на стадії отримання суворих висновків, немислимих без звернення до теорії вимірів. Дивно, що Веллеман та Вілкінсон вважають «хорошим» лише розвідувальний аналіз. Фраза: «Гарний аналіз даних рідко слідує формальній парадигмі перевірки гіпотези» демонструє їх нігілізм стосовно математичної статистики, який неможливо виправдати.

У розділі «Свідомість» термін, що дав назву розділу, так і залишився без визначення. Як справедливо відзначають Веллеман і Уїлкінсон, згідно з теорією вимірювань осмисленість – це те, що зберігається при допустимих перетвореннях. Таке визначення їм не подобається, але дати інше вони не можуть, займаючись спільними міркуваннями про право на помилку. Дивно читати таке: «Якби наука була обмежена доведено осмисленими судженнями, вона не змогла розвиватися». Математика успішно розвивається!

Розділ «Роль типів даних» починається несподівано – з визнання важливості теорії вимірювань: «Були б помилкою вважати, що типи даних не мають значення… Поняття типу шкали важливе, а термінологія Стівенса (тобто теорії вимірювань – А.О.) часто буває зручна». Подальші міркування знову присвячені констатації того, що, в нашій термінології, тип шкали визначається не самими даними, а моделлю, що відповідає задачі, що вирішується (див. вище інтерпретацію числа 2911397 як результату вимірювань у шкалі відносин або в порядковій шкалі в залежності від постановки завдання). Друга ідея, яка також вже зустрічалася, - упор на розвідувальний аналіз та зменшення ролі доказової статистики.
Висновок
Розділ «Укладання» статті написано виважено, висловлені у ньому положення загалом справедливі. Як мовилося раніше, не можна вважати, «що тип шкали хіба що самоочевидний і залежить від цього, яке питання ставить дослідник перед своїми даними». За двадцять років після написання статті стало зрозуміло, що після постановки питання дослідник повинен описати модель аналізу даних, зазвичай імовірнісно-статистичну, що включає вибір типу шкал вимірювання даних, а потім у рамках цієї моделі розробити метод розв'язання задачі або вибрати його з наявних .

Цілком вірно, що «статистичне програмне забезпечення, що сприяє будь-якому аналізу будь-яких даних, допускає і безвідповідальний аналіз». Про це попереджав В.В. Налимов понад 40 років тому. Він мав на увазі насамперед схильність до проведення розрахунків без знайомства із суттю методів, що застосовуються.

Аналіз статті закінчено.

Підбиваючи підсумки цієї статті, необхідно констатувати користь від зіставлення підходів теорії вимірювань та критичних зауважень з її приводу, зібраних у статті Веллемана та Уїлкінсона. Дискусія дозволила уточнити низку питань застосування прикладної статистики (аналізу даних). Насамперед, виявлено роль розв'язуваної задачі та застосовуваної моделі даних для встановлення типів шкал вимірювання цих даних, розділені області застосування розвідувального аналізу та доказової статистики. Підтвердилася справедливість прислів'я: «У суперечці народжується істина».

ЛІТЕРАТУРА
1. Орлов А.І.Статистичні методи у російській соціології (тридцять років по тому) // Соціологія: методологія, методи, математичні моделі. 2005. № 20. С.32-53.

2. Орлов А.І.Нова парадигма прикладної статистики // Заводська лабораторія. 2012. Том 78. №1, частина I. С.87-93.

3. Орлов А.І. Прикладна статистика Підручник – К.: Іспит, 2006. – 672 с.

4. Орлов А.І.Організаційно-економічне моделювання: підручник: о 3 год. Частина 1: Нечислова статистика. - М.: Вид-во МДТУ ім. н.е. Баумана. - 2009. - 541 с.

5. Веллеман П.Ф., Вілкінсон Л.Типологія номінальних, ординальних, інтервальних та відносних шкал вводить в оману // Соціологія: методологія, методи, математичне моделювання. 2011. № 33. С.166 - 193.

6. Толстова Ю.М.Вимірювання у соціології. - М: Інфра-М, 1998. - 352 с.

7. Орлов А.І.Стійкість у соціально-економічних моделях. - М: Наука, 1979. - 296 с.

8. Орлов А.І.Допустимі середні в деяких завданнях експертних оцінок та агрегування показників якості. // Багатовимірний статистичний аналіз у соціально-економічних дослідженнях. - М: Наука, 1974. С. 388-393.

9. Колмогоров А.М.Про визначення середнього // Ізбр. праці. Математика та механіка. М.: Наука, 1985. С. 136-138.

10. Орлов А.І.Допустимі перетворення завдання порівняння середніх. ПСІ-постійні статистики. // Алгоритми багатовимірного статистичного аналізу та його застосування. - М: Вид-во ЦЕМІ АН СРСР, 1975. С.121-127.

11. Орлов А.І.Зв'язок між середніми величинами та допустимими перетвореннями шкали // Математичні нотатки. 1981. Т. 30. №4. С. 561-568.

12. Барський Б.В., Соколов М.В.Середні величини, інваріантні щодо допустимих перетворень шкали виміру // Заводська лабораторія. 2006. Том 72. №1. С.59-66.

13. Орлов А.І.Організаційно-економічне моделювання: підручник: о 3 год. Ч.3. Статистичні методи аналізу даних. - М: Вид-во МДТУ ім. н.е. Баумана, 2012. – 624 с.

14. Нікітіна Є.П., Фрейдліна В.Д., Ярхо А.В.Колекція термінів «статистика». - М.: МДУ, 1972. - 46 с.

15. Налімов В.В.Про викладання математики експериментаторам // Про викладання математичної статистики експериментаторам. Препринт Міжфакультетської лабораторії статистичних методів №17. - М.: Вид-во МДУ ім. М.В. Ломоносова, 1971. - С.5-39.

1Олександр Іванович Орлов, професор, доктор економічних наук, доктор технічних наук, кандидат фізико-математичних наук, директор Інституту високих статистичних технологій та економетрики МДТУ ім. н.е. Баумана, професор МФТІ, радник президента групи авіакомпаній "Волга-Дніпро", президент Російської асоціації статистичних методів. E-mail: prof- orlov@ mail. ru .

Робота виконана за фінансової підтримки Міністерства освіти і науки РФ у рамках Постанови Уряду РФ №218.

Застосування тих чи інших статистичних методів визначає тим, якої статистичної шкалі відноситься отриманий матеріал. Л.С. Стівенсзапропонував розрізняти чотири статистичні шкали:

1) шкалу найменувань (або номінальну);

2) шкалу порядку;

3) шкалу інтервалів;

4) шкалу відносин.

Знаючи типові особливості кожної шкали, неважко встановити, до якої слід віднести підлягає статистичної обробці матеріал.

Шкала найменувань. До цієї шкали відносяться матеріали, в яких об'єкти, що вивчаються, відрізняються один від одного за їх якістю.

При обробці таких матеріалів немає потреби розташовувати ці об'єкти в якомусь порядку, виходячи з їх характеристик. В принципі, об'єкти можна розташовувати у будь-якій послідовності.

Ось приклад: вивчається склад міжнародної наукової конференції. Серед учасників є французи, англійці, данці, німці та росіяни. Чи має значення порядок, у якому будуть розташовані учасники щодо складу конференції? Можна розмістити їх за абеткою, це зручно, але ясно, що ніякого принципового значення в цьому розташуванні немає. При перекладі цих матеріалів іншою мовою (а значить і іншою алфавітом) цей порядок буде порушено. Можна розмістити національні групи за кількістю учасників. Але при порівнянні цього матеріалу з матеріалом іншої конференції знайдемо, що навряд чи цей порядок виявиться таким самим. Віднесені до шкали найменувань об'єкти можна розміщувати у будь-якій послідовності залежно від мети дослідження.

При статистичній обробці такого роду матеріалів слід зважати на те, яким числом одиниць представлений кожен об'єкт. Є дуже ефективні статистичні методи, що дозволяють за цими числовими даними дійти науково значущих висновків (наприклад, метод хі-квадрат).

Шкала порядку.Якщо в шкалі найменувань порядок прямування об'єктів, що вивчаються, практично не відіграє ніякої ролі, то в шкалі порядку – це видно з її назви – саме на цю послідовність переключається вся увага.

До цієї шкали в статистиці відносять такі дослідницькі матеріали, в яких розгляду підлягають об'єкти, що належать до одного або кількох класів, але відрізняються при їх порівнянні одного з іншим– «більше-менше», «вище-нижче» тощо.

Найпростіше показати типові особливості шкали порядку, якщо звернутися до результатів будь-яких спортивних змагань, що публікуються. У цих підсумках послідовно перераховуються учасники, які посіли відповідно перше, друге, третє та наступні по порядку місця. Але в цій інформації про підсумки змагань нерідко немає або відходить на другий план відомості про фактичні досягнення спортсменів, а на перший план ставляться їх порядкові місця.

Припустимо, шахіст Д. зайняв у змаганнях перше місце. Які ж його здобутки? Виявляється, він набрав 12 балів. Шахіст Є. зайняв друге місце. Його досягнення – 10 очок. Третє місце посів Ж. із вісьмома очками, четверте – З. із шістьма очками тощо. У повідомленнях про змагання різниця у досягненнях під час розміщення шахістів відходить другого план, але в першому залишаються їх порядкові місця. У тому, що саме порядковому місцю приділяється головне значення, є свій сенс. Справді, у прикладі З. набрав шість, а Д., 12 очок. Це абсолютні досягнення – виграні ними парі. Якщо спробувати витлумачити цю різницю у досягненнях суто арифметично, то довелося б визнати, що З. грає вдвічі гірше, ніж Д. цим не можна погодитись. Обставини змагань не завжди прості, як не завжди просто і те, як провів їх той чи інший учасник. Тому, утримуючись від арифметичної абсолютизації, обмежуються тим, що встановлюють: шахіст З. відстає від Д., що посів перше місце, на три порядкові місця.

Шкала інтервалів. До неї відносяться такі матеріали, в яких дана кількісна оцінка об'єкта, що вивчається, у фіксованих одиницях.

Повернемося до дослідів, які провів психолог із Сашком. У дослідах враховувалося скільки точок можуть поставити, працюючи з максимально доступною їм швидкістю, сам Сашко і кожен з його однолітків. Оціночними одиницями у дослідах служило кількість точок. Підрахувавши їх, дослідив отримав ту абсолютну кількість точок, яка виявилася можливим поставити за відведений час кожному учаснику дослідів. Головна труднощі при віднесенні матеріалів до шкали інтервалів у тому, треба мати такий одиницею, що була за всіх повторних вимірах тотожної себе, тобто. однаковою та незмінною. У прикладі із шахістами (шкала порядку) такої одиниці не існує.

Насправді, враховується кількість партій, виграних кожним учасником змагань. Але ясно, що партії далеко не однакові, можна, що учасник змагань, який посів четверте – він виграв шість партій – виграв найважчу партію у самого лідера! Але в остаточних підсумках приймається, що всі виграшні партії однакові. Насправді ж цієї немає. Тому під час роботи з подібними матеріалами доречно їх оцінювати відповідно до вимог шкали порядку, а чи не шкали інтервалів. Матеріали, що відповідають шкалі інтервалів, повинні мати одиницю виміру.

Шкала стосунків.До цієї шкали ставляться матеріали, враховуються як кількість фіксованих одиниць, як і шкалі інтервалів, а й відносини отриманих сумарних підсумків між собою.Щоб працювати з такими відносинами, потрібно мати абсолютну точку, від якої і ведеться відлік. При вивченні психологічних суб'єктів ця шкала практично не застосовується.

Кожен вимір над об'єктом проводиться у певній шкалі. Різні координати одного вектора спостережень можуть бути у різних шкалах. Так, у § 5.1 наведено приклад вектора спостережень (табл. 5.1), у якого перші координати носять характер умовних міток (соціальна приналежність сім'ї, стать та професія глави сім'ї, якість житлових умов), тоді як інші виражаються числами (число членів сім'ї , кількість дітей, середньорічний дохід тощо). Властивості цих шкал дуже різняться між собою. Так, про стать глави сім'ї можна сказати тільки, що вона або чоловіча або жіноча і що стать чоловіча відрізняється від статі жіночої; про житлові умови - що вони збігаються або відрізняються і що в окремих випадках одні житлові умови кращі за інші; про витрати можна сказати, що витрати на харчування однієї сім'ї менші, рівні, більше витрат іншої, можна оцінити різницю у витратах між сім'ями та підрахувати, у скільки разів витрати однієї сім'ї відрізняються від витрат іншої.

Нижче описуються основні типи шкал і математичні прийоми уніфікації даних, що у різних шкалах, які зазвичай передують застосуванню методів багатовимірного аналізу.

10.2.1. Номінальна шкала.

Ця шкала використовується тільки для того, щоб віднести індивід, об'єкт у певний клас. Якщо описані заздалегідь можливі класи та правила віднесення об'єкта до них, то говорять про категоризовану шкалу, якщо ні, то про некатегоризовану. Прикладом категоризованої шкали є підлога. У дослідженні індивідууму приписується одне з двох значень: літера М або Ж, спеціальний знак або число 1 або 2. У принципі можна було б приписувати й інші літери та цифри, важливим є лише, щоб зберігалася взаємно-однозначна відповідність між кодами. Для введення категоризованих даних зручно використовувати «меню», тобто перелік можливих категорій зі своїми кодами. Прикладами некатегоризованих номінальних змінних є ім'я, прізвище, місце народження.

Інше важливе джерело некатегоризованих номінальних даних зазначено у § 5.3. Це випадок, коли спостереження задається над парою об'єктів, і змінна вказує лише, чи належать об'єкти, одного класу чи ні, і вказує, яких класів вони належать.

Остання обставина не треба розглядати як курйоз. Звичайно, якщо класи заздалегідь визначені і неважко кожен об'єкт віднести до певного класу, це слід зробити і записати, до якого класу об'єкт належить. Але іноді класи заздалегідь не описані, створення їхньої повної класифікації якраз і є метою роботи, а водночас оцінити належність об'єктів одному класу можна. Наприклад, можна говорити про «близьку», «схожу» течію хвороби у двох хворих, хоча всі варіанти перебігу захворювання і не описані. Більше того, виділення емпірично близьких варіантів перебігу хвороби може бути відправним пунктом для виділення та опису всіх можливих варіантів розвитку патологічного процесу. Те саме стосується виділення соціально-економічних груп тощо.

Одна й та змінна може залежно від мети використання виступати у різних якостях. Так, наприклад, некатегоризована номінальна змінна - ім'я програми - служить лише індивідуалізації програми і, якщо програм небагато, можна знайти прямим переглядом списку програм. Разом з тим, якщо імена програм у списку якимось чином упорядкувати (наприклад, в алфавітно-цифровому порядку), то ім'я програми як пошуковий образ несе в собі елементи порядкової величини. Про кожні два імені можна сказати, що вони або збігаються, або одне з них передує іншому при прийнятому способі впорядкування. При зміні способу впорядкування змінюється відношення слідування.

Арифметичні операції над величинами, виміряними у номінальній шкалі, позбавлені сенсу. Отже, і медіана, і середнє арифметичне не можуть бути використані як осмислений захід центральної тенденції. Більш слушна статистика тут мода.

10.2.2. Порядкова (ординальна) шкала.

На додаток до функції віднесення об'єктів до певного класу ця шкала також упорядковує класи за рівнем вираженості заданої властивості. Кожному класу приписується власний символ таким чином, щоб заздалегідь встановлений порядок символів відповідав порядку класів. Так, якщо класам будуть приписані числові значення, то класи будуть упорядковані відповідно до числової послідовності; якщо літери, то класи будуть упорядковані в алфавітному порядку, а якщо слова, то класи будуть упорядковані відповідно до значень слів.

Наприклад, у § 5.3 наводиться приклад порядкової шкали для опису якості житлових умов із чотирма градаціями (класами): «погане», «задовільне», «хороше», «дуже хороше». Природно, що ці класи могли бути занумеровані числами 1,2,3,4, або 4,3,2,1, або літерами а,б,в,г тощо.

Іншими відомими прикладами порядкових шкал є: у медицині – шкала стадій гіпертонічної хвороби за М'ясниковим, шкала ступенів серцевої недостатності за Стражеськом – Василенком – Лангом, шкала ступеня вираженості коронарної недостатності за Фогельсоном; у мінералогії - шкала Моосу (тальк -1, гіпс - 2, кальцит - 3, флюорит - 4, апатит - 5, ортоклаз - 6, кварц - 7, топаз - 8, корунд - 9, алмаз - 10), за якою мінерали класифікуються згідно з критерієм твердості; у географії – бофортова шкала вітрів («штиль», «слабкий вітер», «помірний вітер» тощо).

Структура порядкової шкали не руйнується за будь-якого взаємно-однозначного перетворення кодів, яке зберігає порядок. Так само, як і у разі номінальної шкали, арифметичні операції не зберігають свого сенсу при перетворенні порядкових шкал, тому бажано не користуватися ними. Неважко показати, що спиратися лише на властивості шкал і залучати додаткових, зовнішніх стосовно шкалам міркувань, то єдиними дозволеними статистиками під час використання порядкових шкал є члени варіаційного ряду .

10.2.3. Кількісні шкали.

Шкала, в якій можна відобразити, наскільки за ступенем вираженості заданої властивості один з об'єктів відрізняється від іншого, називається інтервальною. Для того щоб задати інтервальну шкалу, треба визначити об'єкти, що відповідають початковій точці та одиниці виміру. І далі при вимірі ставити у відповідність кожному об'єкту число, що показує, на скільки одиниць виміру цей об'єкт відрізняється від об'єкта, прийнятого за початкову точку. Найпростішим прикладом інтервальної шкали є температура градусах Цельсія, де 0° - початкова точка і 1° - одиниця виміру.

Структура інтервальної шкали не змінюється при лінійних перетвореннях виду Ефект такого перетворення полягає у зрушенні початкової точки на одиниць b і множенні одиниці вимірювання на а.

Наприклад, шляхом перетворення де - температура можна перейти до температури в градусах Фаренгейта.

Якщо початок в інтервальній шкалі є абсолютною нульовою точкою, виникає можливість відобразити в шкалі, у скільки разів один вимір відрізняється від іншого. Відповідна шкала називається шкалою стосунків. Шкала відносин допускає перетворення виду. Більшість шкал, що використовуються у фізиці, є або інтервальними (для вимірювання температури, потенційної енергії), або шкалами відносин (для вимірювання часу, маси тіла, заряду, відстані).

Оскільки кількісні шкали допускають арифметичні перетворення, середнє арифметичне може використовуватися для опису інтегральної тенденції групування даних.

10.2.4. Уніфіковане подання різнотипних даних.

Кожному типу шкали відповідає своя статистична техніка. Так, для змінних, виміряних у номінальній шкалі, можна використовувати -критерій для поліноміальних розподілів, -критерій для перевірки відсутності асоціацій у таблицях сполученості, критерії для перевірки гіпотез про ймовірність біномного розподілу. Порядковій шкалі відповідають методи, засновані на використанні рангів (рангова кореляція, непараметричні критерії для перевірки гіпотез типу) тощо. При інтервальній шкалі можна використовувати весь арсенал статистичних методів.

Більше того, розроблено статистичні процедури для випадків, коли спостерігаються вектори, одні координати яких виміряно в одній шкалі, а інші – в іншій. Типовим прикладом є звичайний дисперсійний аналіз (див. § 3.5), в якому фактори вимірюються в номінальній шкалі, а відповідні їх комбінаціям відгуки – в інтервальній.

Проте загалом низці статистичних методів, особливо у сучасних методах багатовимірного аналізу, передбачається, що дані виміряно в однотипних шкалах. Щоб мати можливість застосовувати ці методи у випадку різнотипних даних, були запропоновані різні прийоми уніфікації даних. Познайомимось із найважливішими з них.

Зведення до двійкових змінних. В основі цього методу лежить введення замість кожної вихідної випадкової змінної серії випадкових величин, що приймають лише два значення: 0 та 1.

Для номінальної величини має k градацій вводиться k таких величин що коли

Цей прийом іноді використовують і при зведенні до двійкових змінних випадкової величини, виміряної в порядковій шкалі. Однак у ряді випадків виявляється зручним виділяти не подія, а подія. Для порівняння відносних переваг цих двох способів розглянемо наступне модельне завдання. Нехай - рівномірно розподілена на відрізку випадкова величина - мале число;

Функція моделює, очевидно, перший спосіб початку двійковим змінним, а функція - другий. Після нескладних підрахунків отримуємо:

Основний недолік викладеної техніки - це введення великої кількості нових змінних і часткова втрата інформації, що міститься в даних як через квантування, так і через штучне зниження рівня використовуваної шкали.

Оцифрування номінальних та порядкових змінних. Цей метод прямо протилежний щойно викладеному, у ньому всі змінні піднімаються, підтягуються рівня кількісних шляхом приписування їх градаціям числових значень. Іноді значення, що приписуються, називають мітками.

Вибір міток суттєво залежить від мети, з якою проводиться оцифрування. Так, якщо вивчається величина зв'язку між двома номінальними ознаками, то мітки можна вибрати з умови максимізації коефіцієнта кореляції між ними. Якщо йдеться про віднесення спостережень до одного з наперед визначених класів (дискримінантний аналіз), то вибір міток можна пов'язати з умовою максимізації нормованої відстані в багатовимірному вибірковому просторі між центрами популяцій, що вивчаються (відстань Махаланобіса). Іноді це завдання спрощують і мітки приписуються покоординатно так, щоб максимізувати нормовану відстань між середніми значеннями даної координати. Статистичне порівняння з прикладу однієї приватної завдання ефективності глобального і покоординатного підходи до оцифровці в дискримінантному аналізі можна знайти в .

Викладені прийоми оцифрування, коли мітки вибираються з умови максимізації відповідним чином підібраного функціоналу, укладаються у рамки згаданого § 1.2 екстремального підходу до формулювання основних проблем математичної статистики.

У цілому нині оцифрування якісних змінних є складною як у обчислювальному, і у суто статистичному плані. Окремі аспекти цієї проблеми обговорюються у роботах.