Campione illustrativo. Campione rappresentativo. Un esempio di campione non rappresentativo

Il concetto di "rappresentanza" in relazione ai sondaggi sociologici - sondaggi di opinione pubblica - ha un effetto quasi magico sulle persone. Il termine stesso “rappresentazione” ha, oltre che scientifico, anche un significato chiaramente politico.

Qual è il motivo? Il fatto è che si presume che il campione (un gruppo di persone selezionate per l'indagine) possa rappresentare (rappresentare) l'intera popolazione. La popolazione generale nel caso dei sondaggi tutti russi è l'intera popolazione del paese. Ora immaginiamo di parlare di una decisione politica: sostenere un disegno di legge o votare alle elezioni. Con l'aiuto di un'indagine campionaria, otteniamo un eccellente meccanismo di rappresentanza politica, un meccanismo in cui un piccolo gruppo di persone può rappresentare l'opinione o la posizione dell'intera popolazione del paese. Pertanto, la rappresentatività dello studio ha un posto così importante.

Il concetto di rappresentatività è usato, ovviamente, non solo negli studi politici. Il termine è quasi sempre usato quando si parla di studi di grandi dimensioni, siano essi nel campo del marketing, del comportamento economico o dell'istruzione.

Metodologia delle indagini rappresentative

Come, dopo aver intervistato 1.500 persone, si possono trarre conclusioni su tutti i russi, di cui sono più di 140 milioni (e addirittura più di 110 milioni di elettori)? La tecnologia alla base dei sondaggi rappresentativi si basa su leggi statistiche. La ragione più vicina è la legge dei grandi numeri, o il teorema di Bernoulli.

Semplificato, il suo significato può essere espresso come segue. Supponiamo di avere qualche caratteristica, ad esempio, la quantità di precipitazioni giornaliere a Ekaterinburg durante il 20° secolo. Se scriviamo tutti i suoi valori insieme alla loro frequenza (questa è chiamata distribuzione) e poi prendiamo a caso abbastanza gran numero casi (cioè non tutti i giorni del 20° secolo, ma parecchi), allora vedremo che la distribuzione nel nostro campione sarà molto simile a quella dell'intero 20° secolo. Pertanto, se selezioniamo alcune unità della popolazione, esse possono effettivamente rappresentare l'intera popolazione e non è realmente necessario raccogliere dati per tutti i casi.

Tuttavia, c'è una condizione fondamentale: questo è vero solo se la selezione è rigorosamente casuale. L'unico problema qui potrebbe essere la deviazione dalla casualità. Quindi, se prendiamo solo i dati delle precipitazioni per l'anno scorso(perché ad esempio perché questi dati sono più facili da reperire) oppure intervistiamo 1500 nostri conoscenti (perché è più facile contattarli), e non persone a caso, allora il campione non sarà di certo rappresentativo.

Immagina che su 143,5 milioni di russi selezioni casualmente le 1.500 persone di cui hai bisogno. Quindi, ad esempio, la proporzione di quadri intermedi tra loro sarà approssimativamente uguale alla proporzione di quadri nella popolazione generale, il che mostra che il tuo campione può rappresentare l'intera popolazione. Può succedere che questi due indicatori siano molto diversi? Ad esempio, tra i russi è del 14%, ma nel campione sarà solo dell'1%? Teoricamente, questo è possibile, ma la probabilità che ciò accada è così piccola che può essere trascurata (come incontrare un drago per strada).

Inoltre, la cosa più piacevole di questa probabilità non è nemmeno che sia piccola, ma che per processi casuali questa probabilità può essere calcolata. Possiamo dire con quale probabilità il nostro valore campionario si discosterà dal valore nella popolazione generale del 13% (come nell'esempio sopra) e con quale, diciamo, del 2,5%. Di solito, però, fanno il contrario: prima determinano la probabilità con cui vogliamo che il nostro valore non si discosti dal valore nella popolazione generale (il più delle volte è fissato al livello del 95%), e poi guardano l'entità della deviazione per campioni di una particolare dimensione. Questa deviazione è chiamata intervallo di confidenza, a volte indicato come errore di campionamento o errore statistico, ed è spesso elencato insieme ai risultati del sondaggio.

Quindi, la probabilità di deviazione, la quantità di deviazione (intervallo di confidenza) e la dimensione del campione sono correlate. Sulla base di ciò, la formula per calcolare la dimensione del campione è la seguente:

dove n è la dimensione del campione, Δ è l'intervallo di confidenza, z è il valore della funzione di distribuzione normale per una data probabilità di rifiuto (per una probabilità del 5%, questo valore è 1,96).

Questa è una formula semplificata, i sondaggi reali ne usano leggermente di più formule complesse. Questa formula può anche fallire se il valore dell'indicatore è molto diverso dal 50% (quindi, ad esempio, questa formula non è adatta per stimare la percentuale di pazienti con una malattia rara in un paese).

Ecco cosa succede se sostituisci alcuni valori in questa formula:

In altre parole, se prendiamo un campione casuale di russi con una dimensione di 1600 persone e stimiamo qualche indicatore, ad esempio la volontà di votare per un determinato politico, allora con una probabilità del 95% la nostra stima non differirà dalla volontà a votare per lui tra tutti i russi di oltre il 2,45%.

Misura di prova

E allora taglia più grande campione, più è probabile che ci avviciniamo a una quota nella popolazione. Sembrerebbe che questo significhi che bisogna cercare di avvicinare il campione a 143,5 milioni, infatti, come si può notare dalla tabella, la natura dei processi casuali è tale che da un certo momento la probabilità di cadere nell'intervallo inizia ad aumentare molto lentamente (e questo momento arriva abbastanza velocemente). Dopo aver campionato 1500 unità, non importa quanto aumentiamo la dimensione del campione, la probabilità che il nostro valore campionario rientri nel valore della popolazione aumenterà molto, molto lentamente.

In effetti, non c'è quasi nessuna differenza tra 1.500 e 10.000 intervistati. Da qualche parte nel 1500 possiamo già affermare che le nostre stime differiranno dalla quota nella popolazione generale del 2-3%. Se aumentiamo ulteriormente il campione, questo possibile errore diminuirà, ma leggermente. In altre parole, un campione di 100.000 è meglio di un campione di 2500, ma la differenza è così piccola che non ha senso e, nel caso delle indagini sociali, non è giustificata economicamente. Di solito, aumentare il campione è costoso, e quindi non ha senso gonfiarlo per guadagnare un punto percentuale nel valore dell'intervallo di confidenza.

È importante che nella formula non compaia affatto la dimensione della popolazione generale. Il fatto è che quando la popolazione è numerosa (più di 20.000), ha poco o nessun effetto sulla dimensione del campione. Pertanto, non è necessario sapere quante persone vivono in Russia per costruire un campione rappresentativo. È chiaro che scegliere 1500 su 2000 molto probabilmente non ha senso: è più facile esaminare 2000 e ottenere una stima accurata. Ma, se necessario, facendo un campione, abbiamo l'opportunità di generalizzare i suoi risultati per la popolazione generale. E per lo stesso motivo, la dimensione del campione non differirà per i paesi grandi e piccoli.

Rappresentatività e Precisione

Per comprendere il significato del concetto di "rappresentatività", consideriamo un campione di 15 persone. Stranamente, se l'hai fatto per caso, è anche rappresentativo. Inoltre, puoi fare un campione di un'unità. Immagina una scatola di palline da cui estrai una pallina a caso. Se si tratta di una pallina scelta a caso, rappresenterà anche tutte le palline che si trovano in questa casella. Li rappresenterà solo. non esattamente. Come mai? Perché c'è un'altissima probabilità di sbagliare. La prossima volta possiamo disegnare un'altra palla e avere un'idea diversa delle palline nella scatola. Rappresentare in modo impreciso significa avere una vasta gamma di stime.

Allo stesso modo, 15 persone rappresentano qualsiasi popolazione generale, ma la rappresentano in modo impreciso, perché l'errore, l'intervallo di confidenza, è molto grande. Dovremo aggiungere +/- 33% per avere una probabilità del 95% di cadere nell'intervallo. Se siamo pronti ad ammetterlo, prendiamo 15 persone, scopriamo che 7 di loro sono quadri e poi otteniamo una stima che 7/15 del totale, cioè il 47% +/- 33%, è la quota stimata dei dirigenti nella popolazione generale, e questa è una conclusione assolutamente corretta. Semplicemente non ha valore. Questo potremmo dire senza esame. Pertanto, quando si pianifica un campione, ha senso ottenere un volume adeguato in termini di rapporto costo-efficacia.

Tutto quanto sopra ha lo scopo di trasmettere un'idea semplice, che molto spesso non viene realizzata: la dimensione del campione non è correlata alla sua rappresentatività.

Un piccolo campione è impreciso, ma può comunque essere rappresentativo. Le dimensioni del campione utilizzate oggi nei sondaggi di massa in Russia hanno quasi sempre un'accuratezza abbastanza elevata.

La rappresentatività del campione è minacciata non dalla sua dimensione, ma dalla distorsione, cioè dalla deviazione dal principio di casualità.

Violazione del principio di casualità

Se iniziamo a scegliere le unità in modo non casuale, il campione diventa non rappresentativo. Ad esempio, se qualcosa ci impedisce di selezionarli a caso. Immagina di voler selezionare le palline dalla nostra scatola a caso, ma poi si scopre che alcune delle palline mordono. Il meccanismo con cui prenderemo solo quelle biglie che ci vengono date è un meccanismo che viola la casualità e quindi viola la rappresentatività. In questo caso, non importa quante biglie prendiamo dalla scatola (anche se prendiamo tutte le biglie che non mordono), avremo un campione non rappresentativo, perché non conteremo nessuna di quelle che mordono - semplicemente bypassano il nostro campione

Il problema più grande con le palle da mordere è che possono essere diverse da quelle che ci vengono in mano e differiscono esattamente nel modo in cui siamo interessati. Questa situazione è chiamata distorsione di campionamento.

Occorre distinguere la situazione di rappresentazione inesatta, che abbiamo sopra descritto, dalla situazione di non rappresentazione. Questi sono problemi diversi e hanno soluzioni diverse. Non puoi risolverne uno risolvendo l'altro. Se il campione manca di rappresentatività, è inutile aumentarlo. Inoltre, campioni di grandi dimensioni nelle indagini sociali tendono ad accumulare errori, quindi il problema della rappresentazione può essere esacerbato solo da un forte aumento della dimensione del campione.

Perché la rappresentatività è impossibile?

Nelle note alle tabelle con i risultati delle indagini si può spesso notare che "la dimensione del campione è di 1600 persone, il campione è rappresentativo del sesso e dell'età". Da quanto detto sopra, è evidente che si tratta di due parametri diversi: un'indicazione di rappresentatività non è correlata alla dimensione campionaria. In realtà, qui si intende che sono state seguite alcune procedure al fine di garantire la corrispondenza tra il campione e la popolazione. Ad esempio, al fine di garantire la rappresentatività per sesso, uomini e donne sono reclutati nel campione nelle stesse proporzioni che esistono tra i russi secondo i dati del censimento. Ma rappresentatività per sesso non significa rappresentatività, ad esempio, per opinioni politiche.

Perché è necessario allineare il campione per genere e altre categorie socio-demografiche? Perché solo un campione casuale può fornire una vera rappresentatività ed è impossibile implementarlo nella pratica per molte ragioni. Non appena provi a farlo, incontrerai molti problemi, indipendentemente dal metodo che scegli di utilizzare. Alcuni intervistati saranno del tutto inaccessibili al tuo metodo (ad esempio, per interviste personali grande problema sono case con citofoni e sicurezza), un'altra parte sarà assente, non risponderà, o preferirà svolgere i propri affari. Ci sono persone che hanno problemi di lingua e non possono parlarci. Ci sono persone che non capiscono perché questo sia necessario e non vogliono parlare con noi. Tutte queste sono gravi violazioni della casualità, che ne rendono impossibile la realizzazione.

Chi riduce a statistica il problema della rappresentazione nei sondaggi di massa dimentica che le persone sono marmi ben precisi. Ci sono palle che corrono e si nascondono. Ci sono palle che mordono. Non sono oggetti passivi, reagiscono. Dicono: "Non voglio partecipare al tuo sondaggio", violando così la casualità. Pertanto, nel senso stretto della parola, la rappresentatività nei sondaggi di massa, ovviamente, è impossibile in qualsiasi forma.

È stato sviluppato un meccanismo mediante il quale viene solitamente assicurata l'apparenza di rappresentatività: allineiamo il campione in alcune categorie e facciamo finta che sia allineato anche in tutte le altre categorie possibili. In realtà, non abbiamo motivo di affermarlo. Ma il problema è che non c'è modo di verificarlo, di nuovo, a causa del fatto che alcune palle mordono. Per verificare la presenza di pregiudizi, l'esaminatore dovrebbe andare da coloro che non abbiamo intervistato e intervistarli. Ma loro, come ricordiamo, non vogliono affatto essere interrogati. È impossibile interrogare chi categoricamente non risponde. Pertanto, tutti lavorano partendo dal presupposto che se allineiamo il campione su due o tre parametri, esso rappresenti l'intera popolazione, sebbene non vi siano basi serie per questa ipotesi.

Il campionamento rappresentativo è una tecnologia mutuata dai sociologi dalla statistica. Pertanto, porta inevitabilmente elementi del quadro matematico e statistico del mondo. Forse il presupposto più forte è che l'indagine campionaria stessa sia politicamente e sociologicamente neutra: la partecipazione e la non partecipazione all'indagine non ha un significato politico e non è correlata ad altri parametri sociologicamente importanti. Ma oggi i sondaggi sono diventati una delle principali istituzioni politiche e sono diventati un intermediario chiave tra le grandi aziende e i consumatori. In queste condizioni, non è più possibile credere alla loro sterilità politica. Tuttavia, sappiamo ancora poco su come vengono intesi i sondaggi società moderne e cosa rappresentano effettivamente.

Il campionamento in 1C 8.2 e 8.3 è un modo specializzato per ordinare i record delle tabelle dell'infobase. Diamo un'occhiata più da vicino a cosa è il campionamento e come usarlo.

Che cos'è un campione in 1C?

Campione- un modo per ordinare le informazioni in 1C, che consiste nel posizionare in sequenza il cursore sul record successivo. Una selezione in 1C può essere ottenuta dal risultato della query e dal gestore oggetti, ad esempio documenti o directory.

Un esempio di recupero e iterazione da un gestore oggetti:

Selezione = Directory. Banche. Scegliere() ; Mentre la selezione. Avanti() Ciclo EndCycle ;

Un esempio di come ottenere una selezione da una query:

Ricevi gratuitamente 267 videolezioni 1C:

Richiesta = Nuova richiesta( "Seleziona collegamento, codice, nome da directory. Banche") ; Campione = Richiesta. Eseguire() . Scegliere() ; Mentre la selezione. Avanti() Ciclo //esegui azioni interessanti con la directory "Banche". ciclo finale;

Entrambi gli esempi precedenti ottengono gli stessi set di dati su cui eseguire l'iterazione.

Metodi di campionamento 1C 8.3

La selezione ha un gran numero di metodi, consideriamoli più in dettaglio:

  • Scegliere()- un metodo mediante il quale si ottiene direttamente un campione. Dalla selezione è possibile ottenere un'altra selezione subordinata se è specificato il tipo di bypass "per raggruppamento".
  • Proprietario()è il metodo inverso di Select(). Consente di ottenere la selezione della query "principale".
  • Prossimo()- un metodo che sposta il cursore sul record successivo. Restituisce True se il record esiste, False se non ci sono più record.
  • Trova il prossimo()- un metodo molto utile con il quale puoi scorrere solo i campi necessari in base al valore della selezione (selezione - struttura del campo).
  • SuccessivoPerValoreCampo()- permette di ottenere il record successivo con un valore diverso dalla posizione corrente. Ad esempio, è necessario ordinare tutti i record con un valore univoco del campo "Account": Selection.NextBy FieldValue ("Account").
  • Ripristina()- consente di ripristinare la posizione corrente del cursore e di riportarlo nella posizione originale.
  • Quantità()- restituisce il numero di record nella selezione.
  • Ottenere()- utilizzando il metodo è possibile posizionare il cursore sul record desiderato in base al valore dell'indice.
  • Livello() - livello nella gerarchia della voce corrente (numero).
  • Tipo di registrazione()— visualizza il tipo di record — DetailRecord, GroupTotal, HierarchyTotal o GrandTotal
  • raggruppamento()- restituisce il nome del raggruppamento corrente, se il record non è un raggruppamento - una stringa vuota.

Se stai iniziando a imparare la programmazione 1C, ti consigliamo il nostro corso gratuito(non dimenticare

Accade spesso che sia necessario analizzare un particolare fenomeno sociale e ottenere informazioni su di esso. Spesso vengono fuori lavori come questo...

Il campionamento è ... Definizione, tipi, metodi e risultati del campionamento

A cura di Masterweb

09.04.2018 16:00

Accade spesso che sia necessario analizzare un particolare fenomeno sociale e ottenere informazioni su di esso. Tali compiti sorgono spesso nelle statistiche e in studi statistici. La verifica di un fenomeno sociale pienamente definito è spesso impossibile. Ad esempio, come scoprire l'opinione della popolazione o di tutti i residenti di una determinata città su qualsiasi questione? Chiedere assolutamente a tutti è quasi impossibile e molto laborioso. In questi casi, abbiamo bisogno di un campione. Questo è esattamente il concetto su cui si basano quasi tutte le ricerche e le analisi.

Che cos'è un campione

Quando si analizza un particolare fenomeno sociale, è necessario ottenere informazioni su di esso. Se prendiamo uno studio, possiamo vedere che non tutte le unità della totalità dell'oggetto di studio sono soggette a ricerca e analisi. Viene presa in considerazione solo una certa parte di questa totalità. Questo processo è il campionamento: quando vengono esaminate solo alcune unità dell'insieme.

Naturalmente, molto dipende dal tipo di campione. Ma ci sono anche regole di base. Il principale dice che la selezione dalla popolazione deve essere assolutamente casuale. Le unità di popolazione da utilizzare non dovrebbero essere selezionate a causa di alcun criterio. In parole povere, se è necessario raccogliere una popolazione dalla popolazione di una certa città e selezionare solo uomini, allora ci sarà un errore nello studio, perché la selezione non è stata effettuata in modo casuale, ma è stata selezionata in base al genere. Quasi tutti i metodi di campionamento si basano su questa regola.

Regole di campionamento

Affinché l'insieme prescelto rispecchi le principali qualità dell'intero fenomeno, esso deve essere costruito secondo leggi specifiche, dove l'attenzione principale dovrebbe essere rivolta alle seguenti categorie:

  • campione (popolazione campione);
  • popolazione generale;
  • rappresentatività;
  • errore di rappresentatività;
  • unità di popolazione;
  • metodi di campionamento.

Le caratteristiche dell'osservazione selettiva e del campionamento sono le seguenti:

  1. Tutti i risultati ottenuti si basano su leggi e regole matematiche, ovvero con il corretto svolgimento dello studio e con i corretti calcoli i risultati non verranno distorti su base soggettiva
  2. Consente di ottenere un risultato molto più velocemente e con meno tempo e risorse, studiando non l'intera matrice degli eventi, ma solo una parte di essi.
  3. Può essere utilizzato per studiare vari oggetti: da questioni specifiche, ad esempio, l'età, il sesso del gruppo di nostro interesse, allo studio dell'opinione pubblica o al livello di sostegno materiale della popolazione.

Osservazione selettiva

Selettivo: questa è un'osservazione statistica in cui non l'intera popolazione studiata è sottoposta a ricerca, ma solo una parte di essa, selezionata in un certo modo, e i risultati dello studio di questa parte si applicano all'intera popolazione. Questa parte è chiamata frame di campionamento. Questo è l'unico modo per studiare una vasta gamma dell'oggetto di studio.

Ma l'osservazione selettiva può essere utilizzata solo nei casi in cui è necessario studiare solo un piccolo gruppo di unità. Ad esempio, quando si studia il rapporto tra uomini e donne nel mondo, verrà utilizzata l'osservazione selettiva. Per ovvie ragioni, è impossibile prendere in considerazione ogni abitante del nostro pianeta.

Ma con lo stesso studio, ma non di tutti gli abitanti della terra, ma di una certa classe 2 "A" in una determinata scuola, una determinata città, un determinato paese, si può fare a meno dell'osservazione selettiva. Dopotutto, è del tutto possibile analizzare l'intera matrice dell'oggetto di studio. È necessario contare i ragazzi e le ragazze di questa classe: questo sarà il rapporto.


Campione e popolazione

In realtà non è così difficile come sembra. In ogni oggetto di studio esistono due sistemi: popolazione generale e campione. Che cos'è? Tutte le unità appartengono al generale. E al campione - quelle unità della popolazione totale che sono state prese per il campione. Se tutto viene eseguito correttamente, la parte selezionata sarà un layout ridotto dell'intera popolazione (generale).

Se parliamo di popolazione generale, possiamo distinguere solo due delle sue varietà: popolazione generale definita e indefinita. Dipende dal fatto che il numero totale di unità di un dato sistema sia noto o meno. Se si tratta di una determinata popolazione, il campionamento sarà più semplice poiché si sa di quale percentuale totale le unità saranno campionate.

Questo momento è molto necessario nella ricerca. Ad esempio, se è necessario indagare sulla percentuale di prodotti dolciari di bassa qualità in un determinato stabilimento. Supponiamo che la popolazione sia già stata definita. È noto per certo che questa impresa produce 1000 prodotti dolciari all'anno. Se produciamo un campione di 100 prodotti dolciari casuali da questo migliaio e li inviamo per un esame, l'errore sarà minimo. In parole povere, il 10% di tutti i prodotti è stato oggetto di ricerca e in base ai risultati, tenendo conto dell'errore di rappresentatività, si può parlare di scarsa qualità di tutti i prodotti.

E se prendi un campione di 100 prodotti dolciari da una popolazione generale indefinita, dove in realtà c'erano, diciamo, 1 milione di unità, il risultato del campione e lo studio stesso saranno criticamente poco plausibili e imprecisi. Senti la differenza? Pertanto, la certezza della popolazione generale nella maggior parte dei casi è estremamente importante e influisce notevolmente sul risultato dello studio.


Rappresentatività della popolazione

Quindi, ora una delle domande più importanti: quale dovrebbe essere il campione? Questo è il punto più importante dello studio. In questa fase, è necessario calcolare il campione e selezionare le unità da numero totale dentro di lei. La popolazione è stata selezionata correttamente se nel campione rimangono determinate caratteristiche e caratteristiche della popolazione generale. Questo si chiama rappresentatività.

In altre parole, se, dopo la selezione, una parte conserva le stesse tendenze e caratteristiche dell'intera quantità degli esaminati, allora tale popolazione è chiamata rappresentativa. Ma non tutti i campioni specifici possono essere selezionati da una popolazione rappresentativa. Ci sono anche tali oggetti di ricerca, il cui campione semplicemente non può essere rappresentativo. Da qui deriva il concetto di errore di rappresentatività. Ma parliamo di questo un po' di più.

Come fare un campione

Quindi, per massimizzare la rappresentatività, ci sono tre regole di campionamento di base:

  1. L'indicatore più unico del numero del campione è considerato il 20%. Un campione statistico del 20% darà quasi sempre un risultato il più vicino possibile alla realtà. Allo stesso tempo, non è necessario trasferire alla parte più ampia raccolta della popolazione generale. Il 20% del campione è la cifra che è stata sviluppata da molti studi. Diamo un'occhiata a qualche altra teoria. Più grande è il campione, minore è l'errore di rappresentatività e più accurato è il risultato dello studio. Più la popolazione campione è vicina alla popolazione generale in termini di numero di unità, più accurati e corretti saranno i risultati. Dopotutto, se esamini l'intero sistema, il risultato sarà del 100%. Ma non c'è selezione qui. Questi sono quegli studi in cui viene esaminato l'intero array, tutte le unità, quindi questo non ci interessa.
  2. In caso di inopportunità di elaborazione del 20% della popolazione generale, è consentito studiare unità della popolazione per un importo di almeno 1001. Questo è anche uno degli indicatori dello studio della matrice dell'oggetto di studio , che si è sviluppato nel tempo. Naturalmente, non darà risultati accurati con una vasta gamma di ricerche, ma lo avvicinerà il più possibile alla possibile accuratezza del campione.
  3. Ci sono molte formule e tabulazioni nelle statistiche. A seconda dell'oggetto di studio e del criterio di campionamento, è opportuno scegliere l'una o l'altra formula. Ma questo oggetto viene utilizzato in studi complessi ea più stadi.

Errore (errore) di rappresentatività

La caratteristica principale della qualità del campione selezionato è il concetto di "errore di rappresentatività". Che cos'è? Si tratta di alcune discrepanze tra gli indicatori di osservazione selettiva e continua. Secondo gli indicatori di errore, la rappresentatività è divisa in affidabile, ordinaria e approssimativa. In altre parole, sono accettabili deviazioni rispettivamente fino al 3%, dal 3 al 10% e dal 10 al 20%. Sebbene nelle statistiche sia auspicabile che l'errore non superi il 5-6%. In caso contrario, vi è motivo di parlare di insufficiente rappresentatività del campione. Per calcolare l'errore di rappresentatività e il modo in cui influisce su un campione o una popolazione, vengono presi in considerazione molti fattori:

  1. La probabilità con cui si deve ottenere un risultato accurato.
  2. Numero di unità di campionamento. Come accennato in precedenza, minore è il numero di unità nel campione, maggiore sarà l'errore di rappresentatività e viceversa.
  3. Omogeneità della popolazione in studio. Più eterogenea è la popolazione, maggiore sarà l'errore di rappresentatività. La capacità di una popolazione di essere rappresentativa dipende dall'omogeneità di tutte le sue unità costitutive.
  4. Un metodo per selezionare le unità in una popolazione campione.

Negli studi specifici, l'errore percentuale della media è solitamente impostato dallo sperimentatore stesso, in base al programma di osservazione e in base ai dati di studi precedenti. Di norma si considera accettabile l'errore massimo di campionamento (errore di rappresentatività) compreso tra il 3 e il 5%.


Di più non è sempre meglio

Vale anche la pena ricordare che la cosa principale nell'organizzazione dell'osservazione selettiva è portare il suo volume a un minimo accettabile. Allo stesso tempo, non ci si deve sforzare di ridurre eccessivamente i limiti di errore di campionamento, poiché ciò può comportare un aumento ingiustificato della quantità di dati campionari e, di conseguenza, un aumento del costo del campionamento.

Allo stesso tempo, la dimensione dell'errore di rappresentatività non dovrebbe essere aumentata eccessivamente. Dopotutto, in questo caso, sebbene ci sarà una diminuzione della dimensione del campione, ciò comporterà un deterioramento dell'affidabilità dei risultati ottenuti.

Quali domande vengono solitamente poste dal ricercatore?

Qualsiasi ricerca, se effettuata, è per uno scopo e per ottenere dei risultati. Quando si conduce un'indagine campionaria, di norma, le domande iniziali sono:

  1. Definizione importo richiesto unità di campionamento, ovvero quante unità verranno esaminate. Inoltre, per uno studio accurato, la popolazione deve essere rappresentativa.
  2. Calcolo dell'errore di rappresentatività con il livello di probabilità stabilito. Va notato subito che gli studi selettivi non vengono eseguiti con un livello di probabilità del 100%. Se l'autorità che ha condotto lo studio di un particolare segmento afferma che i suoi risultati sono accurati con una probabilità del 100%, allora questa è una bugia. Molti anni di pratica hanno già stabilito la percentuale di probabilità di uno studio campionario condotto correttamente. Questa cifra è del 95,4%.

Modalità di selezione delle unità di ricerca nel campione

Non tutti i campioni sono rappresentativi. A volte uno stesso segno si esprime diversamente nel tutto e nelle sue parti. Per raggiungere i requisiti di rappresentatività, si consiglia di utilizzare vari trucchi creando un campione. Inoltre, l'uso di un metodo o dell'altro dipende dalle circostanze specifiche. Alcuni di questi metodi di campionamento includono:

  • selezione casuale;
  • selezione meccanica;
  • selezione tipica;
  • selezione seriale (nidificata).

La selezione casuale è un sistema di attività finalizzato alla selezione casuale delle unità della popolazione, quando la probabilità di essere inclusi nel campione è uguale per tutte le unità della popolazione generale. Questa tecnica è consigliabile da applicare solo nel caso di omogeneità e un numero limitato delle sue caratteristiche intrinseche. Altrimenti, alcuni tratti caratteriali rischio di non essere inclusi nel campione. Le caratteristiche della selezione casuale sono alla base di tutti gli altri metodi di campionamento.

Con la selezione meccanica delle unità viene eseguita a un certo intervallo. Se è necessario formare un campione di reati specifici, è possibile rimuovere ogni 5a, 10a o 15a tessera da tutte le registrazioni statistiche dei reati registrati, a seconda del loro numero totale e delle dimensioni campionarie disponibili. Lo svantaggio di questo metodo è che prima della selezione è necessario avere un resoconto completo delle unità della popolazione, quindi è necessario condurre una graduatoria e solo dopo è possibile campionare a un certo intervallo. Questo metodo richiede molto tempo, quindi non viene utilizzato spesso.


La selezione tipica (regionale) è un tipo di campione in cui la popolazione generale è divisa in gruppi omogenei secondo un determinato attributo. A volte i ricercatori usano altri termini invece di "gruppi": "distretti" e "zone". Quindi, da ciascun gruppo, viene selezionato casualmente un certo numero di unità in proporzione alla quota del gruppo nella popolazione totale. Una selezione tipica viene spesso effettuata in più fasi.

Il campionamento seriale è un metodo in cui la selezione delle unità viene effettuata in gruppi (serie) e tutte le unità del gruppo selezionato (serie) sono soggette a esame. Il vantaggio di questo metodo è che a volte è più difficile selezionare le singole unità rispetto alle serie, ad esempio quando si studia una persona che sta scontando una pena. All'interno delle aree, zone selezionate, si applica lo studio di tutte le unità senza eccezioni, ad esempio lo studio di tutte le persone che scontano pene in un particolare istituto.

Via Kievyan, 16 0016 Armenia, Yerevan +374 11 233 255

Campione o cornice di campionamento- un insieme di casi (soggetti, oggetti, eventi, campioni), secondo una determinata procedura, selezionati dalla popolazione generale per la partecipazione allo studio.

Caratteristiche del campione:

§ Caratteristiche qualitative del campione: chi scegliamo esattamente e quali metodi di costruzione del campione utilizziamo per questo.

§ Caratteristiche quantitative del campione - quanti casi scegliamo, in altre parole, la dimensione del campione.

Necessità di campionamento

§ L'oggetto di studio è molto ampio. Ad esempio, i consumatori dei prodotti di un'azienda globale sono un numero enorme di mercati geograficamente dispersi.

§ È necessario raccogliere le informazioni primarie.

Misura di prova

Misura di prova- il numero di casi inclusi nel campione. Per ragioni statistiche, si raccomanda che il numero di casi sia almeno 30-35.

Campioni dipendenti e indipendenti

Quando si confrontano due (o più) campioni, la loro dipendenza è un parametro importante. Se è possibile stabilire una coppia omomorfa (cioè quando un caso del campione X corrisponde a uno e un solo caso del campione Y e viceversa) per ogni caso in due campioni (e questa base di relazione è importante per il tratto misurati nei campioni), vengono chiamati tali campioni dipendente. Esempi di selezioni dipendenti:

§ coppie di gemelli,

§ due misurazioni di qualsiasi caratteristica prima e dopo l'esposizione sperimentale,

§ mariti e mogli

Se non esiste tale relazione tra i campioni, vengono presi in considerazione questi campioni indipendente, Per esempio:

§ uomini e donne,

§ psicologi e matematici.

Di conseguenza, i campioni dipendenti hanno sempre la stessa dimensione, mentre la dimensione dei campioni indipendenti può differire.

I campioni vengono confrontati utilizzando vari criteri statistici:

§ Test t dello studente

§ Test di Wilcoxon

§ Test U di Mann-Whitney

§ Criterio del segno

Rappresentatività

Il campione può essere considerato rappresentativo o non rappresentativo.

Un esempio di campione non rappresentativo

Negli Stati Uniti, uno degli esempi storici più famosi di campionamento non rappresentativo è considerato un incidente avvenuto durante elezioni presidenziali nel 1936. Il Litrery Digest, che aveva previsto con successo gli eventi di diverse elezioni precedenti, ha valutato male le sue previsioni inviando dieci milioni di schede di prova ai suoi abbonati, nonché a persone selezionate dagli elenchi telefonici di tutto il paese e dalle liste di immatricolazione delle auto. Nel 25% delle schede restituite (quasi 2,5 milioni), i voti sono stati distribuiti come segue:

§ Il 57% ha favorito il candidato repubblicano Alf Landon

§ Il 40% scelse l'allora presidente democratico Franklin Roosevelt

Come è noto, Roosevelt ha vinto le elezioni effettive con oltre il 60% dei voti. L'errore del Litreary Digest è stato questo: volendo aumentare la rappresentatività del campione - perché sapevano che la maggior parte degli abbonati si considerava repubblicano - hanno ampliato il campione con persone selezionate da elenchi telefonici e liste di iscrizione. Tuttavia, non tenevano conto delle realtà contemporanee e di fatto reclutarono ancora più repubblicani: durante la Grande Depressione, era per lo più la classe media e alta (cioè la maggior parte dei repubblicani, non i democratici) che poteva permettersi di possedere telefoni e automobili.

Tipi di piano per la costruzione di gruppi da campioni

Esistono diversi tipi principali di piani di costruzione del gruppo:

1. Studio con gruppi sperimentali e di controllo, che si trovano in condizioni diverse.

§ Studio con gruppi sperimentali e di controllo utilizzando una strategia di selezione accoppiata

2. Ricerca utilizzando un solo gruppo - sperimentale.

3. Ricerca utilizzando un piano misto (fattoriale): tutti i gruppi sono posti in condizioni diverse.

]Tipi di campionamento

I campioni sono divisi in due tipi:

§ probabilistico

§ improbabilità

Campioni di probabilità

1. Campionamento probabilistico semplice:

§ Ricampionamento semplice. L'uso di tale campione si basa sul presupposto che ogni intervistato abbia la stessa probabilità di essere incluso nel campione. Sulla base dell'elenco della popolazione generale, vengono compilate le schede con il numero degli intervistati. Vengono messi in un mazzo, mischiati e una carta viene estratta da essi a caso, un numero viene annotato, quindi restituito. Inoltre, la procedura viene ripetuta tante volte quante sono le dimensioni del campione di cui abbiamo bisogno. Meno: ripetizione delle unità di selezione.

La procedura per costruire un semplice campione casuale comprende i seguenti passaggi:

1. bisogno di ottenere lista completa membri della popolazione generale e numerare questo elenco. Tale elenco, richiamo, è chiamato frame di campionamento;

2. determinare la dimensione campionaria attesa, ovvero il numero atteso di intervistati;

3. estrarre dalla tabella dei numeri casuali tanti numeri quante sono le unità campione. Se il campione dovesse comprendere 100 persone, dalla tabella vengono presi 100 numeri casuali. Questi numeri casuali possono essere generati da un programma per computer.

4. selezionare dall'elenco di base quelle osservazioni i cui numeri corrispondono ai numeri casuali scritti

§ Il semplice campionamento casuale presenta evidenti vantaggi. Questo metodo è estremamente facile da capire. I risultati dello studio possono essere estesi alla popolazione in studio. La maggior parte degli approcci all'inferenza statistica implica la raccolta di informazioni utilizzando un semplice campione casuale. Tuttavia, il metodo di campionamento casuale semplice presenta almeno quattro limitazioni significative:

1. Spesso è difficile creare una cornice di campionamento che consenta un semplice campionamento casuale.

2. Un semplice campione casuale può dare come risultato una popolazione numerosa, o una popolazione distribuita su una vasta area geografica, il che aumenta significativamente il tempo e il costo della raccolta dei dati.

3. I risultati dell'applicazione di un semplice campione casuale sono spesso caratterizzati da una bassa accuratezza e da un errore standard maggiore rispetto ai risultati dell'applicazione di altri metodi probabilistici.

4. A seguito dell'applicazione del SRS può formarsi un campione non rappresentativo. Sebbene i campioni ottenuti per semplice selezione casuale, in media, rappresentino adeguatamente la popolazione generale, alcuni di essi rappresentano in modo estremamente errato la popolazione oggetto di studio. La probabilità di ciò è particolarmente alta con una piccola dimensione del campione.

§ Campionamento semplice non ripetitivo. La procedura per costruire il campione è la stessa, solo le carte con i numeri degli intervistati non vengono rimesse nel mazzo.

1. Campionamento probabilistico sistematico. È una versione semplificata di un semplice campione di probabilità. Sulla base dell'elenco della popolazione generale, gli intervistati vengono selezionati a un certo intervallo (K). Il valore di K è determinato casualmente. Il risultato più affidabile si ottiene con una popolazione generale omogenea, altrimenti la dimensione del gradino e alcuni pattern ciclici interni del campione possono coincidere (miscelazione del campione). Contro: come in un semplice campione probabilistico.

2. Campionamento seriale (nidificato). Le unità di campionamento sono serie statistiche (famiglia, scuola, team, ecc.). Gli elementi selezionati sono sottoposti a un esame continuo. La selezione delle unità statistiche può essere organizzata in base al tipo di campionamento casuale o sistematico. Contro: Possibilità di maggiore omogeneità rispetto alla popolazione generale.

3. Campionamento a zone. Nel caso di una popolazione eterogenea, prima di utilizzare il campionamento probabilistico con qualsiasi tecnica di selezione, si raccomanda di dividere la popolazione in parti omogenee, tale campione è chiamato campione zonato. I gruppi di zonizzazione possono essere sia formazioni naturali (ad esempio, quartieri cittadini) sia qualsiasi caratteristica alla base dello studio. Il segno in base al quale viene eseguita la divisione è chiamato segno di stratificazione e zonazione.

4. Selezione "Comodo". La procedura di campionamento "di convenienza" consiste nello stabilire contatti con unità di campionamento "convenienti" - con un gruppo di studenti, una squadra sportiva, con amici e vicini. Se è necessario ottenere informazioni sulle reazioni delle persone a un nuovo concetto, un tale campione è abbastanza ragionevole. Il campionamento "di convenienza" viene spesso utilizzato per la verifica preliminare dei questionari.

Campioni incredibili

La selezione in tale campione viene effettuata non secondo i principi del caso, ma secondo criteri soggettivi - accessibilità, tipicità, pari rappresentanza, ecc.

1. Campione di quote - il campione è costruito come un modello che riproduce la struttura della popolazione generale sotto forma di quote (proporzioni) delle caratteristiche studiate. Il numero degli elementi campionari con una diversa combinazione delle caratteristiche oggetto di studio è determinato in modo tale da corrispondere alla loro quota (proporzione) nella popolazione generale. Quindi, ad esempio, se abbiamo una popolazione generale di 5.000 persone, di cui 2.000 donne e 3.000 uomini, allora nel campione della quota avremo 20 donne e 30 uomini, oppure 200 donne e 300 uomini. I campioni di quote sono spesso basati su criteri demografici: sesso, età, regione, reddito, istruzione e altri. Contro: di solito tali campioni non sono rappresentativi, perché è impossibile prendere in considerazione più parametri sociali contemporaneamente. Pro: materiale facilmente accessibile.

2. Metodo a palle di neve. Il campione è costruito come segue. Ciascun rispondente, a partire dal primo, è pregato di contattare i propri amici, colleghi, conoscenti che rientrino nelle condizioni di selezione e che possano partecipare allo studio. Pertanto, ad eccezione del primo passaggio, il campione viene formato con la partecipazione degli stessi oggetti di studio. Il metodo viene spesso utilizzato quando è necessario trovare e intervistare gruppi di intervistati difficili da raggiungere (ad esempio intervistati con un reddito elevato, intervistati appartenenti allo stesso gruppo professionale, intervistati che hanno hobby/passioni simili, ecc. )

3. Campionamento spontaneo - campionamento del cosiddetto "first comer". Spesso utilizzato nei sondaggi televisivi e radiofonici. La dimensione e la composizione dei campioni spontanei non è nota in anticipo ed è determinata da un solo parametro: l'attività degli intervistati. Svantaggi: è impossibile stabilire quale tipo di popolazione generale rappresentino gli intervistati e, di conseguenza, è impossibile determinare la rappresentatività.

4. Rilevazione del percorso - spesso utilizzata se l'unità di studio è la famiglia. Sulla mappa località dove verrà effettuato il rilievo, tutte le strade sono numerate. Con l'aiuto di una tabella (generatore) vengono selezionati numeri casuali grandi numeri. Ogni numero grande è considerato composto da 3 componenti: numero civico (2-3 primi numeri), numero civico, numero di appartamento. Ad esempio, il numero 14832: 14 è il numero civico sulla mappa, 8 è il numero civico, 32 è il numero dell'appartamento.

5. Campionamento zonato con selezione di oggetti tipici. Se, dopo la suddivisione in zone, viene selezionato un oggetto tipico da ciascun gruppo, ad es. un oggetto che si avvicina alla media in termini di gran parte delle caratteristiche studiate nello studio, tale campione è chiamato zonato con la selezione di oggetti tipici.

6.Selezione modale. 7. campione esperto. 8. Campione eterogeneo.

Strategie di costruzione di gruppo

Selezione dei gruppi per la loro partecipazione esperimento psicologico viene attuato utilizzando diverse strategie necessarie al fine di garantire il massimo rispetto possibile della validità interna ed esterna.

§ Randomizzazione (selezione casuale)

§ Selezione a coppie

§ Selezione stratometrica

§ Modellazione approssimativa

§ Gruppi reali coinvolgenti

Randomizzazione

Randomizzazione, o selezione casuale, viene utilizzato per creare semplici campioni casuali. L'uso di tale campione si basa sul presupposto che ogni membro della popolazione abbia la stessa probabilità di essere incluso nel campione. Ad esempio, per creare un campione casuale di 100 studenti universitari, puoi mettere in un cappello pezzi di carta con i nomi di tutti gli studenti universitari e poi prenderne 100: questa sarà una selezione casuale (Goodwin J. , pag. 147).

Selezione a coppie

Selezione a coppie- una strategia per la costruzione di gruppi campionari, in cui i gruppi di soggetti sono costituiti da soggetti equivalenti in termini di parametri collaterali significativi per l'esperimento. Questa strategia è efficace per gli esperimenti che utilizzano gruppi sperimentali e di controllo con l'opzione migliore: attrarre coppie di gemelli (mono e dizigoti), poiché consente di creare ...

Selezione stratometrica

Selezione stratometrica- randomizzazione con assegnazione di strati (o cluster). In questo metodo campionamento, la popolazione generale viene suddivisa in gruppi (strati) che presentano determinate caratteristiche (sesso, età, preferenze politiche, istruzione, livello di reddito, ecc.) e vengono selezionati soggetti con le caratteristiche corrispondenti.

Modellazione approssimativa

Modellazione approssimativa- elaborare campioni limitati e generalizzare le conclusioni su questo campione a una popolazione più ampia. Ad esempio, quando partecipano a uno studio di studenti del 2° anno di università, i dati di questo studio vengono estesi a "persone di età compresa tra 17 e 21 anni". L'ammissibilità di tali generalizzazioni è estremamente limitata.

La modellazione approssimativa è la formazione di un modello che, per una classe di sistemi (processi) chiaramente definita, ne descrive il comportamento (o i fenomeni desiderati) con una precisione accettabile.

Una delle componenti principali di uno studio ben progettato è la definizione del campione e di cosa sia un campione rappresentativo. È come l'esempio della torta. In fondo, non è necessario mangiare tutto il dolce per capirne il gusto? Ne basta una piccola parte.

Quindi, la torta è popolazione (vale a dire, tutti gli intervistati che si qualificano per il sondaggio). Può essere espresso territorialmente, ad esempio, solo residenti nella regione di Mosca. Sesso - solo donne. Oppure hanno limiti di età: i russi hanno più di 65 anni.

È difficile calcolare la popolazione: è necessario disporre dei dati del censimento della popolazione o di indagini preliminari di valutazione. Pertanto, di solito viene "stimata" la popolazione generale e dal numero risultante si calcola cornice di campionamento o campionamento.

Cos'è un campione rappresentativo?

Campioneè un numero ben definito di intervistati. La sua struttura dovrebbe coincidere il più possibile con la struttura della popolazione generale in termini di caratteristiche principali della selezione.

Ad esempio, se i potenziali intervistati sono l'intera popolazione della Russia, dove il 54% sono donne e il 46% sono uomini, il campione dovrebbe contenere esattamente la stessa percentuale. Se i parametri corrispondono, il campione può essere definito rappresentativo. Ciò significa che le imprecisioni e gli errori nello studio sono ridotti al minimo.

La dimensione del campione è determinata tenendo conto dei requisiti di accuratezza ed economia. Questi requisiti sono inversamente proporzionali tra loro: maggiore è la dimensione del campione, più accurato sarà il risultato. Inoltre, maggiore è l'accuratezza, maggiori sono i costi richiesti per lo studio. E viceversa, più piccolo è il campione, meno costa, meno accuratamente e più casualmente vengono riprodotte le proprietà della popolazione generale.

Pertanto, per calcolare la quantità di scelta, i sociologi hanno inventato una formula e l'hanno creata calcolatrice speciale:

Probabilità di fiducia e errore di fiducia

Cosa significano i termini" livello di confidenza" e " errore di fiducia"? Il livello di confidenza è una misura dell'accuratezza delle misurazioni. Un errore di confidenza è un possibile errore nei risultati dello studio. Ad esempio, con una popolazione generale di oltre 500.00 persone (ad esempio, che vivono a Novokuznetsk), il campione sarà 384 persone con un livello di confidenza del 95% e un errore del 5% OR (con un intervallo di confidenza di 95 ± 5%).

Cosa ne consegue? Quando si conducono 100 studi con un tale campione (384 persone), nel 95% dei casi, le risposte ricevute, secondo le leggi della statistica, saranno entro ± 5% dell'originale. E otterremo un campione rappresentativo con una probabilità minima di errore statistico.

Dopo aver eseguito il calcolo della dimensione del campione, puoi vedere se c'è un numero sufficiente di intervistati nella versione demo del questionario. Puoi saperne di più su come condurre un sondaggio panel.