Exemple de dependență stocastică în viață. Problemă de modelare matematică (aproximare). Modelul stocastic al unei opere literare

Având în vedere dependența dintre caracteristici, să evidențiem în primul rând dependența dintre modificarea factorului și caracteristicile rezultate, atunci când o valoare foarte specifică a caracteristicii factoriale corespunde multor valori posibile ale caracteristicii efective. Cu alte cuvinte, fiecare valoare a unei variabile corespunde unei anumite distribuții (condiționale) a altei variabile. Această dependență se numește stocastică. Apariția conceptului de dependență stocastică se datorează faptului că variabila dependentă este influențată de o serie de factori necontrolați sau necontabilizați, precum și faptului că modificările valorilor variabilelor sunt însoțite inevitabil de unele erori aleatoare. Un exemplu de relație stocastică este dependența de recoltele culturilor agricole Y din masa îngrășămintelor aplicate X. Nu putem prezice cu exactitate randamentul, deoarece acesta este influențat de mulți factori (precipitații, compoziția solului etc.). Cu toate acestea, este evident că odată cu o modificare a masei îngrășămintelor, randamentul se va modifica și el.

În statistică, sunt studiate valorile observate ale caracteristicilor, așa că de obicei se numește dependență stocastică dependenţă statistică.

Datorită ambiguității relației statistice dintre valorile caracteristicii rezultante Y și valorile caracteristicii factorului X, schema de dependență mediată peste X prezintă interes, adică. model exprimat prin așteptări matematice condiționate M(Y/X = x)(calculat cu o valoare fixă ​​a caracteristicii factorului X = x). Se numesc dependențe de acest fel regresie, iar funcția ср(х) = M(Y/X = x) - funcția de regresie Y pe X sau prognoza Y De X(desemnare y x= f(l)). În același timp, semnul efectiv Y numit si functie de raspuns sau explicat, ieșire, rezultantă, variabilă endogenă și atributul factorului X - regresor sau variabilă explicativă, de intrare, predictivă, predictivă, exogenă.

În Secțiunea 4.7 s-a demonstrat că așteptarea matematică condiționată M(Y/X) =ср(х) oferă cea mai bună prognoză a lui Y din X în sensul rădăcină pătratică medie, adică. ALE MELE- f(x)) 2 M(Y-g(x)) 2, unde g(x) - orice altă prognoză UPOH.

Deci, regresia este o relație statistică unidirecțională care stabilește corespondența între caracteristici. În funcție de numărul de caracteristici factorilor care descriu fenomenul, există baie de aburiȘi multiplu regresie. De exemplu, regresia pereche este o regresie între costurile de producție (caracteristica factorului X) și volumul de produse produse de întreprindere (caracteristica rezultată Y). Regresia multiplă este o regresie între productivitatea muncii (caracteristica rezultată Y) și nivelul de mecanizare a proceselor de producție, timpul de lucru, intensitatea materialului și calificarea lucrătorului (caracteristicile factorilor X t, X 2, X 3, X 4).

Ele se disting prin formă liniarȘi neliniar regresie, adică regresii exprimate prin funcții liniare și neliniare.

De exemplu, f(X) = Oh + Kommersant - regresie liniară pereche; f(X) = aX 2 + + bx + Cu - regresie pătratică; f(X 1? X 2,..., X p) = p 0 4- fi(X(+ p 2 X 2 + ... + p„X w - regresie liniară multiplă.

Problema identificării dependenţei statistice are două laturi: stabilirea etanșeitatea (rezistența) conexiuniiși definiție forme de comunicare.

Dedicat stabilirii apropierii (puterii) comunicării analiza corelației, al cărui scop este de a obține, pe baza datelor statistice disponibile, răspunsuri la următoarele întrebări de bază:

  • cum să alegeți un contor de conexiune statistic adecvat (coeficient de corelație, raport de corelație, coeficient de corelație de rang etc.);
  • cum să testăm ipoteza că valoarea numerică rezultată a contorului de relații indică într-adevăr prezența unei relații statistice.

Determină forma de comunicare analiza regresiei.În acest caz, scopul analizei de regresie este de a rezolva următoarele probleme pe baza datelor statistice disponibile:

  • alegerea tipului funcției de regresie (selectarea modelului);
  • găsirea parametrilor necunoscuți ai funcției de regresie selectate;
  • analiza calității funcției de regresie și verificarea adecvării ecuației la datele empirice;
  • prognozarea valorilor necunoscute ale caracteristicii rezultate pe baza valorilor date ale caracteristicilor factorilor.

La prima vedere, poate părea că conceptul de regresie este similar cu conceptul de corelație, întrucât în ​​ambele cazuri vorbim de o dependență statistică între caracteristicile studiate. Cu toate acestea, în realitate există diferențe semnificative între ele. Regresia implică o relație cauzală atunci când o modificare a valorii medii condiționate a unei caracteristici efective are loc datorită unei modificări a caracteristicilor factorilor. Corelația nu spune nimic despre relația cauzală dintre semne, adică. dacă există o corelaţie între Xși Y, atunci acest fapt nu implică modificări ale valorilor X determinați modificarea valorii medii condiționate a lui Y. Corelația afirmă pur și simplu faptul că modificările unei valori, în medie, se corelează cu modificările unei alte valori.

Dependența empirică stocastică

Dependența dintre variabile aleatoare se numește dependență stocastică. Se manifestă printr-o modificare a legii de distribuție a unuia dintre ele (variabila dependentă) atunci când celelalte (argumente) se modifică.

Dependență empiric stochastică grafic, în sistemul de coordonate variabilă dependentă – argumente, este un set de puncte situate aleatoriu care reflectă tendința generală a comportamentului variabilei dependente atunci când argumentele se schimbă.

O dependență empirică stocastică de un argument se numește dependență de pereche; dacă există mai multe argumente, se numește dependență multidimensională. Un exemplu de relație liniară pereche este prezentat în Fig. 1.()

Orez. 1.

Spre deosebire de dependența funcțională obișnuită, în care modificările valorii unui argument (sau mai multor argumente) corespund unei modificări a unei variabile dependente deterministe, într-o dependență stocastică există o modificare a distribuției statistice a unei variabile dependente aleatoare, în special , așteptarea matematică.

Problemă de modelare (aproximare) matematică

Construcția unei dependențe stocastice se numește altfel modelare (aproximare) sau aproximare matematică și constă în găsirea expresiei (formula) matematică a acesteia.

O formulă (funcție) stabilită empiric, care reflectă o relație adevărată nu întotdeauna cunoscută, dar existentă în mod obiectiv și care corespunde relației de bază, stabilă, care se repetă între obiecte, fenomene sau proprietățile acestora, este considerată ca model matematic.

Relația stabilă a lucrurilor și adevărata lor dependență. indiferent dacă este modelată sau nu, există obiectiv, are o expresie matematică și este considerată drept o lege sau o consecință a acesteia.

Dacă se cunoaște o lege adecvată sau o consecință a acesteia, atunci este firesc să le considerăm ca dependența analitică dorită. De exemplu, dependența empirică a puterii curente euîn circuitul de tensiune U si rezistenta la sarcina R rezultă din legea lui Ohm:

Din nefericire, adevărata dependență a variabilelor în marea majoritate a cazurilor este a priori necunoscută, deci este nevoie să o detectăm, pe baza unor considerații generale și a conceptelor teoretice, adică construirea unui model matematic al tiparului în cauză. Se ține cont de faptul că variabilele date și incrementele lor pe fondul fluctuațiilor aleatoare reflectă proprietățile matematice ale dependenței adevărate dorite (comportamentul tangentelor, extremelor, rădăcinilor, asimptotelor etc.)

Funcția de aproximare selectată într-un fel sau altul netezește (medii) fluctuațiile aleatoare ale valorilor empirice inițiale ale variabilei dependente și, prin urmare, suprimând componenta aleatoare, este o aproximare a componentei obișnuite și, prin urmare, a adevăratului dorit. dependență.

Modelul matematic al relației empirice are semnificație teoretică și practică:

· vă permite să stabiliți adecvarea datelor experimentale la una sau alta lege cunoscută și să identificați noi modele;

· rezolvă pentru variabila dependentă problema interpolării într-un interval dat a valorilor argumentului și a predicției (extrapolării) în afara intervalului.

Cu toate acestea, în ciuda interesului teoretic mare al găsirii unei formule matematice pentru dependența cantităților, în practică este adesea suficient doar să se determine dacă există o legătură între ele și care este puterea acesteia.

Sarcina analizei corelației

O metodă pentru studierea relației dintre cantitățile în schimbare este analiza corelației.

Conceptul cheie al analizei corelației care descrie relația dintre variabile este corelația (din engleză corelație - coordonare, legătură, relație, raport, interdependență).

Analiza corelației este utilizată pentru a detecta dependența stocastică și pentru a evalua puterea (semnificația) acesteia după mărimea coeficienților de corelație și a raportului de corelație.

Dacă se găsește o relație între variabile, atunci se spune că corelația este prezentă sau că variabilele sunt corelate.

Indicatorii proximității conexiunii (coeficient de corelație, raport de corelație) modulo variază de la 0 (în absența conexiunii) la 1 (în cazul degenerării dependenței stocastice într-una funcțională).

O relație stocastică este considerată semnificativă (reala) dacă estimarea absolută a coeficientului de corelație (relația de corelație) este semnificativă, adică cu 2-3 mai mare decât abaterea standard a coeficientului de estimare.

Rețineți că în unele cazuri se poate găsi o legătură între fenomene care nu sunt în relații evidente cauză-efect.

De exemplu, pentru unele zone rurale, a fost identificată o relație stocastică directă între numărul de berze care cuibăresc și copiii născuți. Numărul de primăvară al berzelor face posibilă prezicerea câți copii se vor naște în acest an, dar dependența, desigur, nu dovedește credința binecunoscută și este explicată prin procese paralele:

· nașterea copiilor este de obicei precedată de formarea și înființarea de noi familii cu înființarea de case rurale și ferme;

· extinderea oportunităților de cuibărit atrage păsările și crește numărul acestora.

O astfel de corelație între caracteristici se numește corelație falsă (imaginară), deși poate avea o semnificație practică.

Teoria probabilității este adesea percepută ca o ramură a matematicii care se ocupă cu „calculul probabilităților”.

Și tot acest calcul se rezumă de fapt la o formulă simplă:

« Probabilitatea oricărui eveniment este egală cu suma probabilităților evenimentelor elementare incluse în acesta" În practică, această formulă repetă „vraja” care ne este familiară încă din copilărie:

« Masa unui obiect este egală cu suma maselor părților sale constitutive».

Aici vom discuta despre fapte nu atât de banale din teoria probabilității. Vom vorbi, în primul rând, despre dependentȘi independent evenimente.

Este important să înțelegem că aceiași termeni din diferite ramuri ale matematicii pot avea semnificații complet diferite.

De exemplu, când spun că aria unui cerc S depinde de raza lui R, atunci, desigur, ne referim la dependență funcțională

Conceptele de dependență și independență au un sens complet diferit în teoria probabilității.

Să începem să ne familiarizăm cu aceste concepte cu un exemplu simplu.

Imaginează-ți că faci un experiment de aruncare a zarurilor în această cameră, iar colegul tău din camera alăturată aruncă și el o monedă. Să presupunem că ești interesat de evenimentul A – colegul tău primește un „două” și evenimentul B – colegul tău primește un „cozi”. Bunul simț dictează: aceste evenimente sunt independente!

Deși nu am introdus încă conceptul de dependență/independență, este intuitiv clar că orice definiție rezonabilă a independenței trebuie concepută astfel încât aceste evenimente să fie definite ca independente.

Acum să trecem la un alt experiment. Se aruncă un zar, evenimentul A este doi, iar evenimentul B este un număr impar de puncte. Presupunând că osul este simetric, putem spune imediat că P(A) = 1/6. Acum imaginați-vă că vă spun: „Ca rezultat al experimentului, evenimentul B a avut loc, un număr impar de puncte a scăzut.” Ce putem spune acum despre probabilitatea evenimentului A? Este clar că acum această probabilitate a devenit zero.

Cel mai important lucru pentru noi este că ea schimbat.

Revenind la primul exemplu, putem spune informație faptul că evenimentul B s-a întâmplat în camera alăturată nu vă va afecta ideile despre probabilitatea evenimentului A. Această probabilitate Nu se va schimba din faptul că ai aflat ceva despre evenimentul B.

Ajungem la o concluzie firească și extrem de importantă -

dacă informații că evenimentulÎN întâmplat modifică probabilitatea unui eveniment A , apoi evenimente A ȘiÎN ar trebui considerat dependent, iar dacă nu se schimbă, atunci independent.

Aceste considerații ar trebui să primească o formă matematică, dependența și independența evenimentelor ar trebui determinate folosind formule.

Vom porni de la următoarea teză: „Dacă A și B sunt evenimente dependente, atunci evenimentul A conține informații despre evenimentul B, iar evenimentul B conține informații despre evenimentul A”. Cum poți afla dacă este conținut sau nu? Răspunsul la această întrebare este dat de teorie informație.

Din teoria informației avem nevoie de o singură formulă care ne permite să calculăm cantitatea de informații reciproce I(A, B) pentru evenimentele A și B

Nu vom calcula cantitatea de informații pentru diverse evenimente și nu vom discuta această formulă în detaliu.

Este important pentru noi ca daca

atunci cantitatea de informații reciproce dintre evenimentele A și B este egală cu zero - evenimentele A și B independent. Dacă

atunci cantitatea de informații reciproce este evenimentele A și B dependent.

Apelul la conceptul de informație este aici de natură auxiliară și, așa cum ni se pare, ne permite să facem mai palpabile conceptele de dependență și independență a evenimentelor.

În teoria probabilității, dependența și independența evenimentelor sunt descrise mai formal.

În primul rând, avem nevoie de concept probabilitate condițională.

Probabilitatea condiționată a evenimentului A, cu condiția ca evenimentul B să fi avut loc (P(B) ≠0), se numește valoarea P(A|B), calculată prin formula

.

Urmând spiritul abordării noastre de a înțelege dependența și independența evenimentelor, ne putem aștepta ca probabilitatea condiționată să aibă următoarea proprietate: dacă evenimentele A și B independent , Acea

Aceasta înseamnă că informația că evenimentul B a avut loc nu are niciun efect asupra probabilității evenimentului A.

Așa cum este!

Dacă evenimentele A și B sunt independente, atunci

Pentru evenimentele independente A și B avem

Și

o relație între variabile aleatoare în care o modificare a legii de distribuție a uneia dintre ele are loc sub influența unei modificări a celeilalte.


Vedeți valoarea Stochastică de dependențăîn alte dicționare

Dependenta- robie
supunere
subordonare
Dicţionar de sinonime

Dependenta J.— 1. Distragerea atenției. substantiv după valoare adj.: dependent (1). 2. Condiționalitatea a ceva. ce fel de circumstanțe, motive etc.
Dicţionar explicativ de Efremova

Dependenta- -Și; și.
1. la Dependent. Politic, economic, material. Z. din smth. mă îngreunează, mă asuprește. H. teorie din practică. Trăind în dependență. Cetatea z. (stat........
Dicționarul explicativ al lui Kuznetsov

Dependenta— - starea unei entități economice în care existența și activitățile acesteia depind de sprijinul material și financiar sau de interacțiunea cu alte entități.
Dicționar juridic

Dependența de Fisher- - o relație care stabilește că o creștere a nivelului inflației așteptate tinde să crească ratele nominale ale dobânzii. În cea mai strictă versiune - dependență........
Dicționar juridic

Dependența liniară— - modele economice și matematice sub formă de formule, ecuații în care valorile economice, parametrii (argument și funcție) sunt interconectați printr-o funcție liniară. Cel mai simplu........
Dicționar juridic

Dependenta de droguri- un sindrom observat în abuzul de droguri sau substanțe și caracterizat printr-o nevoie patologică de a lua un psihotrop pentru a evita dezvoltarea......
Dicționar medical mare

Dependența de droguri mentală- L. z. fără simptome de sevraj dacă încetați să luați medicamentul.
Dicționar medical mare

Dependența de droguri fizice- L. z. cu simptome de sevraj în cazul întreruperii medicamentului sau după introducerea antagoniștilor acestuia.
Dicționar medical mare

Dependența de iobăgie- dependenţa personală, funciară şi administrativă a ţăranilor de proprietarii de pământ din Rusia (sec. XI - 1861) Formalizată legal în lege. secolele al XV-lea - al XVII-lea iobăgie.

Dependența liniară- o relație de forma С1u1+С2u2+... +Сnun?0, unde С1, С2,..., Сn sunt numere, dintre care cel puțin unul? 0 și u1, u2, ..., un sunt niște obiecte matematice, de exemplu. vectori sau funcţii.
Dicționar enciclopedic mare

Dependența de iobăgie— - dependența personală, funciară și administrativă a țăranilor de domnii feudali din Rusia în secolul al XI-lea. -1861 Formalizată legal la sfârșitul secolelor XV-XVII. iobăgie.
Dicţionar istoric

Dependența de iobăgie- dependenţa personală a ţăranilor în vâlvă. societate de la domnii feudali. Vezi Serviciu.
Enciclopedia istorică sovietică

Dependența liniară— - vezi articolul Independență liniară.
Enciclopedie matematică

Funcția Stochastică Lyapunov este o funcție nenegativă V(t, x), pentru care perechea (V(t, X(t)), Ft) este o supermartingală pentru un proces aleatoriu X(t), Ft este s-algebra evenimentelor generat de procesul de flux Xdo........
Enciclopedie matematică

Aproximarea stocastică- o metodă de rezolvare a unei clase de probleme statistice. evaluare, în care noua valoare de evaluare este o modificare a unei evaluări existente pe baza unei noi observații.........
Enciclopedie matematică

Geometrie Stochastică este o disciplină matematică care studiază relația dintre geometrie și teoria probabilității. S. g. dezvoltat din clasic. geometrie integrală și probleme despre geometric........
Enciclopedie matematică

Dependența Stochastică- (probabilistă, statistică) - dependență între variabile aleatoare, care se exprimă într-o modificare a distribuțiilor condiționate ale oricăreia dintre valori atunci când valorile se schimbă.......
Enciclopedie matematică

Joc Stohastic- - un joc dinamic, în care funcția de distribuție a tranziției nu depinde de preistoria jocului, adică S. și. au fost definite pentru prima dată de L. Shapley, care a considerat antagonistă.........
Enciclopedie matematică

Matricea Stochastică- o matrice pătrată (posibil infinită) cu elemente nenegative astfel încât pentru orice i. Setul tuturor sistemelor de simetrie de ordinul al n-lea este o carcasă convexă........
Enciclopedie matematică

Continuitate stocastică— proprietatea funcțiilor eșantionului unui proces aleatoriu. Un proces aleator X(t), definit pe o anumită mulțime numită. continuu stocastic pe acest set dacă pentru vreunul........
Enciclopedie matematică

Indiscernibilitatea stocastică- o proprietate a două procese aleatoare și înseamnă că mulțimea aleatoare este neglijabilă, adică probabilitatea mulțimii care este egală cu zero. Dacă X și Y sunt stocastice........
Enciclopedie matematică

Limitarea stocastică— mărginirea în probabilitate, este o proprietate a unui proces aleator X(t), care se exprimă prin condiția: pentru unul arbitrar există C>0 astfel încât pentru toate A. V. Prohorov.
Enciclopedie matematică

Secvență stocastică- o secvență de variabile aleatoare definite pe un spațiu măsurabil cu o familie nedescrescătoare de -algebre alocate pe acesta având proprietatea consistenței........
Enciclopedie matematică

Convergența stocastică- la fel ca convergența în probabilitate.
Enciclopedie matematică

Echivalența stocastică— relație de echivalență între variabile aleatoare care diferă numai pe setul de probabilitate zero. Mai precis, variabile aleatoare X 1 și X 2. specificate pe una........
Enciclopedie matematică

Dependența de alcool— Alcoolul este o substanță narcotică; pentru o discuție, consultați articolul dependența de droguri.
Enciclopedie psihologică

Dependență halucinogenă- Dependenta de droguri, in care drogurile sunt halucinogene.
Enciclopedie psihologică

Dependenta- (Dependență). O calitate pozitivă care promovează dezvoltarea psihologică sănătoasă și creșterea umană.
Enciclopedie psihologică

Dependență, dependență de droguri— (dependență de droguri) - efecte fizice și/sau psihologice rezultate din dependența de anumite substanțe medicamentoase; caracterizat prin impulsuri compulsive........
Enciclopedie psihologică

Să fie necesar să se studieze dependența și ambele mărimi sunt măsurate în aceleași experimente. Pentru a face acest lucru, se desfășoară o serie de experimente la valori diferite, încercând să păstreze alte condiții experimentale neschimbate.

Măsurarea fiecărei mărimi conține erori aleatorii (nu vom lua în considerare aici erorile sistematice); prin urmare, aceste valori sunt aleatorii.

Relația naturală a variabilelor aleatoare se numește stocastică. Vom lua în considerare două probleme:

a) să stabilească dacă există (cu o anumită probabilitate) o dependență de sau dacă valoarea nu depinde de;

b) dacă dependența există, descrieți-o cantitativ.

Prima sarcină se numește analiza varianței, iar dacă se ia în considerare o funcție a mai multor variabile, atunci analiza varianței multivariate. A doua sarcină se numește analiză de regresie. Dacă erorile aleatoare sunt mari, atunci pot masca dependența dorită și poate să nu fie ușor de identificat.

Astfel, este suficient să luăm în considerare o variabilă aleatoare în funcție de ca parametru. Așteptarea matematică a acestei valori depinde de faptul că această dependență este cea dorită și se numește legea regresiei.

Analiza variatiei. Să efectuăm o serie mică de măsurători pentru fiecare valoare și să determinăm. Luăm în considerare două moduri de procesare a acestor date, permițându-ne să investigăm dacă există o dependență semnificativă (adică, cu o probabilitate de încredere acceptată) a lui z de

În prima metodă, standardele de eșantionare ale unei singure măsurători sunt calculate pentru fiecare serie separat și pentru întregul set de măsurători:

unde este numărul total de măsurători și

sunt valorile medii, respectiv, pentru fiecare serie și pentru întregul set de măsurători.

Să comparăm varianța unui set de măsurători cu variațiile serii individuale. Dacă se dovedește că la nivelul de încredere ales este posibil să se calculeze pentru tot i, atunci există o dependență a lui z de.

Dacă nu există un exces de încredere, atunci dependența nu poate fi detectată (dată fiind acuratețea experimentului și metoda de procesare adoptată).

Varianțele sunt comparate folosind testul lui Fisher (30). Deoarece standardul s este determinat de numărul total de măsurători N, care este de obicei destul de mare, puteți utiliza aproape întotdeauna coeficienții Fisher din Tabelul 25.

A doua metodă de analiză este de a compara medii la valori diferite între ele. Valorile sunt aleatorii și independente, iar propriile standarde de eșantionare sunt egale cu

Prin urmare, ele sunt comparate conform schemei de măsurători independente descrisă la paragraful 3. Dacă diferențele sunt semnificative, adică depășesc intervalul de încredere, atunci a fost stabilit faptul dependenței de; dacă diferențele dintre toate cele 2 sunt nesemnificative, atunci dependența nu poate fi detectată.

Analiza multivariată are câteva caracteristici. Este recomandabil să măsurați valoarea în nodurile unei grile dreptunghiulare, astfel încât să fie mai convenabil să studiați dependența de un argument, fixând un alt argument. Efectuarea unei serii de măsurători la fiecare nod al unei rețele multidimensionale este prea laborioasă. Este suficient să efectuați o serie de măsurători în mai multe puncte ale grilei pentru a estima dispersia unei singure măsurători; în alte noduri ne putem limita la măsurători unice. Analiza varianței se efectuează conform primei metode.

Observație 1. Dacă există multe măsurători, atunci în ambele metode măsurătorile individuale sau serii pot, cu o probabilitate vizibilă, să devieze destul de puternic de la așteptările lor matematice. Acest lucru trebuie luat în considerare atunci când alegeți o probabilitate de încredere suficient de apropiată de 1 (așa cum sa făcut în stabilirea limitelor care separă erorile aleatoare admisibile de cele brute).

Analiza regresiei. Fie analiza varianței să indice că dependența lui z de este. Cum se cuantifică?

Pentru a face acest lucru, aproximăm dependența dorită cu o anumită funcție Găsim valorile optime ale parametrilor folosind metoda celor mai mici pătrate, rezolvând problema

unde sunt greutățile de măsurare, selectate invers proporțional cu pătratul erorii de măsurare la un punct dat (adică ). Această problemă a fost analizată în Capitolul II, § 2. Ne vom opri aici doar asupra acelor caracteristici care sunt cauzate de prezența unor erori aleatoare mari.

Tipul este selectat fie din considerații teoretice despre natura dependenței, fie formal, prin compararea graficului cu graficele funcțiilor cunoscute. Dacă formula este selectată din considerente teoretice și transmite corect (din punct de vedere teoretic) asimptoticele, atunci de obicei permite nu numai aproximarea bine a setului de date experimentale, ci și extrapolarea dependenței găsite la alte intervale de valori. O funcție selectată în mod formal poate descrie în mod satisfăcător experimentul, dar este rareori potrivită pentru extrapolare.

Este mai ușor de rezolvat problema (34) dacă este un polinom algebric.Totuși, o astfel de alegere formală a funcției se dovedește rareori satisfăcătoare. De obicei, formulele bune depind neliniar de parametri (regresie transcendentală). Cel mai convenabil este să construiți regresia transcendentală selectând o astfel de înlocuire de nivelare a variabilelor, astfel încât dependența să fie aproape liniară (vezi Capitolul II, § 1, paragraful 8). Atunci este ușor să o aproximezi printr-un polinom algebric: .

Se caută o modificare de nivelare a variabilelor folosind considerații teoretice și ținând cont de asimptotice.Vom presupune în continuare că o astfel de modificare a fost deja făcută.

Observația 2. La trecerea la variabile noi, problema metodei celor mai mici pătrate (34) ia forma

unde noile ponderi sunt legate de relaţiile originale

Prin urmare, chiar dacă în formula originală (34) toate măsurătorile au avut aceeași acuratețe, ponderile pentru variabilele de nivelare nu vor fi aceleași.

Analiza corelației. Este necesar să se verifice dacă înlocuirea variabilelor a fost într-adevăr de nivelare, adică dacă dependența este aproape de liniară. Acest lucru se poate face prin calcularea coeficientului de corelație de pereche

Este ușor să arăți că relația este întotdeauna satisfăcută

Dacă dependența este strict liniară (și nu conține erori aleatoare), atunci sau în funcție de semnul pantei dreptei. Cu cât este mai mică, cu atât dependența seamănă mai puțin liniară. Prin urmare, dacă , iar numărul de măsurători N este suficient de mare, atunci variabilele de nivelare sunt alese satisfăcător.

Asemenea concluzii despre natura dependenței bazate pe coeficienții de corelație se numesc analiză de corelație.

Analiza corelației nu necesită luarea unei serii de măsurători în fiecare punct. Este suficient să faceți o măsurătoare în fiecare punct, dar apoi să luați mai multe puncte pe curba studiată, ceea ce se face adesea în experimente fizice.

Observația 3. Există criterii de proximitate care vă permit să indicați dacă dependența este practic liniară. Nu ne oprim asupra lor, deoarece alegerea gradului polinomului de aproximare va fi luată în considerare mai jos.

Observația 4. Raportul indică absența unei dependențe liniare, dar nu înseamnă absența vreunei dependențe. Deci, dacă pe un segment - atunci

Polinomul de grad optim a. Să substituim în problema (35) un polinom aproximativ de grad:

Atunci valorile optime ale parametrilor satisfac sistemul de ecuații liniare (2.43):

și nu sunt greu de găsit. Dar cum să alegi gradul unui polinom?

Pentru a răspunde la această întrebare, să revenim la variabilele inițiale și să calculăm varianța formulei de aproximare cu coeficienții găsiți. O estimare imparțială a acestei variații este

Evident, pe măsură ce gradul polinomului crește, dispersia (40) va scădea: cu cât se iau mai mulți coeficienți, cu atât punctele experimentale pot fi aproximate mai precis.