MARKETING
Marketingul reprezinta "stiinta si arta de a convinge clientii sa cumpere" Philip Kotler definea marketingul ca "un proces social si managerial prin care indivizi sau grupuri de indivizi obtin ceea ce le este necesar si doresc prin crearea, oferirea si schimbul de produse si servicii avand o anumita valoare". Simplist, marketingul reprezinta "arta si stiinta de a vinde". |
StiuCum
Home » MARKETING
» cercetarea de marketing
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Analiza datelor in cercetarile de marketing |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Analiza datelor in cercetarile de marketing Activitati preliminare in analiza datelor Dupa culegerea datelor prin intermediul chestionarelor si sistematizarea acestora, inainte ca acestea sa intre in procesul de prelucrare si analiza propriu-zisa au loc urmatoarele activitati: a)determinarea bazei de calcul procentual b)calculul erorilor c)testarea semnificatiei procentajelor a)determinarea bazei de calcul procentual Este importanta pentru prelucrarile ulterioare ale datelor colectate cu ajutorul chestionarelor. Presupunem ca unui esantion de 500 de subiecti li s-a aplicat un chestionar cu patru intrebari inchise. 1.Inchiriati casete video? a)Da b)Nu (Daca nu, interviul nu mai are loc) 2.Vi se par tarifele de inchiriere ridicate a)Da b) Nu 3.Ce fel de inregistrari video inchiriati: a) filme, b)desene animate, c)spectacole, d) documentare, e)videoclipuri, f) competitii sportive, g) altele 4.Ce tipuri de filme inchiriati? a) de actiune, b)comedii, c)muzicale, d)SF, e) altele Informatiile colectate din chestionare au fost sistematizate tabelar, astfel:
Sa se stabileasca baza de calcul procentual care trebuie sa fie considerata pentru prelucrarea datelor cu ajutorul chestionarului. Ca baza de calcul procentual se poate utiliza: -numarul total de subiecti pe esantion -numarul total de respondenti Diferenta dintre cele doua o reprezinta: - nonraspunsurile -apar in cazul persoanelor din esantion care nu au dorit sau nu au stiut sa raspunda la o anumita intrebare -persoanele neimplicate -subiecti care fac parte din esantion dar care nu sunt vizati de o anumita intrebare, respectiv care au fost separati de restul esantionului printr-o intrebare filtru. La intrebarea 2, marimea esantionului nu este relevanta, deoarece aceasta intrebare ii priveste doar pe cei care inchiriaza casete video (300 de persoane), numarul persoanelor neimplicate fiind de 200. Da 150 50 % Nu 100 33,33 % Non raspunsuri 50 16,7% Subpopulatia 300 100 % In acest caz, baza de calcul este numarul subiectilor care inchiriaza casete video. Se poate lua ca baza de calcul si numarul respondentilor, 250. Da 150 60% Nu 100 40 % Respondenti 250 100 % La intrebarea 3, baza de calcul ar putea fi stabilita astfel: Numarul raspunsurilor este mai mare decat al subiectilor din esantion.Se pot utiliza ambii indicatori, dar semnificatia rezultatelor este diferita.
b)calculul erorilor Eroarea datorata nonraspunsurilor se poate calcula in mai multe moduri. EXEMPLU Intr-un chestionar referitor la intentiile de efectuare a unei vacante in strainatate s-a pus intrebarea Intentionati sa efectuati o vacanta in strainatate in urmatoarele 6 luni ? Da Nu Nu stiu Raspunsurile pe un esantion de 1200 sunt:
Aparitia nonraspunsurilor poate fi determinata de urmatoarele cauze: 1.imposibilitatea intervievarii subiectilor inclusi pe lista de sondaj-nu au putut fi contactati, si-au schimbat domiciliul, se afla vacanta, sunt bolnavi etc 2.refuzul de a raspunde 3.abandon pe parcursul completarii chestionarului 4.imposibilitatea de a raspunde-intrebari neclare, subiect necunoscut, nefamiliar, nu-si amintesc un aspect solicitat etc. Se calculeaza ponderile nonraspunsurilor: ponderea celor care nu vor efectua o vacanta in strainatate ponderea celor care s-ar putea sa plece intr-o vacanta in strainatate(cei care nu au raspuns s-ar putea sa plece totusi in strainatate) ponderea celor care vor calatori probabil in strainatate (indecisii-300, se impart in mod egal intre cele doua alternative de raspuns) ponderea celor care s-ar putea sa efectueze 636g67g o calatorie in strainatate in urmatoarele 6 luni, in ipoteza ca persoanele indecise au aceeasi atitudine ca si respondentii. Eroarea totala este produsul dintre eroarea de esantionare, eroarea datorata nonraspunsurilor si eroarea de masurare. Eroarea totala se calculeaza cu metoda ERA(Error Ratio Analysis) a lui Brown:
unde: este eroarea totala este eroarea de esantionare este eroarea datorata nonraspunsurilor este eroarea de masurare EXEMPLU Se considera un sondaj in care au fost determinati indicatorii: -proportia reala a componentelor populatiei statistice care au o anumita caracteristica, t=0,7 -proportia observata, r=0,8 -proportia reala in esantionul prevazut p=0,6 -proportia reala in esantionul intevievat a=0,9 Sa se calculeze eroarea totala, eroarea datorata nonraspunsurilor, eroarea de esantionare, eroarea de masurare. Eroarea totala: Eroarea de esantionare: Eroarea datorata nonraspunsurilor: Eroarea de masurare: c)testarea semnificatiei procentajelor In cazul unei esantionari probabilistice simple si a unei intrebari cu raspuns unic, testarea semnificatiei diferentei dintre doua procentaje si se realizeaza cu formula:
unde n este marimea esantionului si n> 30. Regula de decizie este urmatoarea: daca > 1,96 diferenta este semnificativa pentru pragul de probabilitate de 95% daca <1,96, diferenta nu este semnificativa la pragul de probabilitate de 95% In cazul unei esantionari probabiliste simple si al unei intrebari cu raspunsuri multiple, testarea semnificatiei diferentei dintre doua procentaje si se realizeaza cu formula:
n este marimea esantionului, iar este ponderea subiectilor care au mentionat simultan doua criterii. Analiza univariata a datelor Analiza datelor reprezinta procesul de aplicare a tehnicilor statistico-matematice, in scopul extragerii din baza de date a informatiilor necesare procesului decizional de marketing. Metodele de analiza se pot grupa dupa mai multe criterii si anume: tipul de scala utilizat(nominala, ordinala, interval sau proportionala) numarul esantioanelor cercetare(unul, doua sau mai multe) natura relatiei dintre esantioane(independente sau dependente) numarul variabilelor considerate Obiectivele urmarite in analiza datelor sunt de obicei: determinarea tendintei centrale a variabilelor caracterizarea variatiei si repartitiei acestora masurarea gradului de asociere dintre ele realizarea unor estimari si previziuni evaluarea diferentelor dintre variabile sau grupuri de variabile evidentierea legaturilor cauzale dintre ele Determinarea tendintei centrale Tendinta centrala se caracterizeaza diferit in functie de nivelul la care s-a realizat masurarea. Tabel 4.1
Indicatorii tendintei centrale sunt: valoarea modala grupul modal mediana media aritmetica media geometrica Daca datele sunt negrupate, valoarea modala este cea care prezinta cea mai mare frecventa de aparitie. Exemplu: Intr-o cercetare directa a preferintelor populatiei unui oras pentru turismul de weekend, esantionul este alcatuit din 350 de persoane, care practica aceasta forma de turism, distribuite dupa statutul socio -profesional, dupa cum urmeaza: Tabel 4.2
Valoarea modala este 110. In cazul distributiei de frecvente specifice datelor grupate, grupul modal este constituit din grupul care cuprinde cele mai multe componente comparativ cu celelalte grupuri. Presupunem ca acelasi esantion se distribuie pe grupe de varsta: Tabel 4.3.
Grupul modal este reprezentat de grupul 19-24 de ani. Mediana-reprezinta valoarea deasupra si dedesubtul careia se afla cate o jumatate din observatii. Daca datele sunt negrupate si daca numarul observatiilor este fara sot, mediana este la mijloc. EXEMPLU: Numarul de portii dintr-un preparat culinar vandute in cinci restaurante Tabel 4.4
Daca numarul observatii este cu sot, mediana se considera a fi la jumatate, intre cele doua valori centrale. Exemplu: Tabel 4.5
Mediana este 90. In cazul datelor grupate, mediana se calculeaza astfel:numarul total de observatii(frecvente) se imparte la doi si astfel rezulta cate observatii trebuie sa fie deasupra si cate dedesubtul medianei; dupa aceasta se determina frecventele cumulate pentru a stabili in care grupa se situeaza mediana; in final se calculeaza valoarea medianei. In cazul datelor din Tabelul 4.3., totalul frecventelor este 350, rezulta ca 175 de observatii trebuie sa se afle deasupra medianei si 175 dedesubtul ei.Observam ca grupei 19-24 ani frecventele cumulate care ii corespund sunt 220-valoarea care este cea mai apropriata de 175, decat ar fi frecventele cumulate corespunzatoare grupei 14-18 ani.Deci valoarea medianei se situeaza undeva in cadrul grupei de de varsta 19-24 ani.Marimea intervalului 19-24 ani este de 5, aceasta se pondereaza cu numarul de observatii aditionale necesare(120/126), iar valoarea se adauga la 19.Rezulta ca mediana este situata la categoria de varsta de 23,75 ani, deci aproape 24 de ani. Media aritmetica este un indicator al tendintei centrale in cazul scalelor interval si proportionale(vezi Tabel 4.1). Media aritmetica, a unei variabile x despre care se cunosc n observatii intr-un esantion investigat, se calculeaza dupa formula:
Daca vanzarile unui supermarket au fost pe parcursul unei saptamani de: 300 u.m. (luni), 530 u.m.(marti), 340 u.m.(miercuri), 320 u.m.(joi), 510 (u.m.)vineri, 710 u.m.(sambata), media vanzarilor zilnice, pe saptamana in cauza este: u.m. Media aritmetica ponderata se calculeaza cu formula: unde reprezinta valoarea variabilei x corespunzatoare frecventei . EXEMPLU. In cazul unei cercetari a imaginii unui hotel de catre un grup de turist, amplasamentul a fost apreciat de catre membrii esantionuluii pe o diferentiala semantica cu 5 trepte astfel: f.favorabil 70 45 35 30 20 f.nefavorabil Pentru evaluarea sintetica a opiniei turistilor, se atribuie fiecarei trepte o nota(care reflecta aprecierea lor): 5=f.favorabil, 1=f.nefavorabil. Aprecierea medie:
Daca datele sunt grupate, pentru calcul mediei aritmetice se foloseste formula:
unde este frecventa grupului i este punctul de mijloc al intervalului unui grup n este numarul de observatii cuprinse in esantion EXEMPLU Calculul mediei vanzarilor in cazul unui numar de 50 de magazine, grupate dupa vanzarile realizate. Tabel 4.6
Media geometrica este un indicator al tendintei centrale in cazul scalelor proportionale(vezi Tabel 4.1.) Formule de calcul:
Modalitati de caracterizare a variatiei si repartitia variabilelor Caraterizarea variatiei se face diferentiat in functie de nivelul de masurare realizat printr-un tip de scala sau altul
Cuartilele -reprezinta doua valori stabilite ca o patrime din observatii sa se afle sub prima cuartila(numita cuartila inferioara) si o patrime din observatii se afle deasupra celei de-a doua cuartile(cuartila superioara).Celelalte doua patrimi din observatii se afla intre valorile celor doua cuartile si mediana. Decilele -reprezinta impartirea numarului observatiilor la 10. Centilele-reprezinta impartirea numarului observatiilor la 100. Amplitudinea absoluta a variatiei-este diferenta dintre observatia cu valoarea cea mai mare si cea cu valoarea cea mai mica. Amplitudinea relativa a variatiei este raportul dintre amplitudinea absoluta si medie. Abaterea medie-este media aritmetia a valorilor absolute ale abaterilor termenilor esantionului de la media lor. Varianta-este media aritmetica a patratelor abaterilor individuale ale termenilor esantionului de la medie. Abaterea standard este radical cu semnul plus din varianta. Analiza bivariata ( analiza gradului de asociere a doua variabile) Presupune masurarea gradului de asociere a doua variabile, sub aspectul: - directiei(naturii), - intensitatii; - semnificatiei statistice. Masurarea asocierii dintre variabile nominale Se poate realiza cu ajutorul: -coeficientului de corelatie phi -coeficientul de contigenta Procesul de masurare a gradului de asociere in cazul acestor variabile incepe prin construirea de tabele de contigenta. Un asemenea tabel contine distributia de frecvente, considerata simultan pentru doua sau mai multe variabile caracteristice. EXEMPLU Dorim sa aflam daca preferintele barbatilor pentru un anumit tip de fastfood, in care fumatul este interzis, difera semnificativ de preferintele femeilor. Cu datele culese de la un esantion de 500 de persoane, din care 300 barbati si 200 femei, se poate alcatui tabelul de contingenta: Tabel 4.8
Calculam procentual preferintele membrilor esantionului. Tabel 4.9.
Probabilitatea ca un barbat sa prefere fastfoodul este de 65,33%, iar ca o femeie sa-l prefere este de 71 %. Gradul de asociere dintre cele doua variabile: sex si preferinta(variabile dihotomice) se poate determina cu ajutorul coeficientului de corelatie phi. El se calculeaza cu formula:
unde a,b,c,d, reprezinta frecventele tabelului de contigenta de tipul 2 x 2, dupa cum urmeaza:
In cazul nostru:
deci Coeficientul de corelatie poate lua valori intre -1,0 si +1,0.Cele doua extreme indica o asociere perfecta intre variabile, iar valoarea zero indica lipsa corelatiei. Pentru a determina in ce proportie preferintele pentru fastfoodul investigat sunt explicate de variabila sex coeficientul se ridica la patrat, pentru a obtine coeficientul de determinare, care indica proportia variatiei explicate a unei din variabile de catre cealalta variabila.
Aceasta inseamna ca 12,67 % din variatia preferintelor este explicata de variabila sex. Concluzia este ca intensitatea asocierii intre cele doua variabile este foarte slaba. Semnul coeficientului de corelatie caracterizeaza directia asocierii.Semnul + indica o corelatie pozitiva, in sensul ca exista o asociere intre sexul masculin si preferinta pentru fastfoodul luat in discutie. Pentru testarea gradului de semnificatie a asocierii dintre opiniile subiectilor din cele doua esantioane independente(barbati si femei) si preferinta pentru fastfood, se utilizeaza testul neparametric .Prin acest test se urmareste sa se stabileasca daca preferintele barbatilor difera semnificativ fata de ale femeilor. Realizarea testului are ca punct de plecare ipoteza nula -faptul ca valoarea coeficientului de corelatie nu difera semnificativ fata de zero, adica preferintele barbatilor nu difera semnificativ de ale femeilor. ipoteza nula H 0: ipoteza alternativa H1: Se determina cu formula:
unde: r si k reprezinta numarul de randuri si respectiv de coloane ale tabelului de contigenta frecventele randului i si ale coloanei j care rezulta din observare frecventele randului i si ale coloanei j care se asteapta sa rezulte conform ipotezei nule; ele se obtin prin inmultirea frecventei marginale a randului i cu cea a coloanei j si impartirea produsului la numarul total al cazurilor(marimea esantionului) Valorile rezultate prin utilizarea formule de mai sus au o repartitie de esantionare care poate fi aproximata de o repartitie cu (r-1)(k-1) grade de libertate.Daca valoarea calculata a lui este egala sau mai mica decat valoarea teoretica corespunzatoare unui numar de grade de libertate si unui anumit grad de semnificatie, atunci ipoteza nula se accepta. In exemplul nostru:
Valoarea teoretica pentru (2-1)(2-1)=1 grad de libertate este de .Deoarece se poate afirma ca la un nivel de semnificatie de 0,05 ipoteza nula nu se accepta(se accepta ipoteza H1) adica difera semnificativ de zero, deci preferintele barbatilor difera semnificativ de cele ale femeilor. Ori de cate ori tabelul de contingenta este de tipul 2 x 2, pentru determinarea valorii lui se poate utiliza si urmatoarea formula :
unde a, b, c, d au aceeasi semnificatie, iar N=a+b+c+d. Deoarece, asa cum este cazul si in acest exemplu, testul care este conceput pentru repartitii continue se aplica unor date in forma discreta, pentru o mai mare exactitate, apare necesitatea unei corectii pentru continuitate, cunoscuta sub denumirea de corectia lui Yates. In aceste conditii, valoarea calculata a lui se face cu formula:
In cazul nostru:
Intrucat concluziile raman aceleasi cu cele stabilite pentru aplicarea primei formule. Pentru masurarea gradului de asociere intre variabilele unui tabel de contigenta cu orice numar de randuri sau coloane se utilizeaza coeficientul de contingenta C, care se calculeaza dupa formula:
unde: este valoarea calculata a lui N-este numarul subiectilor din esantion Daca numarul de coloane ale tabelului de contigenta este egal cu numarul de linii, atunci valoarea coeficientului C este pozitiva si variaza intre zero si , unde c este numarul de coloane ale tabelului de contingenta. In cazul cercetarilor de marketing se uilizeaza scheme de proiectare de tip "inainte-dupa", in care subiectii din esantion sunt supusi la doua masurari-.inainte si dupa aplicarea factorului experimental. De exemplu, daca factorul experimental este o actiune promotionala, este mare probabilitatea de a se modifica opinia subiectilor, masurata dupa aplicarea acestuia. In aceste situatii, pentru testarea semnificatiei schimbarilor de opinie de la o masurare la alta, se foloseste testul McNemar. Tabelul de contigenta in acest caz este:
unde a, b, c,d reprezinta frecventele de aparitie a celor patru cazuri posibile in urma aplicarii factorului experimental. Ceea ce intereseaza in acest exemplu sunt doar frecventele inregistrate in celulele a si d, suma lor reprezentand totalul persoanelor care si-au modificat imaginea intre prima si a doua masurare. Conform ipotezei nule se asteapta ca jumatate din modificari si anume sa fie intr-o directie (ele vor aparea in celula a) si jumatate sa fie in cealalta directie(ele vor apare in celula d). Testul McNemar este o adaptare a testului la specificul unui tabel de contigenta in care sunt considerate doar frecventele inregistrate in cele doua celule. se determina cu formula:
unde frecventele care rezulta din observare frecventele care se asteapta sa rezulte conform ipotezei nule, respectiv Dupa realizarea gruparii si simplificari, se ajunge la forma finala :
Daca aplicam corectia lui Yates, atunci:
Daca valoarea lui este egala sau mai mare decat valoarea teoretica, corespunzatoare unui grad de libertate si a unui anumit grad de semnificatie, ipoteza nula nu se accepta, deci factorul experimental a avut o influenta semnificativa asupra imaginii subiectilor care compun esantionul. Presupunem ca avem urmatorul tabel de contigenta, in cazul unui esantion de 250 de persoane.
Rezulta ca :
Valoarea teoretica pentru un grad de libertate este de Deoarece calculat are valoare mai mare decat teoretic, la un grad de semnificatie de 0,025, ipoteza nula nu se accepta, adica actiunea promotionala a determinat schimbari semnificative ale produsului in randul turistilor. Masurarea asocierii variabilelor ordinale Masurarea gradului de asociere intre variabile masurate cu ajutorul scalelor ordinale este mai plina de semnificatii, deoarece, inafara relatiei de echivalenta presupusa de o scala nominala, tipul de scala ordinala permite si ordonarea alternativelor cercetate pentru fiecare variabila cercetata. Variabilele ordinale pot varia concomitent intr-o anumita directie, care poate fi pozitiva(variatia se realizeaza in acelasi sens) sau negativa(variatia se realizeaza in sensuri contrare). Exista doua modalitati de cercetare a relatiilor de asociere: a)relatiile dintre rangurile alternativelor considerate pentru cele doua variabile b)relatiile dintre variabilele de tip ordinal a) relatiile dintre rangurile alternativelor variabilelor Se utilizeaza coeficientul Spearman de corelatie a rangurilor, , care are formula de calcul:
diferenta intre cele doua ranguri, detinute de variabila i n-marimea esantionului EXEMPLU Consideram 10 firme de turism, A,B,C,D,E,F,G,H,I,J, care ocupa locurile 1,2,3,4,5,6,7,8,9,10 in ceea ce priveste profitabilitatea la sfarsitul anului si locurile 2,4,1,5,3,7,6,9,8,10 in ceea ce priveste gradul de ocupare. Pentru masurarea gradului de asociere dintre rangurile detinute de cele 10 firme in privinta profitabilitatii, pe de o parte, si gradului de ocupare, pe de alta, se va folosi coeficientul de corelatie a rangurilor Spearman . Tabelul de date:
Rezulta ca :
Stiind ca poate lua valori intre -1(pentru o corelatie inversa perfecta) si +1 ( pentru o corelatie directa perfecta, iar zero pentru lipsa totala de asociere, in cazul considerat intre profitabilitate si gradul de ocupare exista o corelatie directa si foarte intensa. Pentru a testa gradul de semnificatie statistica a coeficientului de corelatie se formuleaza ipoteza nula si ipoteza alternativa: ipoteza nula: H0 ipoteza alternativa H1: Pentru un nivel de incredere de 0,99 valoarea coeficientului Z este 2,58. Pentru determinarea valorii calculate a lui Z se foloseste formula:
Stiind ca daca se accepta ipoteza nula, iar in caz contrar se accepta ipoteza alternativa, concluzia este ca se accepta H1, adica valoarea coeficientului de corelatie a rangurilor in populatia cercetata difera in mod semnificativ de zero. b)relatiile dintre variabilele ordinale Atunci cand se cerceteaza relatiile dintre variabilele ordinale si cand mai multe alternative sunt la egalitate, gradul de asociere se masoara prin coeficientul lui Goodman si a lui Kruskal, . Acesta se
calculeaza cu formula: unde P si Q sunt valori calculate, ca in exemplul de mai jos. EXEMPLU Se organizeaza degustarea unui preparat culinar dietetic intr-un esantion de 301 de persoane, culegandu-se informatii cu privire la intentia de a le cumpara in viitor.Intentiile sunt prezentate pe cinci niveluri, de la categoria 1- sigur va cumpara, la categoria 5 -sigur nu va cumpara. Prezentarea datelor culese:
Se doreste a se afla gradul de asociere dintre variabilele "intentii de cumparare" si "varsta". Pentru calculul lui P se procedeaza in felul urmator: se porneste prin a inmulti frecventa din partea stanga sus cu suma frecventelor aflate mai jos cu un rind si la dreapta, astfel: Apoi pe coloana a doua, a treia si a patra. Mai departe se considera frecventele situate pe randurile doi si trei: +15+10+5+25+20+20+1)=960 10(15+10+5+20+5+1 560 15(10+5+5+1 315 20(5+1 120 20(25+20+5+1 1020 15(20+5+1 390 15(5+1 90 10(1 10 Insumand toate produsele obtinute se obtine P=6815 Pentru calcularea lui Q se porneste din stanga sus si se procedeaza similar. linia 1 +10+15+20+20+15+15+10+35+25+20+5)=5000 20(10+10+15+20+15+15+35+25+20 3300 15(10+10+20+15+35+25 1725 10(10+20+35 650 linia 2 20(10+15+15+20+35+25+20+5 2900 20(15+15+20+35+25+20 2600 15(20+15+35+25 1425 10(20+35 550 linia 3 5(5+20+25+35 425 10(20+25+35 800 15(25+35 900 15(35 525 Q=20800
Cunoscand ca poate lua valori in intervalul -1 si +1, in acest caz, intentiile de cumparare ale produsului culinar testat si varsta exista o corelatie inversa destul de intensa. OBSERVATIE Avand determinate sumele P si Q, se poate calcula si coeficientul de corelatie a rangurilor a lui Kendall, cu formula: in care S=P+Q, iar n este marimea esantionului. Corelatia dintre variabilele metrice In cazul scalelor metrice(de tip interval sau proprotionale) este posibila masurarea distantelor dintre alternative.Astfel, pentru masurarea gradului de asociere a variabilelor masurate pe scale metrice se utilizeaza coeficientul de corelatie a lui Pearson, r.
unde X si Y sunt variabilele masurate cu ajutorul scalelor metrice. EXEMPLU. Se doreste stabilirea corelatie care exista intre modificarea venitului national in ultimii 6 ani intr-o tara oarecare si circulatia turistica interna din tara respectiva-exprimata prin cheltuielile pentru turism ale populatiei. In tabel sunt prezentati indicii cu baza fixa ai celor doua variabile considerate in cei 6 ani si calculele necesare pentru determinarea lui r.
deci valoarea lui r este :
Ridicam la patrat: si obtinem coeficientul de determinare, care indica proportia variatia explicate a uneia din variabile(97%) de catre cealalta variabila. Coeficientul r poate lua valori intre -1 si In cazul considerat, cele doua variabile sunt strans corelate. Pentru a testa gradul de semnificatie, se formuleaza: ipoteza nula H0: r ipoteza alternativa H1: Din tabele, pentru un nivel de incredere de 0,99, valoarea coeficientului Z este de 2,58. Se calculeaza .
Intrucat nu se accepta ipoteza nula, adica valoarea coeficientului de corelatie difera in mod semnificativ de zero. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Politica de confidentialitate
|