ESANTIONAREA SI MODALITATILE DE ESANTIONARE
Procesul esantionarii
O parte foarte importanta a cercetarilor de marketing
necesita obtinerea informatiilor primare necesare analizei, prin sondaj, adica
de la un anumit esantion.
Un esantion se constituie dintr-un numar de unitati
care sunt selectate din randurile acelei populatii care face obiectul
cercetarii. Sensul de populatie
poate fi atribuit oamenilor, in general, cumparatorilor unui anumit produs,
familiilor, agentilor economici de un anumit tip, studentilor etc. In
cercetarea de marketing unitatea de observare va fi constituita din fiecare
element component, simplu sau complex, al populatiei sau colectivitatii
cercetate.
Procesul esantionarii implica o serie de activitati
specifice si anume:
definirea populatiei care face
obiectul cercetarii;
alegerea cadrului de esantionare;
alegerea metodei de esantionare;
stabilirea modalitatilor de selectie
a unitatilor esantionului;
stabilirea mamii esantionului;
alegerea unitatilor efective ale
esantionului;
desfasurarea activitatii de
teren.
Toate aceste activitati se afla in
legatura iar deciziile care se adopta privind realizarea lor sunt puternic
corelate intre ele.
Stabilirea populatiei
cercetate si a cadrului de esantionare
Stabilirea populatiei cercetate sau a populatiei relevante are in vedere
determinarea ansamblului persoanelor sau organizatiilor catre care se
orienteaza cercetarea si asupra carora se vor rasfrange rezultatele cercetarii.
Definirea populatiei trebuie facuta cu
mare atentie pentru a evita, fie tendinta de a alege o populatie nejustificat
de larga, fie tendinta de a alege o populatie nejustificat de restransa. Spre
exemplu, pentru firmele care produc autoturisme, populatia totala o poate reprezenta
populatia intregii tari, inclusiv copii de diferite varste. Dar, populatia
relevanta, care va face obiectul cercetarii, va fi constituita numai din
populatia care are peste 18 ani. Nu se poate admite nici o populatie
nejustificat de restransa cum ar fi, spre exemplu, populatia masculina cuprinsa
intre 25 si 50 de ani. Aceasta poate acoperi o mare parte a pietei
autoturismelor, dar, evident, exclude unele segmente importante.
In practica, in cazul unei esantionari
aleatoare, esantionul va fi ales dintr-o lista a populatiei care deseori
difera, intr-o anumita masura, de populatia care face obiectul cercetarii.
Aceasta lista reprezinta cadrul de esantionare sau baza de esantionare deoarece ea
cuprinde elementele din care urmeaza a se constitui esantionul. Asemenea liste,
spre exemplu, sunt cele care cuprind totalitatea agentilor economici dintr-un
municipiu, judet sau pe ansamblul tarii, listele electorale, cartile de telefon
ale localitatilor, listele cu autovehiculele inmatriculate de catre politie, harta
unui oras cu toate strazile pe care le are s.a. In practica, aceste liste care au rolul de a stabili populatia cadru,
sunt de cele mai multe ori imperfecte iar in multe situatii ele nu exista.
Constituirea
esantionului presupune stabilirea unitatii de esantionare. Unitatea de
esantionare este reprezentata de un element distinct sau un grup de
elemente distincte din cadrul populatiei cercetate, ce poate fi selectat pentru
a forma esantionul. Unitatea de esantionare poate fi o persoana, o familie, o gospodarie,
o firma sau o intreprindere, o localitate etc. Se
impune a preciza ca unitatea de esantionare nu este intotdeauna identica cu
unitatea de analiza. Spre exemplu, in analiza cheltuielilor familiare, unitatea
de esantionare poate fi locuinta sau gospodaria, iar unitatea de analizapoate
fi o persoana sau o familie.
Metode
de esantionare
Se disting doua mari modalitati de esantionare:
1. estionare aleatoare (probabilistica);
2. esantionare nealeatoare (empirica, la intamplare) sau pe
baza de rationament.
Esantionarea aleatoare reprezinta acea tehnica de stabilire a esantionului care presupune faptul
ca fiecare unitate a populatiei cercetate are o anumita probabilitate de a fi
inclusa in esantion, probabilitate
diferita de zero, care poate fi cunoscuta apriori. Practic, aceasta inseamna ca
fiecare unitate a populatiei trebuie sa aibe aceeasi sansa ca toate celelalte
de a figura in esantion.Aceasta conduce la constituirea esantionului prin
tragere la sorti.
Esantionarea nealeatoare reprezinta acea tehnica a
stabilirii esantionului care presupune necunoasterea probabilitatii de
includere in esantion a indivizilor colectivitatii. Selectia are deci un
caracter arbitrar si se bazeaza, in primul rand, pe judecata personala a
cercetatorului presupunand o 'alegere rezonabila'. In anumite
situatii, o asemenea metoda poate fi utila pentru scopurile cercetarii.
Esantionarea probabilistica sau aleatoare
Principalele metode de esantionare aleatoare sunt:
a) esantionarea aleatoare
simpla;
b) esantionarea sistematica;
c) esantionarea
stratificata;
d) esantionarea de grup;
e) esantionarea in trepte.
a) esantionarea aleatoare simpla. Esantionarea aleatoare
simpla sau sondajul probabilistic nerestrictiv este
procedeul care asigura fiecarui element din cadrul populatiei nedivizate o
sansa egala de a fi inclus in esation. Aceasta metoda se utilizeaza atunci cind
populatia cercetata este omogena sau nu poate fi
divizata in straturi. Atunci cand populatia
cuprinde un numar mare de indivizi, alegerea celor care vor constitui
esantionul se face pe baza tabelelor de numere aleatoare sau a numerelor
aleatoare generate de calculator.
b) esantionare sistematica
Esantionarea sistematica reprezinta
procedeul de esantionare care presupune alegerea aleatoare a unui numar de
plecare, de la care, adaugand o marime fixa, predeterminata, va rezulta o unitate a esantionului. Este un
procedeu simplu, bazat deci pe ceeace se cheama metoda intervalului egal sau a pasului mecanic. Marimea acestuia se
determina prin impartirea bazei de esantionare la marimea stabilita a esantionului. Un esantion de 30 persoane dintr-o
populatie de 1200, conduce la o lungime a pasului egala cu 40. Deci, dupa ce se
alege aleator numarul de start, din primele 40 de persoane, sa zicem 15, se vor
alege apoi componentele esantionului la fiecare a 40-a persoana (numerele 55,
95, 95, 135 s.a.m.d.).
c) esantionare stratificata
In cazul unor cercetari de o
complexitate mai mare, populatia cercetata poate fi divizata in straturi sau grupe, avand in vedere anumite
caracteristici. In aceste conditii, din fiecare strat se vor extrage
subesantioane folosind procedeul esantionarii aleatoare simple sau esantionarii
sistematice.
Esantionarea stratificata presupune:
identificarea unei variabile
(sau a catorva) ca baza a stratificarii. Spre exemplu, intr-o analiza a
comportamentului de marketing al intreprinderilor mici si mijlocii, o prima
variabila de stratificare o poate reprezenta domeniul de activitate: industrie,
constructii, comert, servicii. Deci, intreprinderile mici si mijlocii vor
fi impartite pe aceste straturi
distincte, care prezinta omogenitate la nivelul stratului si eterogenitate
intre straturi. O a doua variabila de segmentare, la nivelul fiecarui strat, o
reprezinta marimea intreprinderii in raport cu un anumit criteriu (numarul de
salariati sau cifra de afaceri). Sa presupunem ca avem doua dimensiuni definite
intr-un anumit mod: intreprinderi mici si intreprinderi mijlocii. Deci, vom
avea liste cu intreprinderi repartizate pe domenii de activitate, iar in cadrul
acestora, listele cu intreprinderile considerate mici si listele cu
intreprinderile considerate mijlocii.
din fiecare strat sau substrat se va alege, aleator, un numar de intreprinderi care
vor constitui, prin insumare, esantionul.
Esantionarea stratificata
poate fi realizata in doua moduri: proportional si neproportional.
Atunci
cand componentele esantionului sunt extrase din fiecare strat (sau substrat)
proportional cu marimea relativa a populatiei acestora in totalul populatiei -
cadru, se va obtine un esantion care are la baza o esantionare
stratificata proportional.
Avand
in vedere anumite ipoteze ale cercetarii sau unele consideratii de natura
analitica, din anumite straturi (substraturi) se pot extrage subesantioane care
pot fi mai mari sau mai mici comparartiv cu cele care
ar rezulta din esantionarea proportionala. In acest caz vom
avea o esantionare stratificata neproportional. Spre
exemplu, daca vom porni de la ipoteza ca in cazul intreprinderilor mijlocii
comportamentul de marketing este mai evident, comparativ cu intreprinderile
mici, atunci proportia formarii subesantioanelor corespunzatoare straturilor ce
cuprind intreprinderile mijlocii va fi mai mare decat cea care ar exista in
cazul esantionarii proportionale. Invers, in cazul
intreprinderilor mici.
Sunt si o serie de relatii care se pot folosi
pentru optimizarea marimii subesantioanelor care corespund diferitelor
straturi, a caror insumare o reprezinta esantionul stabilit. In general,
nivelul optim al subesantionului fiecarui strat va
depinde atat de marimea stratului cat si de abaterea standard din interiorul
stratului.
d) esantionarea
de grup
Atunci
cand o anumita populatie se compune din mai multe grupuri eterogene, putem
considera aceste grupuri ca unitati de esantionare distincte din care urmeaza sa constituim esantionul. Esantionul
se costituie deci dintr-un numar de grupuri si nu din unitati elementare
extrase una cate una. In schimb, in cadrul grupurilor extrase aleator vor fi intervievati toti indivizii care fac
parte din ele. Ca exemple de grupuri putem avea: imobilele, care sunt grupuri
de locuinte; gospodariile, care sunt grupuri de indivizi; zborurile aeriene,
care sunt grupuri de pasageri; totalitatea magazinelor cu amanuntul de un
anumit tip de pe raza unui oras constituie, de asemenea, un grup etc.
Esantionarea de grup se utilizeaza indeosebi in situatiile
in care populatia cercetata se prezinta sub forma unei ierarhii. Spre exemplu,
locuitorii unui oras pot fi grupati pe cartiere, fiecare reprezentand un grup;
din randul cartierelor putem alege un esantion constituit din cateva cartiere.
Acestea, la randul lor, cuprind alte grupuri formate din imobile. Din randurile
acestora se alege un esantion. Fiecare imobil are un
numar de locuinte iar fiecare locuinta cuprinde un anumit numar de persoane. In
final, se constituie un esantion din locuinte si apoi se chestioneaza toate
persoanele care compun locuintele respective.In acest mod pot fi supuse
cercetarii bunuri sau servicii cu conditia ca trasaturile si caracteristicile
lor sa fie aceleasi in toate zonele geografice avute in vedere. Aceasta metoda de esantionare este usor de realizat deoarece reduce
foarte mult complexitatea bazei de sondaj. In acest sens, spre exemplu, lista
de persoane a orasului, ca baza de sondaj - practic imposibil de obtinut de
catre cercetatorii de marketing - se inlocuieste cu o lista de cartiere, de
imobile si de locuinte. Aceasta metoda conduce insa la
estimatori mai putin precisi comparativ cu esntionarile elementare. Cu toate
acestea, datorita facilitatilor si costurilor mai reduse pe care le ofera, ea
este utilizata pe scara larga.
Spre
deosebire de esantionarea stratificata care presupune existenta unor grupuri
(straturi) cat mai omogene, esantionarea de grup este cu atat mai eficienta cu
cat acestea sunt mai eterogene si reflecta mai bine structura populatiei. In
mod ideal un grup trebuie sa fie la fel de eterogen precum populatia totala
avuta in vedere.
e) esantionarea in trepte
Aceasta metoda
presupune parcurgerea unor etape succesive numite trepte si este indicata pentru populatiile care sunt organizate pe mai multe niveluri. Intr-o
prima etapa se aleg unitatile din primul nivel de agregare. Aceste unitati se
numesc unitati primare si ele vor constitui baza de sondaj pentru unitatile din
al doilea nivel care se numesc secundare s.a.m.d. pana la constituirea
esantionului. In aceasta situatie exista o dispunere in cascada a bazelor de
sondaj, deoarece unitatile alese intr-o etapa formeaza baza de esantionare pentru
nivelul urmator de esantionare.
Daca, spre exemplu, o intreprindere
producatoare de aparatura audio doreste sa cunoasca atitudinea vanzatorilor cu
amanuntul din intrega tara fata de un nou tip de produs ce urmeaza a fi
distribuit, se poate recurge la o esantionare in trepte. Aceasta metoda
presupune stabilirea initiala a unor mari grupuri de unitati de vanzare care
pot vinde acest produs si care au, de obicei, o determinare geografica (judet,
municipii). Din randul acestor grupuri, sa presupunem ca sunt municipiile de pe
cuprinsul tarii, se aleg aleator un numar relativ redus de grupuri-municipii care vor forma unitatile primare. La fel
ca in cazul esantionarii de grup, se va avea grija ca grupele alese
(municipiile) sa fie cat mai eterogene. Din totalitatea magazinelor cuprinse de
unitatile primare vom constitui apoi un esantion care va fi expresia unitatilor
secundare. In acest caz vom avea un sondaj in doua trepte.
Evident, se poate realiza un sondaj cu mai mult de doua trepte. Esantionarea in
trepte este, dupa cum observam, o combinatie de metode de esantionare:
esantionare de grup si o alta metoda aleatoare care poate fi esantionare
aleatoare simpla, esantionare sistematica sau esantionare stratificata.
Esantionarea nealeatoare
Esantionarea nealeatoare cuprinde, de asemenea, mai multe
metode. Cele mai importante sunt:
a.
esantionarea conventionala (la intamplare);
b.
esantionare logica;
c.
esantionare cota - parte;
d.
esantionarea din aproape in aproape;
e. esantionarea la locul de cumparare sau la locul de
consumare;
a) esantionarea conventionala (la
intamplare)
O
metoda a esantionarii nealeatoare o reprezinta esantionarea conventionala,
convenabila deoarece ea presupune alegerea componentelor esantionului in cel
mai simplu mod posibil: prin oprirea si luarea unor interviuri, de obicei
scurte, a unor persoane aflate in incinta magazinelor sau pe strada. Prin
aceasta metoda foarte economica se realizeaza un esantion care nu poate fi
reprezentativ pentru o anumita populatie sau colectivitate. Concluziile
rezultate, desigur, nu se pot generaliza la nivelul populatiei avute in vedere.
Cu toate acestea, o asemenea metoda este folositoare in cazul unor cercetari
exploratorii care, ulterior, vor fi urmate de cercetari descriptive ce vor
implica esantioane stabilite probabilistic.
b) esantionare logica
In
cadrul esantionarii nealeatoare o alta metoda o reprezinta esantionarea logica.
In acest caz, o persoana cu experienta face o selectie a componentelor
esantionului bazata pe rationamentul sau privind cele mai indicate trasaturi pe
care trebuie sa le posede membrii esantionului. Cercetatorii stabilesc
esantionul avand in vedere anumite scopuri pe care le urmaresc chiar daca ceea
ce rezulta nu poate fi un esantion pe deplin reprezentativ. Spre exemplu, in
cadrul unui test de piata, cercetatorii, pe baza unei analize logice, vor
alege orasele pe care ei le considera ca
fiind cele mai indicate pentru a testa noul produs.
c) esantionare cota - parte
Aceasta
metoda nealeatoare, foarte raspandita, conduce la obtinerea unui esantion in
conditii convenabile sub aspectul timpului si costurilor, care se poate dovedi reprezentativ pentru analiza unor grupuri
variate din cadrul populatiei avute in vedere.
Stabilirea
esantionului cota - parte se face pornind de la doua cerinte:
a) stabilirea caracteristicilor relevante de control;
b) cunoasterea distributiei acestor caracteristici in cadrul populatiei care face obiectul
cercetarii.
Pornind
de la o marime data a esantionului, se determina subesantioanele
corespunzatoare fiecarei caracteristici si fiecarei modalitati de manifestare a
fiecarei caracteristici in parte.
Problema
esentiala care se pune este aceea a identificarii fiecarei persoane care
raspunde simultan criteriilor stabilite. Numai astfel esantionul efectiv
constituit isi poate manifesta nivelul de reprezentativitate stabilit.
e) esantionare la locul de cumparare sau la locul de consumare.
Aceasta metoda empirica presupune stabilirea
populatiei studiate in functie de locul de cumparare a unor bunuri sau
servicii: clientii unui centru comercial, clientii unei anumite retele de
restaurante, vizitatorii unei anumite agenti turistice etc. Spre exemplu, in
cazul unui complex comercial, selectia subiectilor se poate face fie la
intrarile sau iesirile din complex, fie in interiorul lui. De asemenea,
interviurile respective trebuie realizate in anumite perioade de timp
considerate omogene in raport cu clientela unitatii comerciale respective.
Sursele de erori in cadrul anchetelor prin sondaj
Principalele tipuri de erori posibile sunt:
a) eroarea aleatoare de esantionare
b) eroarea sistematica
a) eroarea aleatoare de esantionare
Acest tip de eroare reflecta o fluctuatie de ordin
statistic care apare din cauza
variatiilor de sanse in selectarea unitatilor unui esantion.
Realizarea unei estimatii prin intermediul unui esantion nu
este acelasi lucru ca rezultatul evidentiat de un census (recensamant). In cazul unui census sunt culese informatii de la absolut toate unitatile
populatiei cercetate. In acest context, eroarea aleatoare de esantionare va
apare ca o diferenta intre rezultatele unui esantion si rezultatele unui
census. Eroarea intamplatoare de esantionare depinde de marimea esantionului.
Cu cat esantionul va fi mai mare, cu atat mai mica va fi eroarea aleatoare de
esantionare. Eroarea aleatoare de esantionare se poate estima in functie de
marimea esantionului.
b) Eroarea sistematica
Eroarea sistematica rezulta din factori care nu sunt legati
de marimea esantionului. Acesti factori care genereaza eroarea sistematica sunt
legati de imperfectiunile procesului de esantionare cum ar fi, spre exemplu,
greseli de selectie a unitatilor esantionului, greseli in intocmirea cadrului
de esantionare, greseli de masurare, nonraspunsuri, raspunsuri care nu
corespund realitatii, refuzul de a participa la desfasurarea anchetei etc.
Aceste erori nu se datoresc deci variabilitatii sanselor de a face parte din
esantion si, ca atare, ele se mai numesc erori nonesantion.
Eroarea sistematica exista atunci cand rezultatele
esantionului evidentiaza o tendinta persistentade abatere intr-o directie anume
de la valoarea parametrilor populatiei.
Determinarea marimii esantionului
Parametrii populatiei si
statistica esantionului
In orice cercetare de marketing este extrem de important sa
alegem acele caracteristici ale ale
populatiei cercetate (sex, educatie, profesie, venituri, domiciliu etc.) care
sunt cele mai adecvate in raport cu problema studiata, si purtatoare de
informatie primara. In acest
mod putem face o descriere corecta a populatiei, o putem caracteriza si
segmenta in mod corespunzator. [32, p. 18]
Caracteristicile unei populatii pot
fi masurate prin intermediul parametrilor populatiei precum modulul,
media, dispersia, procentul sau proportia etc. Pentru a clasifica indivizii,
a-i compara sau a stabili relatii intre caracteristicile lor, apare cerinta ca
acestor caracteristici sa le asociem variabile. In functie de scopul
urmarit, unei anumite caracteristici ii putem asocia una sau mai multe
variabile, in functie de cerintele analizei pe care o intreprindem. Avand in
vedere tipul de scala utilizat in procesul masurarii, asa cum cunoastem deja,
variabilele pot fi nominale, ordinale,
interval si proportionale.
Scopul cercetarilor de marketing care
necesita un sondaj ce implica utilizarea unui esantion, este acela de a culege
suficient de multa informatie de la componentii esantionului pentru a face
inferente (extrapolari) privind caracteristicile urmarite, la nivelul intregii
populatii.
La nivelul esantionului vorbim de statistica
esantionului. Ea are menirea de a estima parametrii populatiei. Deci,
determinand media esantionului, procentul esantionului, abaterea standard etc.,
putem estima valoarea parametrilor populatiei precum medie, procent, abatere
standard etc.
Estimarea
reprezinta activitatea prin care exprimam, prin intermediul unor marimi
numerice sau a unui interval de marimi numerice, cu o anumita probabilitate,
valorile necunoscute pentru parametrii sau caracteristicile populatiei
cercetate, pornind de la rezultatele unuia sau mai multor esantioane extrase
din populatia de referinta. Estimarea este expresia procesului de inferenta sau
inductie statistica. Ea se reflecta intr-unul sau mai multi estimatori carora
intotdeauna li se asociaza un nivel de probabilitate ce reflecta increderea pe
care o putem avea in acestia.
Prin intermediul statisticii
esantionului putem realiza o estimare a parametrilor populatiei in doua
modalitati: ca estimare punctuala si ca estimare prin intervalul de incredere. [20, p.125; 177]
Estimarea mediei
In procesul
estimarii, 'media
esantionului' devine un estimator
pentru parametrul media populatiei. Orice valoare particulara luata de
estimator - pentru un esantion dat - se numeste estimatie a parametrului.Valoarea
reala corespunzatoare acestui parametru, asa cum rezulta ea din esantion,
se numeste estimatie punctuala.
In
cazul unei cercetari riguroase nu se utilizeaza estimarile punctuale, deoarece,
acestea, de la un esantion la altul au valori diferite, iar abaterea acestor
valori de la media reala a populatiei (eroarea) nu poate fi cunoscuta.
Cea mai indicata metoda de estimare este metoda estimarii
prin intervalul de estimare. Acesta ofera posibilitatea evidentierii
apartenentei valorii parametrului la intervalul respectiv, cu un nivel de
incredere dorit (nivel de siguranta), stabilit anticipat.
Intervalul de estimare asociat unui nivel de
incredere fixat (90%, 95% etc.) poarta numele de interval de incredere pentru
parametrul estimat. In acest sens, intervalul de incredere pentru parametrul µ este:


unde
zα/2 = valoarea din tabelul repartitiei normale
(distributia z) corespunzatoare nivelului de incredere stabilit (90%, 95%, 99%
etc.)

= media populatiei
Nivelul de incredere exprima
sansele ca valoarea parametrului sa se afle in
intervalul estimat. Diferenta dintre 100% si nivelul de incredere exprimat in
procente, reprezinta, in schimb, 'nesansa' ca intervalul de estimare sa nu contina parametrul estimat. Daca vom nota cu α probabilitatea
acestei erori, atunci α = 1
- (gradul de incredere exprimat ca numar intre 0 si 1) . Astfel, daca vom opta
pentru un nivel de incredere de 95%, aceasta inseamna,
in acelasi timp, o eroare de 5%, adica o nesansa de 5% de a avea o medie de
esantion care sa nu se incadreze in intervalul de incredere stabilit.
Cele
mai folosite nivele de incredere sunt: 90%, 95% si 99%. De
mentionat ca in domeniul economic, inclusiv in cercetarile de marketing,
nivelul de incredere cel mai des folosit este cel de 95%.
Intervalul de incredere se poate determina avand in vedere
doua tipuri de distributie care pot interveni in calculul marimii abaterilor
(erorilor) ± de la media esantionului.
In situatiile in care marimea esantionului este n
30 iar abaterea standard a populatiei nu este cunoscuta, se utilizeaza distributia t
(sau distributia Student).
Distributia t se
aseamana cu distributia normala, avand, ca si aceasta, media zero si unitati de
abateri standard. Forma curbei distributiei t este influentata de numarul
gradelor de libertate.
Prin numar de
grade de libertate se intelege numarul observarilor minus numarul
constrangerilor sau marimii impuse, necesare calcularii unui parametru
statistic.Aceasta inseamna ca o observare (valoarea unui atribut) este libera
daca valoarea ei nu este inca determinata. Calcularea lui t este
asemanatoare cu determinarea valorii z:

avand insa in vedere n - 1 grade de libertate.
Pentru
a cunoaste care din cele doua distributii, z sau t, este cea mai indicata pentru determinarea intervalului de
incredere, sau, asa cum vom sesiza
ulterior, pentru realizarea unui
test de semnificatie statistica, avem doua repere:
a) daca
abaterea standard a populatiei este
cunoscuta, se utilizeaza distributia z indiferent de marimea esantionului;
b) daca
abaterea standard a populatiei este necunoscuta -cazul cel mai frecvent in
studiile de marketing- atunci, in functie de marimea esantionului, putem alege:
-
distributia t daca n
30;
distributia z daca n > 30.
Cu cat marimea esantionului sporeste, cu atat mai mult distributia
t se apropie de distributia z.
Estimarea procentului
Intervalul
de incredere in cazul in care avem in vedere un procent se determina
astfel:
unde p reprezinta estimarea
procentului in caz de succes sau a celor care spun "DA", iar σp
reprezinta abaterea standard de la media procentului in cazul populatiei. Cum pe p practic nu-l putem cunoaste, se recurge la o
estimare a acestuia. Aceasta estimare a abaterii standard de la
media procentelor se determina astfel:
daca avem in vedere o populatie finita si N
20 n
daca
populatia este infinita iar N > 20 n
Marimea esantionului in cazul mediilor
Pentru
a determina marimea unui esantion se impun a
fi luati in considerare trei factori:
a. dispersia
sau varianta;
b.
eroarea acceptata;
c.
nivelul de incredere.
a. varianta sau dispersia populatiei, avand in vedere caracteristica analizata. Modalitatea
statistica de evidentiere a gradului de omogenitate a populatiei in raport cu o
anumita caracteristica, o reprezinta dispersia sau varianta. Pe baza ei putem
determina abaterea standard ca expresie sintetica a nivelului de omogenitate a
populatiei. O abatere standard mica indica un nivel ridicat de omogenitate. Un
nivel ridicat de omogenitate necesita un esantion de dimensiuni mici si invers.
b. marimea erorii admise (E), pe baza careia
determinam intervalul de incredere, ne arata nivelul de precizie al estimarii.
c. nivelul de incredere, care de cele mai multe ori
este stabilit la 95%, ne indica, dupa cum stim, probabilitatea ca valorile
statisticii esantionului sa se gaseasca in intervalul de incredere stabilit.
Pornind de la relatia de calcul pentru intervalul de
incredere, putem determina marimea esantionului avand in vedere un nivel de
incredere dorit si o eroare impusa de nivelul de precizie al cercetarii.
Intervalul de incredere este:

Ca marime absoluta ,

nu reprezinta altceva decat abaterea (±) fata de media populatiei,
respectiv eroarea admisa.
Daca vom nota cu E eroarea limita admisa, avand in vedere o populatie de
dimensiuni foarte mari pentru care dorim
sa calculam media unui parametru,
atunci:
de unde vom deduce marimea sau
volumul unui esantion independent ( extragere cu intoarcere):
unde
z =
valoarea rezultata din tabelul distributiei z, in functie de nivelul de incredere
avut in vedere;
= abaterea standard a populatiei exprimata ca marime absoluta
E = eroarea admisa, exprimata ca marime absoluta
Atunci cand cunoastem dimensiunile populatiei cercetate, in cazul unei
selectii intamplatoare nerepetate (a procedeului extragerii fara intoarcere),
volumul esantionului se determina pe baza relatiei urmatoare:
unde N reprezinta marimea
populatiei cercetate iar celelalte simboluri au semnificatiile mentionate anterior.Trebuie insa mentionat ca atunci cand
N este mare rezultatele esantionarii sunt identice pentru cele doua tipuri de
esantionare. [3, p.234]
Principala
problema care se pune atunci cand vrem sa determinam
marimea esantionului este aceea ca de cele mai multe ori nu cunoastem abaterea
standard a populatiei. In asemenea situatie, apare necesitatea de a estima abaterea
standard a populatiei. Situatia ideala este aceea
cand, pe baza unor studii similare, anterioare, putem avea o baza de estimare a
abaterii standard. In practica, atunci cand nu exista aceasta posibilitate, se
recurge la o ancheta pilot pentru a estima parametrii populatiei, avand la baza
un esantion de dimensiuni mai mici si pe cat posibil si reprezentativ. Pe baza datelor obtinute se calculeaza media, varianta si abaterea
standard. Aceste rezultate se folosesc pentru a
determina marimea esantionului definitiv plecand de la ipoteza ca media si
dispersia acestui esantion sunt aceleasi ca la esantionul pilot.
O alta metoda, des folosita pentru a estima marimea abaterii
standard a populatiei, este aceea de a calcula cat reprezinta 1/6 din diferenta
care exista intre valorile extreme ale caracteristicii studiate. Deci, daca xM
reprezinta valoarea maxima iar xm valoarea minima, in conditiile
unei repartitii normale a valorilor lui x, atunci:

Marimea esntionului in cazul procentelor
Sunt numeroase situatiile in
care cercetatorii trebuie sa determine marimea
esantionului pentru acele caracteristici ale populatiei care sunt exprimate
prin intermediul proportiilor sau procentelor. Si in acest
caz, punctul de plecare il reprezinta cunoasterea intervalului de incredere
determinat pe baza procentelor. Acest interval, dupa cum cunoastem, se determina:

Daca vom nota eroarea ± fata de p, cu E, atunci:
Deoarece
(100 - p) = q, mai putem scrie ca:

unde: z2 = patratul coeficientului z corespunzator nivelului de incredere avut in
vedere;
p = estimarea procentelor in caz de succes sau a celor care spun
'DA';
q = (100 - p), estimarea procentelor in caz de insucces sau a celor
care spun 'NU';
E2 = patratul erorii admise exprimata ca
procente ( E = zSp)
Pentru a stabili marimea esantionului in ipoteza in care nu avem nici o
informatie despre p, atunci se va lua in considerare nivelul maxim pe
care acesta il poate atinge, care este 50%.