Cum să analizezi datele din chestionar în Excel: Ghid complet pentru lucrări de licență și cercetare

By Leonard Cucosro
Statistical TestsExcelResearch Methods

Ai terminat de colectat datele din chestionar pentru lucrarea de licență. Acum te uiți la un tabel Excel plin de numere și te întrebi ce urmează. Acesta este punctul în care majoritatea studenților se blochează.

Vestea bună este că Excel are tot ce ai nevoie pentru a analiza corect datele din chestionar. Nu ai nevoie de software scump precum SPSS. Cu metodele potrivite, poți calcula fiabilitatea, analiza statistici descriptive, testa ipoteze și formata rezultatele pentru lucrarea ta folosind instrumentele pe care le ai deja.

Acest ghid te va conduce prin întregul proces de analiză a datelor din chestionar în Excel. Vei învăța cum să pregătești datele, să verifici fiabilitatea cu Cronbach's Alpha, să calculezi statistici descriptive, să alegi testele statistice potrivite și să scrii rezultatele în format APA. La finalul acestui articol, vei avea un workflow clar de la datele brute din chestionar până la rezultate gata de inclus în lucrare.

Ce vei învăța:

  • Cum să organizezi și să curăți datele din chestionar înainte de analiză
  • Să calculezi Cronbach's Alpha pentru a verifica fiabilitatea scalelor
  • Să calculezi statistici descriptive pentru date de tip Likert
  • Să alegi și să aplici testele statistice potrivite
  • Să creezi tabele de frecvență și tabele încrucișate
  • Să scrii rezultatele statistice în format APA

Pentru a urma acest tutorial, descarcă Survey Analysis Excel Template din secțiunea Descărcări de pe bara laterală.


Ce este analiza datelor din chestionar?

Analiza datelor din chestionar este procesul de transformare a răspunsurilor din chestionar în informații semnificative care răspund la întrebările tale de cercetare. Pentru studenții care lucrează la licență sau disertație, acest proces include de obicei calcularea valorilor de fiabilitate, rezumarea tiparelor de răspuns și testarea ipotezelor despre relațiile dintre variabile.

Majoritatea chestionarelor academice folosesc scale Likert, unde respondenții evaluează acordul lor cu afirmații de la 1 (dezacord total) la 5 (acord total). Aceste răspunsuri necesită tratament special deoarece sunt date ordinale pe care cercetătorii le tratează adesea ca date de interval în scopuri statistice.

Abordarea ta analitică depinde de obiectivele cercetării:

Obiectiv de cercetareMetodă de analiză
Descrierea tiparelor de răspunsFrecvențe, medii, abateri standard
Verificarea calității chestionaruluiFiabilitate Cronbach's Alpha
Compararea a două grupuriTestul t pentru eșantioane independente
Compararea mai multor grupuriANOVA unifactorial
Examinarea relațiilorCorelație Pearson
Predicția rezultatelorAnaliza de regresie

Obiective comune de cercetare și metodele lor statistice corespunzătoare

Înainte de a începe calculele, ai nevoie de date structurate corespunzător. Secțiunea următoare explică cum să pregătești datele din chestionar pentru analiză.


Pregătirea datelor din chestionar pentru analiză

Datele brute din chestionar nu sunt de obicei gata pentru analiză imediat. Studenții fac adesea greșeli în această etapă care cauzează probleme mai târziu. Timpul investit în organizarea și curățarea corectă a datelor previne probleme viitoare.

Structurarea datelor

Tabelul tău Excel ar trebui să urmeze o structură simplă: fiecare rând reprezintă un respondent, și fiecare coloană reprezintă o întrebare sau variabilă. Primul rând conține anteturile coloanelor cu etichete scurte și clare.

Properly organized Excel survey data with headers in row 1 showing ID and Gender and Age and Q1-Q5 and TotalScore columns and numeric responses in rows 2-31 Figura 1: Structura datelor de chestionar organizate corespunzător în Excel

Notă: Setul de date de practică și toate exemplele din acest ghid folosesc nume de coloane în engleză (de exemplu, Gender, AgeGroup, Q1_MeetsExpectations, Loyalty) pentru a urmări standardele internaționale de cercetare și pentru compatibilitate cu software-ul statistic. Aceste nume de variabile vor fi indicate între paranteze de-a lungul ghidului.

Câteva reguli care fac datele gata pentru analiză:

  • Folosește coduri numerice pentru răspunsuri (1-5 pentru scale Likert, 1 pentru da și 0 pentru nu)
  • Păstrează o singură variabilă per coloană
  • Nu îmbina celule și nu adăuga rânduri goale între date
  • Folosește codificări consistente (nu amesteca scale 1-5 cu scale 0-4)

Notă pentru utilizatorii Excel din afara SUA: Separatorii din formulele Excel depind de setările regionale ale sistemului. Dacă sistemul tău folosește virgula ca separator zecimal (de exemplu, 3,14 în loc de 3.14), va trebui să folosești punct și virgulă în loc de virgulă în formule. De exemplu, folosește =COUNTIF(B2:B101;1) în loc de =COUNTIF(B2:B101,1). Toate formulele din acest ghid folosesc formatul american (virgulă). Ajustează conform setărilor tale regionale.

Codificarea variabilelor categoriale

Răspunsurile din chestionar includ adesea date categoriale precum gen (Gender), grup de vârstă (AgeGroup), nivel de educație sau departament. Convertește răspunsurile text în coduri numerice înainte de analiză.

Răspuns originalCod numeric
Masculin1
Feminin2
Nespecificat3

Exemplu de codificare a variabilei categoriale pentru răspunsurile de gen

Creează o foaie separată pentru coduri în fișierul tău Excel care documentează ce înseamnă fiecare număr. Această documentație va fi crucială când interpretezi rezultatele și scrii capitolul de metodologie.

Gestionarea itemilor cu scorare inversă

Unele chestionare includ întrebări formulate negativ pentru a detecta respondenții neatenți. Înainte de a calcula scorurile totale ale scalei, trebuie să inversezi codificarea acestor itemi pentru ca toate răspunsurile să indice aceeași direcție.

Pentru o scală Likert de 5 puncte, formula de inversare este:

Scor Inversat=(Valoarea Maxima˘ a Scalei+1)Scorul Original\text{Scor Inversat} = (\text{Valoarea Maximă a Scalei} + 1) - \text{Scorul Original}

În Excel, dacă valoarea maximă a scalei este 5 și răspunsul original este în celula B2:

=6-B2

Un răspuns de 1 devine 5, un răspuns de 2 devine 4, și așa mai departe. Creează o coloană nouă pentru itemii inversați în loc să suprascrii datele originale.

Identificarea datelor lipsă

Răspunsurile lipsă creează probleme pentru analiza statistică. Înainte de a continua, identifică unde există lacune în setul tău de date.

Folosește funcția COUNTBLANK din Excel pentru a număra celulele goale din fiecare coloană:

=COUNTBLANK(B2:B101)

Aceasta îți spune câți respondenți au sărit peste fiecare întrebare. Un număr mic de valori lipsă este normal. Dacă o întrebare are mult mai multe răspunsuri lipsă decât altele, investighează de ce. Întrebarea ar putea fi confuză sau sensibilă.

Excel COUNTBLANK results showing blank counts for each survey column with Q4 highlighted showing 5 missing values compared to 0-1 for other questions Figura 2: Identificarea datelor lipsă cu funcția COUNTBLANK

Pentru cantități mici de date lipsă, ai câteva opțiuni:

  • Șterge cazurile cu valori lipsă (listwise deletion)
  • Înlocuiește valorile lipsă cu media itemului (mean imputation)
  • Lasă-le așa și permite Excel-ului să ignore celulele goale în calcule

Majoritatea îndrumătorilor de lucrări acceptă listwise deletion când răspunsurile lipsă sunt sub 5%. Documentează metoda ta în capitolul de metodologie.

Calcularea scorurilor totale și pe subscale

Instrumentele din chestionar constau adesea din mai multe subscale care măsoară constructe diferite. Înainte de analiză, calculează scorurile totale pentru fiecare subscală prin însumarea (sau calcularea mediei) itemilor relevanți.

Pentru o scală de „Satisfacție a clienților" cu 5 itemi:

=SUM(B2:F2)

Aceasta calculează scorul total pentru respondentul 1 din itemii din coloanele B până la F. Copiază această formulă în jos pentru toți respondenții.

Folosirea AVERAGE în loc de SUM păstrează scorul pe scala originală 1-5, ceea ce face interpretarea mai ușoară:

=AVERAGE(B2:F2)

Excel showing columns B-F with individual Likert items Q1-Q5 and column G with SUM formula for Satisfaction_Total and column H with AVERAGE formula for Satisfaction_Mean Figura 3: Calcularea scorurilor totale și medii pentru subscale

Odată ce datele tale sunt pregătite, poți verifica dacă scalele tale măsoară în mod fiabil ceea ce pretind că măsoară.


Verificarea fiabilității: Cronbach's Alpha în Excel

Înainte de a analiza rezultatele chestionarului, trebuie să confirmi că chestionarul tău funcționează corect. Cronbach's Alpha îți spune dacă itemii din scala ta măsoară în mod consistent același construct. O scală cu fiabilitate scăzută va produce rezultate în care nu poți avea încredere.

Gândește-te astfel: dacă ai măsura aceeași persoană de două ori cu o scală fiabilă, ai obține scoruri similare. O scală nefiabilă ar da rezultate diferite de fiecare dată, făcând imposibilă tragerea concluziilor corecte.

Când să calculezi Cronbach's Alpha

Calculează fiabilitatea pentru scalele multi-item din chestionarul tău. Dacă folosești un instrument deja dezvoltat precum Job Satisfaction Scale sau Customer Loyalty Index, cercetătorii anteriori au stabilit deja fiabilitatea. Totuși, ar trebui să calculezi Alpha pentru eșantionul tău pentru a confirma că scala funcționează în contextul tău.

Ai nevoie de Cronbach's Alpha când:

  • Chestionarul tău are mai mulți itemi care măsoară un singur construct
  • Plănuiești să însumezi sau să calculezi media itemilor într-un scor de scală
  • Trebuie să demonstrezi că instrumentul tău este de încredere

Nu ai nevoie de el pentru:

  • Scale cu un singur item (o întrebare per construct)
  • Întrebări demografice
  • Întrebări factuale cu răspunsuri concrete

Formula Cronbach's Alpha

Cronbach's Alpha variază de la 0 la 1. Valorile mai mari indică o consistență internă mai puternică între itemii scalei. Formula este:

α=KK1×(1i=1Kσi2σT2)\alpha = \frac{K}{K-1} \times \left(1 - \frac{\sum_{i=1}^{K} \sigma_{i}^{2}}{\sigma_{T}^{2}}\right)

Unde:

  • K este egal cu numărul de itemi din scală
  • σ²ᵢ este egal cu varianța fiecărui item
  • σ²ₜ este egal cu varianța scorului total

Pare complicat, dar Excel face calculul simplu.

Calcul pas cu pas în Excel

Să parcurgem un exemplu cu o scală de satisfacție a clienților de 5 itemi folosind răspunsuri de la 30 de respondenți.

Pasul 1: Calculează varianța fiecărui item

Folosește funcția VAR.S pentru varianța eșantionului. Dacă răspunsurile primului item sunt în coloana B (rândurile 2-31):

=VAR.S(B2:B31)

Repetă pentru fiecare coloană de item. Plasează aceste calcule de varianță într-o zonă de sumar sub datele tale.

Excel showing variance calculations for 5 items in summary section with Item 1 Variance is 1.24, Item 2 is 0.98, Item 3 is 1.15, Item 4 is 1.08, Item 5 is 1.32, with VAR.S formula visible in formula bar Figura 4: Calcularea varianțelor individuale ale itemilor

Pasul 2: Însumează toate varianțele itemilor

Adună toate varianțele individuale ale itemilor:

=SUM(G35:G39)

Dacă varianțele itemilor sunt în celulele G35 până la G39, aceasta îți dă suma varianțelor itemilor.

Pasul 3: Calculează varianța scorului total

Mai întâi, calculează scorul total pentru fiecare respondent prin însumarea itemilor:

=SUM(B2:F2)

Apoi calculează varianța acestor scoruri totale:

=VAR.S(G2:G31)

Pasul 4: Aplică formula Cronbach's Alpha

Cu K egal cu 5 itemi, suma varianțelor itemilor în celula G40, și varianța totală în celula G42:

=(5/4)*(1-(G40/G42))

Excel showing complete Cronbach's Alpha calculation with individual item variances and sum of variances and total score column and total score variance and final Alpha formula showing result of 0.78 Figura 5: Calculul complet al Cronbach's Alpha (α = 0.78)

Interpretarea valorilor Alpha

Odată ce ai coeficientul, folosește acest tabel pentru a interpreta rezultatele:

Valoare AlphaInterpretare
0.90 și pesteExcelent
0.80 până la 0.89Bun
0.70 până la 0.79Acceptabil
0.60 până la 0.69Discutabil
0.50 până la 0.59Slab
Sub 0.50Inacceptabil

Linii directoare pentru interpretarea Cronbach's Alpha în evaluarea fiabilității

Pentru cercetarea de licență/disertație, majoritatea îndrumătorilor se așteaptă la Alpha de 0.70 sau mai mare. Valori între 0.60 și 0.70 pot fi acceptabile pentru cercetare exploratorie sau scale cu mai puțin de 10 itemi (Pallant, 2016).

Dacă Alpha ta este sub nivelul acceptabil, ia în considerare:

  • Eliminarea itemilor care nu corelează cu ceilalți
  • Verificarea itemilor cu scorare inversă pe care e posibil să fi uitat să-i recodifici
  • Examinarea dacă constructul este cu adevărat multidimensional

Raportarea fiabilității în lucrare

Include rezultatele testării fiabilității în capitolul de metodologie sau rezultate. Formatul standard APA:

„Scala de satisfacție a clienților a demonstrat consistență internă acceptabilă (Cronbach's α este egal cu 0.78, 5 itemi)."

Pentru scale multiple, prezintă fiabilitatea în format de tabel:

ScalăNumăr de itemiCronbach's Alpha
Satisfacția clienților50.78
Intenția de cumpărare40.84
Loialitatea față de brand60.91

Exemple de raportare a fiabilității pentru scale multiple

Pentru îndrumări detaliate privind calculul Cronbach's Alpha cu template descărcabil, vezi ghidul nostru complet: Cum să calculezi Cronbach's Alpha în Excel


Statistici descriptive pentru datele din chestionar

Odată ce fiabilitatea este confirmată, poți descrie ce arată datele tale. Statisticile descriptive rezumă tiparele de răspuns și ajută cititorii să înțeleagă eșantionul tău înainte de a prezenta statisticile inferențiale.

Pentru datele din chestionar, vei raporta de obicei frecvențe, măsuri ale tendinței centrale (medie, mediană, mod) și măsuri ale dispersiei (abatere standard, interval). Statisticile specifice depind de nivelul de măsurare și de întrebările tale de cercetare.

Crearea tabelelor de frecvență

Tabelele de frecvență arată cum sunt distribuite răspunsurile în categorii. Ele răspund la întrebări precum „Câți respondenți au fost de acord cu această afirmație?" sau „Ce procentaj de participanți a ales fiecare opțiune?"

Folosește funcția COUNTIF pentru a număra răspunsurile pentru fiecare categorie:

=COUNTIF(B2:B101,1)

Aceasta numără câți respondenți au selectat „1" (dezacord total) în intervalul B2:B101.

Excel showing frequency table construction with raw Likert data on left and summary table on right displaying Response Value and Count and Percentage columns with COUNTIF formula visible Figura 6: Crearea tabelelor de frecvență cu COUNTIF

Pentru a calcula procentajele, împarte fiecare numărătoare la numărul total de răspunsuri:

=D2/SUM($D$2:$D$6)*100

Semnele dolar blochează intervalul total astfel încât să poți copia formula în jos fără ca aceasta să se schimbe.

Un tabel de frecvență complet pentru un item Likert arată astfel:

RăspunsFrecvențăProcent
1 - Dezacord total55.0%
2 - Dezacord1212.0%
3 - Neutru2828.0%
4 - Acord3535.0%
5 - Acord total2020.0%
Total100100.0%

Exemplu de tabel de frecvență pentru un item cu scală Likert de 5 puncte

Calcularea mediei și abaterii standard

Pentru datele de tip Likert, cercetătorii raportează de obicei media și abaterea standard. Aceste statistici rezumă tendința centrală și dispersia răspunsurilor.

Media îți spune care a fost răspunsul mediu al tuturor participanților:

=AVERAGE(B2:B101)

Abaterea standard indică cât de mult variază răspunsurile față de medie:

=STDEV.S(B2:B101)

Folosește STDEV.S (abaterea standard a eșantionului) în loc de STDEV.P pentru că respondenții tăi reprezintă un eșantion dintr-o populație mai mare.

Excel showing mean and SD calculations for multiple survey items in summary table with columns for Item and Mean and SD displaying 5 rows with AVERAGE function visible in formula bar Figura 7: Rezumatul mediilor și deviațiilor standard

Rezumarea scorurilor de scală

Odată ce ai calculat scorurile totale sau medii pentru scalele tale, raportează statistici descriptive și pentru aceste scoruri agregate.

Pentru o scală de satisfacție în care ai calculat media itemilor 1-5:

MăsurăValoare
Medie3.67
Abatere standard0.82
Minim1.40
Maxim5.00
Interval3.60

Statistici sumare pentru scorul unei scale agregate

Calculează folosind:

Medie: =AVERAGE(G2:G101)
AS: =STDEV.S(G2:G101)
Min: =MIN(G2:G101)
Max: =MAX(G2:G101)
Interval: =MAX(G2:G101)-MIN(G2:G101)

Interpretarea mediilor pe scale Likert

O întrebare frecventă este „Ce înseamnă o medie de 3.67?" Interpretarea depinde de ancorele scalei.

Pentru o scală Likert standard de 5 puncte privind acordul:

Interval medieInterpretare
1.00 până la 1.80Dezacord total
1.81 până la 2.60Dezacord
2.61 până la 3.40Neutru
3.41 până la 4.20Acord
4.21 până la 5.00Acord total

Linii directoare pentru interpretarea mediilor scale Likert de 5 puncte

O medie a satisfacției de 3.67 se încadrează în intervalul „Acord", sugerând că respondenții în general au exprimat niveluri pozitive de satisfacție.

Fii prudent să nu interpretezi excesiv diferențe mici. O medie de 3.52 versus 3.48 ar putea să nu reprezinte o diferență semnificativă. Uită-te la abaterile standard și efectuează teste statistice înainte de a pretinde că diferențele sunt semnificative.

Statistici descriptive pe grupuri

Adesea trebuie să compari statisticile descriptive între grupuri, cum ar fi bărbați versus femei sau diferite grupe de vârstă. Creează calcule separate pentru fiecare subgrup.

Funcția AVERAGEIF calculează media pentru un grup specific:

=AVERAGEIF(A2:A101,"Masculin",G2:G101)

Aceasta calculează scorul mediu de satisfacție doar pentru respondenții codificați ca „Male" în coloana Gen (Gender).

Excel showing grouped descriptive statistics comparison table with columns for Group and N and Mean and SD displaying Male and Female rows with AVERAGEIF formula in formula bar Figura 8: Statistici descriptive pe grupuri folosind AVERAGEIF

Pentru abaterea standard pe grupuri, va trebui să folosești DSTDEV cu un interval de criterii, sau să filtrezi datele și să calculezi separat.

Formatarea statisticilor descriptive pentru lucrare

Prezintă statisticile descriptive în tabele clare. Formatul APA necesită formatare specifică:

Tabelul 1 Statistici descriptive pentru itemii scalei de satisfacție a clienților

ItemMAS
Produsul a îndeplinit așteptările mele3.820.98
Sunt mulțumit de această achiziție3.671.05
Calitatea corespunde prețului3.541.12
Aș cumpăra din nou acest produs3.910.89
Per total, sunt fericit cu produsul3.780.94
Scor total scală3.740.82

Exemplu de prezentare a statisticilor descriptive în format APA

Notă. N este egal cu 100. Răspunsurile au fost măsurate pe o scală Likert de 5 puncte (1 pentru dezacord total, 5 pentru acord total).

Puncte cheie de formatare:

  • Folosește M pentru medie și AS pentru abatere standard
  • Raportează două zecimale pentru medii și abateri standard
  • Include dimensiunea eșantionului și descrierea scalei în notă
  • Scrie titlul tabelului cu italic

Analiza datelor de tip Likert

Scalele Likert necesită atenție specială deoarece se află într-o zonă gri între date ordinale și de interval. Înțelegerea modului de analiză corectă a acestor răspunsuri previne erori care ar putea invalida rezultatele tale.

Dezbaterea ordinal versus interval

Tehnic, răspunsurile Likert sunt date ordinale. Diferența dintre „acord" și „acord total" ar putea să nu fie egală cu diferența dintre „dezacord" și „neutru". Cu toate acestea, cercetătorii tratează în mod obișnuit scalele Likert de 5 și 7 puncte ca date de interval în scopuri practice.

Această practică este general acceptată când:

  • Scala ta are cel puțin 5 puncte
  • Opțiunile de răspuns sunt spațiate uniform (1, 2, 3, 4, 5)
  • Analizezi scoruri agregate de scală mai degrabă decât itemi individuali

Când însumezi sau calculezi media mai multor itemi Likert într-un scor de scală, rezultatul aproximează mai bine date de interval și poate fi analizat cu statistici parametrice.

Calcularea mediilor de construct

Când chestionarul tău măsoară un construct teoretic cu mai mulți itemi, calculează un scor mediu din acești itemi pentru fiecare respondent. Aceasta creează o singură variabilă reprezentând acel construct.

Dacă itemii Q1 până la Q5 (Q1_MeetsExpectations, Q2_Satisfied, Q3_ValueForMoney, Q4_WouldBuyAgain, Q5_OverallHappy) măsoară „Satisfacția în muncă":

=AVERAGE(B2:F2)

Copiază în jos pentru toți respondenții. Coloana rezultată conține scorul de satisfacție al fiecărei persoane pe scala originală 1-5.

Excel showing individual item columns Q1-Q5 with various Likert values and new column JobSat_Mean with AVERAGE formula calculating to value 3.60 for first respondent Figura 9: Calcularea scorurilor medii de construct din mai multe itemi

Gestionarea răspunsurilor neutre

Punctul de mijloc al scalei Likert (de obicei „neutru" sau „nici acord nici dezacord") primește adesea cele mai multe răspunsuri. Răspunsurile neutre excesive ar putea indica:

  • Respondenții sunt cu adevărat ambivalenți
  • Întrebarea este confuză sau irelevantă
  • Respondenții fac „satisficing" (aleg opțiunea de mijloc ușoară)

Verifică frecvența răspunsurilor neutre pentru fiecare item. Dacă o întrebare are semnificativ mai multe răspunsuri neutre decât altele, investighează formularea.

Crearea variabilelor grupate

Uneori trebuie să restrângi răspunsurile Likert în mai puține categorii pentru analiză sau raportare. De exemplu, combinarea „acord" și „acord total" într-o singură categorie „acord".

Folosește funcții IF imbricate:

=IF(B2<=2,"Dezacord",IF(B2=3,"Neutru","Acord"))

Aceasta recodifică răspunsurile 1-2 ca „Dezacord", 3 ca „Neutru", și 4-5 ca „Acord".

Scală originalăCategorie grupată
1 - Dezacord totalDezacord
2 - DezacordDezacord
3 - NeutruNeutru
4 - AcordAcord
5 - Acord totalAcord

Exemplu de grupare a răspunsurilor Likert în trei categorii

Variabilele grupate funcționează bine pentru prezentarea rezultatelor către audiențe non-tehnice. În loc să spui „media a fost 3.67," poți raporta „55% dintre respondenți au fost de acord sau total de acord."

Greșeli comune cu datele Likert

Mai multe greșeli apar frecvent în lucrările care implică scale Likert:

Greșeala 1: Analizarea itemilor individuali cu statistici parametrice

Efectuarea unui test t pe un singur item Likert încalcă presupunerile despre măsurarea la nivel de interval. Folosește în schimb statistici non-parametrice (Mann-Whitney U) sau analizează scoruri agregate de scală.

Greșeala 2: Uitarea de a inversa scorarea itemilor negativi

Dacă scala ta include itemi formulați negativ, neaplicarea scorării inverse înainte de agregare va corupe scorurile de scală. Verifică întotdeauna chestionarul original pentru itemii care necesită scorare inversă.

Greșeala 3: Tratarea punctului neutru ca „date lipsă"

Unii studenți exclud răspunsurile neutre din analiză, presupunând că acești respondenți nu au avut o opinie. Aceasta creează bias. Neutru este un răspuns valid care ar trebui inclus.

Greșeala 4: Supra-interpretarea diferențelor zecimale

O medie de 3.65 nu este semnificativ diferită de 3.58 fără un test statistic care să confirme semnificația. Raportează mărimea efectului alături de valorile p pentru a determina semnificația practică.

Pentru îndrumări detaliate privind dezvoltarea și analiza scalelor, vezi articolul nostru despre Cum să calculezi Cronbach's Alpha în Excel care acoperă analiza itemilor și testarea fiabilității.


Testarea ipotezelor în Excel

Statisticile descriptive îți spun ce s-a întâmplat în eșantionul tău. Testarea ipotezelor îți spune dacă acele descoperiri se generalizează la o populație mai largă. Alegerea testului statistic potrivit depinde de întrebarea ta de cercetare, numărul de grupuri pe care le compari și tipul de date pe care le-ai colectat.

Alegerea testului statistic potrivit

Folosește acest cadru de decizie pentru a selecta testul tău statistic:

Care e obiectivul cercetării?Comparare mediiRelațiiFrecvențe2 Grupuri3+ GrupuriAceiași oameni?(pre/post)Test tPerechiDaTest tIndependentNuANOVAcu o calePutere?Predicție?CorelațiePearsonRegresieLiniarăVariabilecategoriale?TestulChi-pătratLegendă:Start / Obiectiv cercetarePunct de decizieTest statistic

Figura 10: Diagrama de decizie pentru selectarea testelor statistice adecvate

Întrebare de cercetareNumăr de grupuriTest statistic
Există diferență între mediile a două grupuri?2 grupuri independenteTestul t independent
Se schimbă scorurile de la pre-test la post-test?2 măsurători perecheTestul t pentru perechi
Există diferență între mai multe grupuri?3 sau mai multe grupuriANOVA unifactorial
Există relație între două variabile?Nu se aplicăCorelație Pearson
O variabilă poate prezice alta?Nu se aplicăRegresie liniară

Ghid de selecție a testelor statistice bazat pe tipul întrebării de cercetare

Înainte de a efectua orice test, confirmă că datele tale îndeplinesc presupunerile necesare. Majoritatea statisticilor parametrice presupun distribuție normală și varianțe egale. Pentru eșantioane mici sau date non-normale, ia în considerare alternative non-parametrice.

Efectuarea testului t în Excel

Testul t compară mediile între două grupuri. Excel oferă aceasta prin Data Analysis Toolpak.

Activarea Data Analysis Toolpak:

  1. Click pe File apoi Options
  2. Selectează Add-ins din meniul din stânga
  3. În partea de jos, selectează Excel Add-ins și click Go
  4. Bifează Analysis ToolPak și click OK

Opțiunea Data Analysis va apărea în tab-ul Data. Pentru instrucțiuni detaliate cu capturi de ecran, vezi ghidul nostru: Cum să activezi Data Analysis în Excel.

Efectuarea testului t pentru eșantioane independente:

Să presupunem că vrei să compari scorurile de satisfacție între respondenți masculini și feminini.

  1. Click pe Data apoi Data Analysis
  2. Selectează t-Test: Two-Sample Assuming Equal Variances
  3. Pentru Variable 1 Range, selectează scorurile de satisfacție masculine
  4. Pentru Variable 2 Range, selectează scorurile de satisfacție feminine
  5. Setează Alpha la 0.05
  6. Alege o locație pentru output și click OK

Excel Data Analysis dialog box with t-Test selected showing input fields filled with sample data ranges and alpha set to 0.05 and output options visible Figura 11: Configurarea testului t pentru eșantioane independente

Interpretarea rezultatelor testului t:

Excel va genera un tabel cu mai multe statistici. Concentrează-te pe aceste valori cheie:

Valoare OutputSemnificație
MeanScorul mediu pentru fiecare grup
VarianceRăspândirea scorurilor în cadrul fiecărui grup
t StatValoarea t calculată
P(T mai mic sau egal cu t) two-tailValoarea p pentru test bilateral
t Critical two-tailValoarea t prag pentru semnificație

Valori cheie din output-ul testului t în Excel

Dacă valoarea p este mai mică de 0.05, diferența dintre grupuri este semnificativă statistic. Dacă valoarea p depășește 0.05, nu poți concluziona că grupurile diferă.

Excel t-test output table highlighting key values including Mean for each group showing 3.52 vs 3.78 and t Stat showing -2.14 and P two-tail showing 0.035 with annotation pointing to p-value Figura 12: Rezultatul testului t arătând o diferență semnificativă (p = 0.035)

Pentru un tutorial complet despre testul t cu instrucțiuni pas cu pas, vezi ghidul nostru: Testul t în Excel: Ghid complet

Efectuarea ANOVA unifactorial

Când compari trei sau mai multe grupuri, folosește ANOVA în loc de teste t multiple. Efectuarea mai multor teste t crește rata de eroare de tip I, făcând rezultatele fals pozitive mai probabile.

Exemplu: Compararea scorurilor de satisfacție între trei grupe de vârstă (18-25, 26-40, 41+)

  1. Aranjează datele cu fiecare grup într-o coloană separată
  2. Click pe Data apoi Data Analysis
  3. Selectează Anova: Single Factor
  4. Selectează intervalul de input care acoperă toate coloanele de grupuri
  5. Selectează Labels dacă primul rând conține anteturi
  6. Setează Alpha la 0.05
  7. Click OK

Excel showing ANOVA setup with three columns of data labeled Age 18-25 and Age 26-40 and Age 41+ containing satisfaction scores and Anova dialog box with correct settings Figura 13: Configurarea ANOVA unifactorial pentru trei grupuri de vârstă

Excel ANOVA output table showing F statistic of 61.60 and p-value of 6.156E-18 indicating highly significant differences between age groups Figura 14: Rezultatul ANOVA arătând diferențe extrem de semnificative

Interpretarea rezultatelor ANOVA:

Output-ul include două tabele. Tabelul Summary arată statistici descriptive pentru fiecare grup. Tabelul ANOVA arată rezultatele testului.

Valori cheie de raportat:

SursăSSdfMSFP-value
Between Groups12.4526.224.180.018
Within Groups144.32971.49
Total156.7799

Exemplu de output tabel ANOVA din Excel

Dacă valoarea p este mai mică de 0.05, cel puțin un grup diferă semnificativ de celelalte. ANOVA nu îți spune care grupuri diferă specific. Pentru aceasta, trebuie să efectuezi teste post-hoc (care necesită calcule suplimentare sau alt software).

Calcularea corelației în Excel

Corelația măsoară puterea și direcția relației dintre două variabile continue. Folosește-o când vrei să știi dacă valorile mai mari pe o variabilă se asociază cu valori mai mari (sau mai mici) pe alta.

Folosind funcția CORREL:

De exemplu, pentru a corela Satisfacția (Satisfaction_Mean) cu Loialitatea (Loyalty):

=CORREL(B2:B101,C2:C101)

Aceasta calculează coeficientul de corelație Pearson între datele din coloanele B și C.

Interpretarea coeficienților de corelație:

Coeficientul variază de la -1 la +1:

CoeficientInterpretare
0.90 până la 1.00Corelație pozitivă foarte puternică
0.70 până la 0.89Corelație pozitivă puternică
0.40 până la 0.69Corelație pozitivă moderată
0.10 până la 0.39Corelație pozitivă slabă
0.00 până la 0.09Nesemnificativă
-0.10 până la -0.39Corelație negativă slabă
-0.40 până la -0.69Corelație negativă moderată
-0.70 până la -0.89Corelație negativă puternică
-0.90 până la -1.00Corelație negativă foarte puternică

Linii directoare pentru interpretarea puterii corelației Pearson

Un coeficient pozitiv înseamnă că variabilele se mișcă împreună. Un coeficient negativ înseamnă că se mișcă în direcții opuse. Cu cât este mai aproape de 1 sau -1, cu atât relația este mai puternică.

Excel showing correlation calculation with two columns of data for Satisfaction and Loyalty and CORREL formula returning 0.67 and small scatter plot visualizing positive relationship Figura 15: Corelația Pearson arătând o relație pozitivă puternică (r = 0.67)

Testarea semnificației statistice:

Funcția CORREL nu oferă o valoare p. Pentru a determina dacă corelația ta este semnificativă, compară cu valori critice sau folosește Data Analysis Toolpak:

  1. Click pe Data apoi Data Analysis
  2. Selectează Correlation
  3. Selectează intervalul de date
  4. Click OK

Aceasta generează o matrice de corelație dar tot îi lipsesc valorile p. Pentru lucrări, ar putea fi nevoie să calculezi manual valoarea p sau să folosești formula pentru statistica t din corelație:

t=rn21r2t = r \sqrt{\frac{n-2}{1-r^2}}

Unde r este coeficientul de corelație și n este dimensiunea eșantionului. Compară această valoare t cu valoarea critică pentru gradele tale de libertate (n-2).

Pentru un ghid detaliat incluzând testarea semnificației, vezi: Cum să calculezi corelația Pearson în Excel


Tabele încrucișate și analiza Chi-Square

Tabularea încrucișată examinează relațiile dintre două variabile categoriale. Răspunde la întrebări precum „Există o relație între gen și preferința de produs?" sau „Diferite grupe de vârstă aleg niveluri de satisfacție diferite?"

Crearea tabelelor încrucișate cu PivotTables

PivotTables sunt cea mai ușoară metodă de a crea tabele încrucișate în Excel.

  1. Selectează-ți datele incluzând anteturile
  2. Click pe Insert apoi PivotTable
  3. Alege unde să plasezi PivotTable-ul
  4. Trage o variabilă în Rows
  5. Trage cealaltă variabilă în Columns
  6. Trage oricare variabilă în Values (setează la Count)

Excel PivotTable setup for cross-tabulation showing field list with Gender dragged to Rows and SatisfactionLevel to Columns and Gender to Values displaying Count with resulting frequency table Figura 16: Crearea tabelului încrucișat cu PivotTable

Exemplu de output tabel încrucișat:

NemulțumitNeutruMulțumitTotal
Masculin8152245
Feminin5183255
Total133354100

Exemplu de tabel încrucișat arătând relația dintre gen și satisfacție

Pentru a afișa procentaje în loc de numărători:

  1. Click pe orice număr din zona Values
  2. Click dreapta și selectează Show Values As
  3. Alege % of Row Total sau % of Column Total

Interpretarea rezultatelor tabelului încrucișat

Tabularea încrucișată relevă tipare în modul în care categoriile se raportează una la alta. În exemplul de mai sus:

  • 49% dintre bărbați sunt mulțumiți comparativ cu 58% dintre femei
  • Bărbații au o rată mai mare de nemulțumire (18%) versus femei (9%)

Totuși, aceste diferențe descriptive nu confirmă o relație semnificativă statistic. Pentru aceasta, ai nevoie de testul Chi-Square.

Testul Chi-Square pentru independență

Testul Chi-Square determină dacă relația dintre două variabile categoriale este semnificativă statistic sau probabil datorată întâmplării.

Excel nu are un test Chi-Square încorporat, dar îl poți calcula folosind formule.

Pasul 1: Calculează frecvențele așteptate

Pentru fiecare celulă, frecvența așteptată este:

E=(Total Raˆnd)×(Total Coloana˘)Total GeneralE = \frac{(\text{Total Rând}) \times (\text{Total Coloană})}{\text{Total General}}

Pentru celula Masculin/Nemulțumit: (45 × 13) / 100 este egal cu 5.85

Pasul 2: Calculează Chi-Square

χ2=(OE)2E\chi^2 = \sum \frac{(O - E)^2}{E}

Unde O este frecvența observată și E este frecvența așteptată.

Creează un tabel de valori așteptate, apoi calculează contribuția chi-square pentru fiecare celulă și însumează-le.

Pasul 3: Determină semnificația

Folosește funcția CHISQ.TEST din Excel:

=CHISQ.TEST(IntervalObservat, IntervalAșteptat)

Aceasta returnează valoarea p. Dacă este mai mică de 0.05, relația este semnificativă.

Excel showing Chi-Square calculation setup with observed frequencies table and expected frequencies table calculated and CHISQ.TEST formula returning p value 0.042 with annotation indicating significance Figura 17: Calculul testului Chi-Square cu frecvențele observate și așteptate


Vizualizarea rezultatelor din chestionar

Graficele traduc numerele în formate pe care cititorii le pot înțelege imediat. Pentru datele din chestionar, anumite tipuri de grafice comunică descoperirile mai eficient decât altele.

Grafice cu bare pentru frecvențe

Graficele cu bare funcționează cel mai bine pentru a arăta cum sunt distribuite răspunsurile în categorii. Folosește-le pentru:

  • Distribuții de răspunsuri Likert
  • Comparații între grupuri
  • Defalcări demografice

Creează un grafic cu bare din tabelul tău de frecvență:

  1. Selectează etichetele categoriilor și valorile de frecvență
  2. Click pe Insert și alege Bar Chart sau Column Chart
  3. Formatează cu etichete clare și culori potrivite

Horizontal bar chart showing Likert response distribution with five bars labeled Strongly Disagree through Strongly Agree with data labels showing percentages and title Customer Satisfaction Responses N is 100 Figura 18: Diagramă cu bare afișând distribuția răspunsurilor pe scala Likert

Sfaturi de formatare:

  • Folosește o singură culoare sau un gradient (evită culorile curcubeu)
  • Ordonează barele logic (pentru Likert, păstrează ordinea 1-5)
  • Include etichete de date sau o axă clară cu valori
  • Adaugă dimensiunea eșantionului în titlu sau notă

Comparații între grupuri cu grafice cu bare grupate

Când compari răspunsuri între grupuri, graficele cu bare grupate plasează barele una lângă alta pentru comparare ușoară.

  1. Creează un tabel sumar cu grupurile pe rânduri și categoriile de răspuns pe coloane
  2. Selectează datele și inserează un Clustered Bar Chart
  3. Fiecare cluster reprezintă o categorie de răspuns cu bare pentru fiecare grup

Clustered bar chart comparing Male and Female responses across satisfaction levels with three clusters for Dissatisfied, Neutral, Satisfied each containing two bars colored blue for Male and orange for Female with clear legend Figura 19: Diagramă cu bare grupate pentru compararea grupurilor

Histograme pentru variabile continue

Pentru scorurile agregate de scală care aproximează date continue, histogramele arată forma distribuției.

  1. Folosește Data Analysis Toolpak
  2. Selectează Histogram
  3. Specifică intervalul de input și intervalul de bin
  4. Selectează Chart Output

Histogram showing distribution of satisfaction scale scores with x-axis showing score bins 1.0-1.9 through 5.0-5.9, y-axis showing frequency, bell-shaped distribution centered around 3.5-3.9 Figura 20: Histogramă arătând distribuția scorurilor pe scală compozită

Formatarea graficelor pentru lucrare

Graficele academice necesită formatare specifică:

  • Elimină elementele decorative (linii de grilă, chenare, efecte 3D)
  • Folosește nuanțe de gri sau pattern-uri dacă se printează alb-negru
  • Numerotează figurile secvențial (Figura 1, Figura 2)
  • Plasează titlul sub figură în format APA
  • Include note care explică abrevierile sau dimensiunea eșantionului

Cum să scrii rezultatele pentru lucrare

Calcularea statisticilor este doar jumătate din muncă. Comunicarea clară a rezultatelor determină dacă comisia de evaluare va înțelege descoperirile tale. Această secțiune oferă șabloane pe care le poți adapta pentru propriile rezultate.

Bazele formatului APA

Majoritatea disciplinelor academice folosesc formatul APA pentru raportarea statisticilor. Convenții cheie:

  • Scrie simbolurile statistice cu italic: M, SD, t, F, r, p
  • Raportează valorile p exacte cu trei zecimale (p este egal cu .034)
  • Folosește zero înainte de punct pentru statistici care pot depăși 1 (M este egal cu 0.75)
  • Fără zero înainte de punct pentru statistici cuprinse între 1 (r este egal cu .67, p este egal cu .034)
  • Rotunjește la două zecimale dacă nu este necesară mai multă precizie

Raportarea statisticilor descriptive

Pentru o singură variabilă:

Participanții au raportat niveluri moderat-ridicate de satisfacție față de serviciu (M este egal cu 3.67, SD este egal cu 0.82).

Pentru variabile pe grupuri:

Participanții de sex masculin (M este egal cu 3.52, SD este egal cu 0.79) au raportat satisfacție mai scăzută decât participanții de sex feminin (M este egal cu 3.78, SD este egal cu 0.84).

În tabele:

Tabelul 2 prezintă statisticile descriptive pentru toate variabilele din studiu.

Raportarea rezultatelor testului t

Rezultat semnificativ:

Testul t pentru eșantioane independente a relevat o diferență semnificativă în satisfacție între bărbați (M este egal cu 3.52, SD este egal cu 0.79) și femei (M este egal cu 3.78, SD este egal cu 0.84), t(98) este egal cu -2.14, p este egal cu .035.

Rezultat nesemnificativ:

Diferența în satisfacție între bărbați (M este egal cu 3.52, SD este egal cu 0.79) și femei (M este egal cu 3.58, SD este egal cu 0.81) nu a fost semnificativă statistic, t(98) este egal cu -0.42, p este egal cu .677.

Formatul este: t(grade de libertate) este egal cu valoarea t, p este egal cu valoarea p

Raportarea rezultatelor ANOVA

Rezultat semnificativ:

ANOVA unifactorial a indicat o diferență semnificativă în satisfacție între grupele de vârstă, F(2, 97) este egal cu 4.18, p este egal cu .018.

Cu analize post-hoc:

Comparațiile post-hoc folosind testul Tukey au relevat că participanții de 41+ ani (M este egal cu 4.02, SD este egal cu 0.72) au raportat satisfacție semnificativ mai mare decât cei din grupa 18-25 (M este egal cu 3.45, SD este egal cu 0.89), p este egal cu .014. Grupa 26-40 (M este egal cu 3.68, SD este egal cu 0.78) nu a diferit semnificativ de niciun grup.

Raportarea rezultatelor corelației

Corelație semnificativă:

A existat o corelație pozitivă puternică între satisfacția clienților și loialitatea față de brand, r(98) este egal cu .67, p mai mic decât .001. Satisfacția mai mare a fost asociată cu loialitate mai mare.

Corelație nesemnificativă:

Relația dintre satisfacție și vârstă nu a fost semnificativă statistic, r(98) este egal cu .12, p este egal cu .231.

Raportarea fiabilității

Scală unică:

Scala de satisfacție a clienților a demonstrat consistență internă bună (Cronbach's α este egal cu .84).

Scale multiple:

Consistența internă a fost acceptabilă pentru toate scalele: satisfacția clienților (α este egal cu .84), intenția de cumpărare (α este egal cu .78), și loialitatea față de brand (α este egal cu .91).

Șabloane gata de folosit

Iată șabloane de completat pentru analize comune:

Șablon statistici descriptive:

Participanții au avut scoruri [ridicate/moderate/scăzute] pe [numele variabilei] (M este egal cu [medie], SD este egal cu [SD]).

Șablon test t:

Testul t pentru eșantioane independente [a relevat/nu a relevat] o diferență semnificativă în [VD] între [grupul 1] (M este egal cu [medie], SD este egal cu [SD]) și [grupul 2] (M este egal cu [medie], SD este egal cu [SD]), t([gl]) este egal cu [valoare t], p este egal cu [valoare p].

Șablon ANOVA:

ANOVA unifactorial [a indicat/nu a indicat] o diferență semnificativă în [VD] între [variabila de grupare], F([gl1], [gl2]) este egal cu [valoare F], p este egal cu [valoare p].

Șablon corelație:

A existat o corelație [puternică/moderată/slabă] [pozitivă/negativă] între [variabila 1] și [variabila 2], r([gl]) este egal cu [valoare r], p este egal cu [valoare p].


Greșeli de evitat

Chiar și cercetătorii experimentați fac greșeli când analizează date din chestionar. Învățarea din greșelile comune te ajută să produci rezultate mai credibile.

Greșeala 1: Folosirea testului statistic greșit

Alegerea unui test statistic bazat pe ce vrei să găsești în loc de ce susțin datele duce la concluzii invalide. Lasă întotdeauna întrebarea de cercetare și tipul de date să ghideze selecția testului. Testele t necesită o variabilă dependentă continuă. Chi-square necesită variabile categoriale. Amestecarea acestora produce rezultate fără sens.

Greșeala 2: Ignorarea presupunerilor

Statisticile parametrice presupun distribuție normală și varianțe egale. Sărirea verificărilor presupunerilor nu face încălcările să dispară. Verifică normalitatea folosind histograme sau testul Shapiro-Wilk. Verifică omogenitatea varianțelor folosind testul Levene. Când presupunerile sunt încălcate, folosește alternative non-parametrice sau transformă datele.

Greșeala 3: P-Hacking

Efectuarea mai multor teste până când găsești semnificație, apoi raportarea doar a acelor rezultate, umflă rata de fals pozitiv. Dacă testezi 20 de relații la α egal cu .05, te aștepți la un rezultat semnificativ întâmplător. Raportează toate analizele efectuate, chiar și cele nesemnificative. Ia în considerare ajustarea pentru comparații multiple folosind corecția Bonferroni.

Greșeala 4: Confundarea corelației cu cauzalitatea

O corelație semnificativă între satisfacție și loialitate nu dovedește că satisfacția cauzează loialitate. Relația ar putea fi inversă (loialitatea cauzează satisfacție) sau ambele ar putea fi cauzate de o a treia variabilă. Doar designurile experimentale cu randomizare pot stabili cauzalitatea.

Greșeala 5: Supra-interpretarea rezultatelor pe eșantioane mici

Testele statistice cu eșantioane mici (sub 30) au putere scăzută, însemnând că ar putea rata efecte reale. De asemenea, produc estimări instabile care s-ar putea să nu se replice. Fii prudent în generalizarea din eșantioane mici. Raportează limitările privind dimensiunea eșantionului în capitolul de discuții.

Greșeala 6: Uitarea de a verifica fiabilitatea înainte de analiză

Folosirea scalelor nefiabile invalidează toate analizele ulterioare. O scală cu α egal cu .55 introduce atât de multă eroare de măsurare încât orice relații pe care le găsești sunt suspecte. Verifică și raportează întotdeauna Cronbach's Alpha înainte de a efectua teste de ipoteze.

Greșeala 7: Negestionarea datelor lipsă

Ignorarea valorilor lipsă sau gestionarea lor inconsecventă creează bias. Documentează câte cazuri au date lipsă, ce variabile sunt afectate și cum ai abordat problema. Metodele comune includ listwise deletion, pairwise deletion și mean imputation. Fiecare are compromisuri pe care ar trebui să le recunoști.


Template Excel: Kit de analiză pentru chestionar

Pentru a te ajuta să implementezi aceste tehnici, am creat un template Excel cu formule pre-construite pentru analize comune de chestionar.

Ce include template-ul:

  • Foaie de introducere a datelor cu structură adecvată
  • Calcul automat Cronbach's Alpha
  • Rezumat statistici descriptive
  • Generator de tabele de frecvență
  • Calculator pentru testul t
  • Matrice de corelație
  • Template-uri de grafice

Cum să folosești:

  1. Descarcă template-ul din bara laterală
  2. Introdu răspunsurile din chestionar în foaia Data
  3. Foaia Summary va calcula automat statisticile cheie
  4. Folosește foaia Analysis pentru testarea ipotezelor
  5. Copiază template-urile de grafice și actualizează-le cu datele tale

Excel template showing multiple tabs including Data and Summary and Analysis and Charts with Summary sheet displaying automatic calculations for mean and SD and Cronbach's Alpha in clean labeled sections Figura 21: Survey Analysis Excel Template cu calcule automate

Descarcă Survey Analysis Excel Template


Întrebări frecvente


Pași următori

Acum ai un workflow complet pentru analiza datelor din chestionar în Excel, de la pregătirea datelor la raportarea rezultatelor. Fiecare pas contribuie la o lucrare credibilă.

Ghiduri conexe:

Pregătit pentru SPSS?

Dacă analizele tale necesită funcții dincolo de capacitățile Excel, explorează tutorialele noastre SPSS:


Referințe

Pallant, J. (2016). SPSS Survival Manual (6th ed.). McGraw-Hill Education.