Greșeli Frecvente în Analiza Chestionarelor (Excel) și Cum să le Eviți

By Leonard Cucosro
Teste StatisticeMetode de CercetareAnaliză de Date

Am revizuit sute de seturi de date pentru lucrări de licență și disertație de-a lungul anilor, iar aceleași greșeli apar în mod repetat. Studenții petrec săptămâni colectând date din chestionare, doar pentru a-și compromite rezultatele cu erori Excel care puteau fi prevenite.

Aceste greșeli se încadrează în patru etape critice: configurarea pre-analiză, curățarea datelor, analiza statistică și prezentarea rezultatelor. O singură eroare în oricare etapă poate invalida întreaga ta analiză.

Acest ghid îți arată cele 10 greșeli frecvente pe care le fac studenții când analizează datele din chestionare în Excel și cum să le corectezi înainte de a depune lucrarea.

Greșeli în Configurarea Pre-Analiză

Aceste greșeli se întâmplă înainte să rulezi vreun test statistic. Identificarea lor din timp economisește ore de muncă refăcută.

Greșeala #1: Neinstalarea Analysis ToolPak de la Început

Problema:

Deschizi Excel, pregătit să rulezi un test t sau ANOVA, și descoperi că nu există opțiunea de analiză statistică în fila Data. Cauți prin toate meniurile și nu găsești nimic.

Excel nu include teste statistice implicit. Add-in-ul Analysis ToolPak trebuie instalat manual.

Cum să Corectezi:

Pentru instrucțiuni complete de instalare (Windows și Mac), consultă ghidul nostru: Cum să Activezi Data Analysis în Excel.

Pași rapizi pentru Windows:

  1. Dă clic pe File în colțul din stânga sus
  2. Selectează Options în partea de jos a meniului
  3. Dă clic pe Add-ins în bara laterală din stânga
  4. În partea de jos, găsește dropdown-ul "Manage:", selectează Excel Add-ins, dă clic pe Go
  5. Bifează caseta de lângă Analysis ToolPak
  6. Dă clic pe OK

Dialogul Excel Options arătând caseta Analysis ToolPak selectată în meniul Add-ins Figura 1: Dialogul Add-ins din Excel cu Analysis ToolPak activat (Windows)

Utilizatori Mac: Mergi la ToolsExcel Add-ins în loc de File → Options.

După instalare, butonul Data Analysis apare în fila Data (în partea dreaptă). Acest buton îți oferă acces la teste t, ANOVA, regresie, corelație și statistici descriptive.

Prevenire:

Instalează Analysis ToolPak prima dată când deschizi Excel pentru lucrarea ta. Adaugă-l pe lista de verificare pentru configurarea cercetării înainte de a colecta orice date.


Greșeala #2: Amestecarea Textului cu Numerele în Coloanele de Răspunsuri

Problema:

Răspunsurile din chestionarul tău conțin text precum "Total de acord", "De acord", "Neutru", "Dezacord" și "Total dezacord". Când încerci să calculezi scorul mediu de satisfacție, Excel returnează o eroare sau zero.

Textul nu poate fi folosit în formule statistice. Funcțiile Excel precum AVERAGE, STDEV și CORREL necesită input numeric.

Cum să Corectezi:

Codifică toate răspunsurile numeric înainte de analiză. Creează o legendă într-o foaie separată:

Cod NumericEtichetă Text
1Total dezacord
2Dezacord
3Neutru
4De acord
5Total de acord

Tabel 1: Codificare numerică pentru răspunsurile pe scala Likert în 5 puncte

Comparație Excel arătând Coloana A cu răspunsuri text (Total de acord, De acord) producând eroare #DIV/0 la calcularea mediei, versus Coloana B cu coduri numerice (5, 4) calculând corect media ca 4.2 Figura 2: Răspunsurile text nu pot fi folosite în formula AVERAGE (eroare în A8), dar codurile numerice funcționează corect (4.2 în B8)

Când exporti din instrumente de sondaj (Google Forms, Qualtrics, SurveyMonkey), selectează opțiunea pentru valori numerice în loc de etichete text.

Dacă ai deja răspunsuri text:

  1. Creează o coloană nouă
  2. Folosește =IF sau =VLOOKUP pentru a converti textul în numere
  3. Șterge coloana text originală după verificare

Prevenire:

Configurează setările de export ale chestionarului pentru a genera coduri numerice de la început. Majoritatea platformelor au opțiunea "Export as numerical values (1-n)".


Greșeala #3: Introducerea Inconsistentă a Datelor

Problema:

Ai introdus manual răspunsurile din chestionar și ai folosit formate inconsistente. Unii respondenți sunt codificați ca "Masculin", alții ca "M", și câțiva ca "Bărbat". Când creezi un Pivot Table pentru a rezuma răspunsurile pe gen, Excel arată trei categorii separate în loc de una.

Această problemă apare și cu variații de scriere: "Total de acord" vs "Totaldeacord" vs "Total de acord" (spațiu extra). Fiecare variație devine o categorie separată în analiza ta.

Notă: Pivot Tables și COUNTIF nu sunt sensibile la majuscule, deci "M" și "m" vor fi numărate împreună. Totuși, scrieri diferite precum "Masculin", "M" și "Bărbat" sunt întotdeauna tratate ca valori separate.

Pivot Table Excel arătând câmpul Gen cu trei rânduri separate: M (15 răspunsuri), Masculin (42 răspunsuri) și Bărbat (8 răspunsuri), demonstrând cum introducerea inconsistentă a datelor împarte ceea ce ar trebui să fie o categorie în trei Figura 3: Pivot Table tratează "Masculin", "M" și "Bărbat" ca trei categorii separate din cauza introducerii inconsistente a datelor

Frecvențele tale sunt acum împărțite pe mai multe rânduri, făcând imposibilă raportarea totalurilor corecte fără consolidare manuală.

Cum să Corectezi:

Folosește Data Validation pentru a restricționa introducerile înainte de colectarea datelor:

  1. Selectează coloana unde vor fi introduse răspunsurile
  2. Mergi la fila Data
  3. Dă clic pe Data Validation
  4. Sub "Allow:", selectează List
  5. În "Source:", tastează valorile permise: Masculin,Feminin,Altul (separate prin virgulă)
  6. Dă clic pe OK

Dialogul Data Validation din Excel arătând fila Settings cu List selectat în dropdown-ul Allow și Masculin,Feminin,Altul introdus în câmpul Source Figura 4: Configurarea Data Validation pentru a restricționa introducerile la valorile din lista predefinită

Acum, utilizatorii pot selecta doar din lista dropdown. Tastarea este dezactivată, eliminând inconsistențele.

Dacă datele sunt deja introduse inconsistent:

  1. Folosește Find & Replace (Ctrl+H) pentru a standardiza
  2. Găsește "M" → Înlocuiește cu "Masculin" (cu "Match entire cell contents" bifat)
  3. Găsește "Bărbat" → Înlocuiește cu "Masculin"
  4. Repetă pentru toate variațiile

Prevenire:

Configurează Data Validation înainte de a colecta orice date. Pentru chestionarele online, asta se întâmplă automat prin platforma de sondaj.


Greșeli în Curățarea Datelor

Datele brute din chestionare sunt rareori pregătite pentru analiză. Aceste greșeli apar când studenții sar peste faza de curățare.

Greșeala #4: Ignorarea Datelor Lipsă

Problema:

Unii respondenți au sărit întrebări, lăsând celule goale în setul tău de date. Rulezi AVERAGE pe o coloană și obții 4.2. Coordonatorul tău întreabă: "Cum ai gestionat datele lipsă?" Realizezi că nu ai documentat niciodată abordarea ta.

Funcția AVERAGE din Excel exclude automat celulele goale atât din sumă, cât și din numărare. Acest comportament poate sau nu să corespundă metodologiei tale intenționate:

  • Ce face Excel: (suma celor 80 de valori non-goale) / 80 = 4.2
  • Abordare alternativă: Tratează lipsa ca zero: (suma celor 80 de valori) / 100 = 3.36
  • Altă abordare: Imputare cu mediana: (suma celor 80 de valori + 20 × mediană) / 100

Problema nu este că Excel "greșește" - este că ai luat o decizie metodologică fără să realizezi. Dacă nu documentezi cum au fost gestionate datele lipsă, evaluatorii vor pune sub semnul întrebării rezultatele tale.

Foaie Excel arătând coloană cu celule goale și formula AVERAGE, cu explicație că Excel exclude celulele goale din calcul Figura 5: Funcția AVERAGE din Excel exclude celulele goale—asta poate sau nu să corespundă metodologiei tale intenționate

Cum să Corectezi:

Mai întâi, identifică cât de multe date lipsesc:

=COUNTA(B2:B101)  // Numără celulele non-goale
=ROWS(B2:B101)    // Total rânduri (ar trebui să fie 100)
=ROWS(B2:B101)-COUNTA(B2:B101)  // Număr date lipsă

Apoi, alege o strategie:

Strategia 1: Șterge întregul rând (dacă datele lipsesc complet aleatoriu)

  • Selectează rândurile cu valori lipsă
  • Clic dreapta → Delete
  • Actualizează dimensiunea eșantionului (n=80 în loc de n=100)

Strategia 2: Înlocuiește cu mediana (pentru date numerice)

  • Calculează mediana: =MEDIAN(B2:B101)
  • Completează celulele goale cu această valoare
  • Notează în metodologie: "Valorile lipsă au fost înlocuite cu mediana"

Strategia 3: Codifică ca "Lipsă" (pentru date categorice)

  • Înlocuiește celulele goale cu 99 sau "Lipsă"
  • Exclude din calculele statistice
  • Raportează separat: "85 răspunsuri valide, 15 lipsă"

Prevenire:

Fă toate întrebările din chestionar obligatorii (cu excepția cazurilor în care este inadecvat din punct de vedere etic). Dacă datele lipsă sunt inevitabile, planifică strategia de gestionare înainte de analiză.

Notă importantă pentru lucrarea ta:

Documentează strategia ta pentru datele lipsă în secțiunea de metodologie. Scrie: "Valorile lipsă (n=15, 15%) au fost [șterse/înlocuite cu mediana/codificate separat] deoarece [justificare]."

Evaluatorii vor pune sub semnul întrebării gestionarea nedocumentată a datelor lipsă.


Greșeala #5: Neverificarea Răspunsurilor Duplicate

Problema:

Un respondent a trimis accidental chestionarul de două ori. Altul a folosit două adrese de email diferite. Dimensiunea eșantionului tău este umflată, iar unele răspunsuri sunt ponderate de două ori în analiza ta.

Cum să Corectezi:

Dialogul Remove Duplicates din Excel cu tabel de date din chestionar arătând coloanele Timestamp, Email și Răspuns, cu coloana Email selectată pentru a identifica respondenții duplicați Figura 6: Dialogul Remove Duplicates cu Email selectat pentru a găsi trimiterile duplicate de chestionar

  1. Selectează întregul set de date (Ctrl+A)
  2. Mergi la fila Data
  3. Dă clic pe butonul Remove Duplicates
  4. Alege coloanele de verificat (de obicei Timestamp sau Email)
  5. Dă clic pe OK

Excel arată câte duplicate au fost găsite și eliminate. Actualizează dimensiunea eșantionului corespunzător.

Pentru chestionarele online, verifică setările platformei tale:

  • Google Forms: Limitează la 1 răspuns per email
  • Qualtrics: Activează "Prevent Ballot Box Stuffing"
  • SurveyMonkey: Solicită email-ul respondentului

Prevenire:

Activează prevenirea duplicatelor în setările chestionarului tău. Pentru chestionarele pe hârtie, atribuie fiecărui respondent un ID unic și verifică ID-urile duplicate înainte de analiză.


Greșeli în Analiza Statistică

Aceste greșeli se întâmplă în timpul analizei propriu-zise și duc adesea la concluzii incorecte.

Greșeala #6: Folosirea Testului Statistic Greșit

Problema:

Vrei să compari scorurile de satisfacție între trei departamente (Marketing, Vânzări, Operațiuni). Rulezi trei teste t separate:

  • Marketing vs. Vânzări (p=0.04)
  • Marketing vs. Operațiuni (p=0.06)
  • Vânzări vs. Operațiuni (p=0.03)

Această abordare este greșită. Testele t multiple cresc rata erorilor de tip I (fals pozitive). Cu trei comparații, rata ta reală de eroare nu este 5% ci aproximativ 14%.

Cum să Corectezi:

Folosește testul potrivit pentru întrebarea ta de cercetare:

Întrebare de CercetareNumăr de GrupuriTest Corect
Compară două grupuri2Test t independent
Compară trei sau mai multe grupuri3+ANOVA unifactorial
Testează același grup de două ori2 (perechi)Test t pereche
Relație între variabile2 (continue)Corelație Pearson
Compară date categorice2+ (categorice)Test chi-pătrat

Tabel 2: Ghid de selecție a testului statistic pentru întrebări de cercetare comune

Pentru exemplul cu cele trei departamente, abordarea corectă este:

  1. Rulează ANOVA unifactorial pentru a testa dacă vreun grup diferă
  2. Dacă este semnificativ (p < 0.05), rulează teste post-hoc pentru a identifica care perechi specifice diferă
  3. Raportează: "ANOVA unifactorial a relevat diferențe semnificative, F(2,297)=4.82, p=0.009"

Prevenire:

Înainte de a colecta date, identifică testul tău statistic. Consultă ghidul nostru de decizie T-Test vs ANOVA pentru o diagramă completă.


Greșeala #7: Calcularea Cronbach's Alpha pe Itemi cu Codificare Inversă

Problema:

Calculezi Cronbach's alpha pentru o scală de auto-eficacitate cu 5 itemi și obții α=0.45 (fiabilitate slabă). Verifici din nou introducerea datelor și formulele. Totul pare corect.

Problema: Scala ta include itemi formulați negativ care nu au fost codificați invers.

Exemplu de scală:

  1. "Mă simt încrezător în abilitățile mele" (pozitiv)
  2. "Pot face față majorității provocărilor" (pozitiv)
  3. "Mă îndoiesc adesea de competențele mele" (negativ - necesită inversare)
  4. "Sunt capabil să învăț lucruri noi" (pozitiv)
  5. "NU cred în mine" (negativ - necesită inversare)

Când respondenții sunt total de acord cu itemul 3 (scor=5), de fapt au auto-eficacitate SCĂZUTĂ. Aceasta trebuie inversată la 1 înainte de a calcula alpha.

Cum să Corectezi:

Foaie Excel arătând codificarea inversă cu formula =6-C3 vizibilă în bara de formule evidențiată în roșu, coloane pentru Respondent, Q3 Scoruri Originale și Q3 Scoruri Inversate, cu text explicativ arătând modelul de transformare pentru scala în 5 puncte Figura 7: Formula de codificare inversă pentru o scală în 5 puncte: =6-valoare_originală

Pentru o scală în 5 puncte (1-5), folosește această formulă:

=6-B2

Pentru o scală în 7 puncte (1-7):

=8-B2

Formula generală:

=(valoare_MAX + valoare_MIN) - valoare_originală

După inversarea itemilor formulați negativ, recalculează Cronbach's alpha. Fiabilitatea ta va crește probabil de la 0.45 la 0.80+.

Prevenire:

Când proiectezi chestionarul, marchează care itemi necesită codificare inversă. Înainte de a calcula orice statistici de fiabilitate, creează o secțiune "Itemi Inversați" în fișierul tău Excel și aplică formula.

Consultă ghidul nostru despre interpretarea rezultatelor Cronbach's alpha pentru depanarea altor probleme de fiabilitate.


Greșeala #8: Formula Greșită pentru Procente

Problema:

Raportezi: "50 de respondenți au fost de acord cu afirmația."

Evaluatorul lucrării tale întreabă: "50 din câți? Ce procent?"

Calculezi procentele manual și te încurci. Procentele tale dau 94% sau 107% în loc de 100%. Erorile comune includ:

  • Folosirea numitorului greșit: Împărțirea la total rânduri (inclusiv headerele sau rândurile goale) în loc de răspunsurile valide
  • Amestecarea formulelor: Folosirea COUNTA pentru unele rânduri și COUNT pentru altele
  • Uitarea de a exclude datele lipsă: Includerea celulelor goale în numărarea totală

Excel arătând calculul incorect al procentelor unde procentele dau 94% din cauza numitorului greșit, versus calculul corect dând 100% Figura 8: Stânga arată procente incorecte (94% total din cauza numitorului greșit); dreapta arată calculul corect (100% total)

Cum să Corectezi:

Raportează întotdeauna atât numărul, cât și procentul, folosind formule consistente:

// Numără câți au spus "De acord" (codat ca 4)
=COUNTIF(B2:B101, 4)
 
// Total respondenți
=COUNTA(B2:B101)
 
// Procent
=COUNTIF(B2:B101, 4) / COUNTA(B2:B101) * 100

Exemplu de tabel de frecvență cu procente:

Modelul de formulă pentru fiecare rând este:

=COUNTIF(B:B, [valoare_răspuns]) / COUNTA(B:B) * 100

Unde [valoare_răspuns] este 1 pentru "Total dezacord", 2 pentru "Dezacord", etc.

RăspunsNumărProcent
Total dezacord55.0%
Dezacord1212.0%
Neutru2323.0%
De acord4242.0%
Total de acord1818.0%
Total100100.0%

Tabel 3: Tabel de frecvență arătând distribuția răspunsurilor (procentele trebuie să dea 100%)

Verificare de control:

Adună toate procentele. Trebuie să dea 100% (permițând o eroare de rotunjire de 0.1%). Dacă totalul tău este 98% sau 103%, ai o eroare de formulă.

Prevenire:

Creează un șablon cu formule de procent pre-construite. Refolosește acest șablon pentru toate întrebările din chestionar.


Greșeli în Prezentarea Rezultatelor

Analiza ta poate fi corectă, dar prezentarea slabă îți subminează credibilitatea.

Greșeala #9: Raportarea Prea Multor Zecimale

Problema:

Raportezi media satisfacției ca 3,8462857143 (outputul brut al Excel).

Acest nivel de precizie este fals. O scală Likert în 5 puncte nu poate măsura satisfacția la 10 zecimale. Raportezi precizie de măsurare pe care instrumentul tău nu o are.

Cum să Corectezi:

Folosește funcția ROUND:

=ROUND(AVERAGE(B2:B101), 2)

Aceasta returnează 3.85 în loc de 3.8462857143.

Zecimale recomandate:

StatisticăZecimaleExemplu
Media (M)2M = 3.85
Deviația standard (SD)2SD = 0.92
Corelație (r)3r = 0.547
Valoarea p3p = 0.003
Dimensiunea efectului (Cohen's d)2d = 0.65
Procent142.0%

Tabel 4: Zecimale recomandate APA pentru statistici comune

Prevenire:

Aplică ROUND la toate statisticile calculate înainte de a le copia în lucrare. Setează formatul de afișare al Excel la 2 zecimale pentru întregul tabel de rezultate.

Consultă ghidul nostru despre raportarea statisticilor descriptive în format APA pentru reguli complete de formatare.


Greșeala #10: Crearea Graficelor Înșelătoare

Problema:

Creezi un grafic cu bare comparând satisfacția medie între trei grupuri:

  • Grupul A: 3.8
  • Grupul B: 3.9
  • Grupul C: 4.0

Pentru a face diferențele să pară mai impresionante, setezi minimul axei Y la 3.5 în loc de 0. Graficul arată acum bara Grupului C ca fiind de două ori mai înaltă decât cea a Grupului A, deși diferența reală este doar de 0.2 puncte.

Două grafice cu bare una lângă alta arătând aceleași date. Graficul din stânga (înșelător) are axa Y de la 3.5 la 4.0 făcând diferențele să pară dramatice. Graficul din dreapta (corect) are axa Y de la 0 la 5 arătând diferențele reale mici Figura 9: Aceleași date, scale diferite pe axa Y. Graficul din stânga exagerează diferențele; graficul din dreapta arată proporțiile corecte

Cum să Corectezi:

Urmează aceste reguli pentru grafice:

  1. Începe întotdeauna axa Y de la zero pentru graficele cu bare (cu excepția cazului în care ai o justificare puternică)
  2. Folosește grafice 2D (evită graficele pie 3D, care distorsionează percepția)
  3. Etichetează axele clar (include unitățile)
  4. Folosește culori consistente (nu atribui aleatoriu culori grupurilor)
  5. Include bare de eroare pentru medii (eroarea standard sau IC 95%)

Pentru datele pe scală Likert (1-5), setează axa Y de la 0 la 5, chiar dacă toate răspunsurile se încadrează între 3 și 4.

Prevenire:

Folosește setările implicite ale graficelor Excel ca punct de plecare. Ajustează scalele axelor doar dacă poți justifica schimbarea în fața comisiei.


Lista Ta de Verificare pentru Prevenire

Folosește această listă de verificare înainte de a începe orice analiză de chestionar:

Configurare Pre-Analiză:

  • Analysis ToolPak instalat și butonul Data Analysis vizibil
  • Toate răspunsurile codificate numeric (1-5), nu text ("De acord")
  • Data Validation aplicat pentru a preveni introducerile inconsistente
  • Setările de export ale chestionarului configurate pentru output numeric

Curățarea Datelor:

  • Strategie pentru datele lipsă decisă și documentată
  • Răspunsurile duplicate verificate și eliminate
  • Dimensiunea eșantionului actualizată după curățare (n=numărul final)
  • Toate celulele conțin date valide (fără erori, fără text în coloanele numerice)

Analiza Statistică:

  • Testul statistic corect identificat înainte de analiză
  • Itemii formulați negativ codificați invers înainte de testele de fiabilitate
  • Asumpțiile verificate (normalitate, omogenitatea varianței)
  • Comparațiile multiple corectate (dacă rulezi teste t multiple, folosește ANOVA în schimb)

Prezentarea Rezultatelor:

  • Toate statisticile rotunjite la numărul potrivit de zecimale
  • Procentele verificate să dea 100%
  • Graficele folosesc axa Y bazată pe zero (cu excepția justificărilor)
  • Dimensiunile eșantionului raportate (n=X) în toate tabelele și graficele
  • Rezultatele respectă ghidul de formatare APA ediția a 7-a

Descarcă această listă de verificare și ține-o vizibilă în timp ce lucrezi la analiză.


Întrebări Frecvente


Pașii Următori

Acum că știi ce greșeli să eviți, urmează aceste ghiduri pentru a analiza corect datele din chestionar:

Începe aici: Cum să Analizezi Datele din Chestionar în Excel: Ghid Complet

Alege testul tău statistic:

Verifică fiabilitatea:

Raportează rezultatele: