10. REALIZAČNÍ FÁZE VÝZKUMU
10.1. Sběr dat
Ve fázi sběru se zapojuje do řešení řada dalších lidí: tazatelé, pozorovatelé, moderátoři, operátoři apod. Na jejich kvalitní práci, perfektní organizaci a odpovědném výkonu značně závisí úspěch celého projektu. Jde o získání spolehlivých dat.
Tazatele je třeba seznámit se záměrem výzkumu, jejich konkrétním úkolem, způsobem výběru respondentů, časovým harmonogramem.
Současně s přípravou tazatelů se plánuje i kontrola jejich práce. Odpovědná práce tazatelů začíná jejich důkladnou přípravou. Kontrola je jen nástrojem dodržení náhodnosti výběru a nebo v případě záměrných výběrů zachytí vznikající problémy. Kontrola ověřuje návštěvu tazatele a u náhodně vybrané skupiny se zasílá kontrolní dotazník. Kontrola asi čtvrtiny respondentů je zárukou dobré kvality výzkumu.
10.2. Kontrola dat
Kontroly získaných dotazníků má tyto cíle:
- úplnost a čitelnost všech dotazníků, vyplatí se kontrolovat všechny
- neúplné dotazníky je lepší z dalšího hodnocení vyřadit
- pokud jsme použili kontrolní otázky, kdy respondent odpovídá na tutéž věc na dvou místech, pak nepravdivé dotazníky také vyřadíme
- zkontrolujeme odpovědi u polozavřených otázek typu „nevím“, u dobře formulovaných by procento odpovědí „nevím“ nemělo by být vyšší než 10 až 15% , pokud je vyšší, je třeba zvážit jejich další zpracovávání
- při vyřazení většího počtu dotazníku by se mohla změnit struktura výběrového souboru, proto se aplikují tzv. editační programy, které jsou součástí většiny statistických programů
10.3. Kódování dat
Smyslem kódování je převést odpovědi do číselného kódu vhodného pro další počítačové zpracování. Při dotazování tazatelem je možno uvést kódy již do dotazníku a tazatel přímo označuje kód odpovědi respondenta. Při vyplňování dotazníku respondentem to není vhodné, neboť tazatel vnímá dotazník jako příliš složitý.
Většinou kódujeme tak, že kód je tvořen číslem otázky a poslední číslo nebo dvojčíslí označuje typ odpovědi. Při kódování se přizpůsobujeme použitému statistickému softwaru.
U otevřených otázek se postupuje tak, že se vyhodnotí např. prvních sto odpovědí a jednotlivým typům odpovědí se přiřadí číslo a další odpovědi se přiřadí k jednomu typu. Při strojovém zpracování je možno použít systém klíčových slov, ale třídění může být méně spolehlivé.
K souboru bychom měli přidat kódovník, ve kterém bude přesný popis jednotlivých kódů.
10.4. Anonymní a pojmenované jednotky
Ve velkých výzkumných souborech a výběrových šetřeních jsou zpravidla jednotky zaznamenány anonymně . U těchto souborů nemá jméno jednotky žádný význam, neboť smyslem zpracování dat je charakterizace souboru jako celku a jeho částí. Individuální údaj je zajímavý jen pro identifikaci chyby záznamu. Data se zpracovávají hromadně a jsou vztažena jen k obecné charakteristice jednotek (muž/žena, věk, regiony, příjmové skupiny ap.)
U agregovaných jednotek často v matici dat zavádíme textovou proměnnou jméno nebo kódovanou proměnnou, která jméno identifikuje. Takto pojmenované statistické soubory mají specifické vlastnosti. Identifikace přináší další informace. Jméno jednotky umožňuje mnohdy vysvětlení jevu, můžeme porovnávat se sousedy nebo opozitní jednotkou atd. Za speciální případ pojmenované jednotky můžeme považovat údaje o okresech a nebo též údaj o čase.
V současné době vystupuje do popředí otázka ochrany osobních dat stanovená zákonem, která přesně specifikuje, kdy smí právnická nebo fyzická osoba využívat osobní data respondentů.
10.5. Segmentace trhu
Cílem segmentace je rozdělit populaci na skupiny, jejichž prvky jsou si z daného hlediska podobné a zároveň jsou mezi sebou výrazně rozdílné.
Segmentace je proces dekompozice trhu do skupin současných resp. potenciálních zákazníků, kteří jsou si s určitého hlediska podobní a je pravděpodobné, že se budou na trhu chovat podobně.
Druhy segmentace:
- geografická - vychází z území a lokalit, kde lidé žijí – územní nákupní a postojová specifikace
- demografická – věkově skupiny, pohlaví, velikost a typ domácnosti
- geodemografická – spojování malých geografických jednotek charakterizovaných jejich demografickými vlastnostmi do skupin, které se liší podle odbytu, zájmu ap.
- psychografická – je založena na hodnotovém systému a životním stylu
- behaviorální – vychází z koníčků, preferencí místa nákupu a typu prodejny, používání výrobků, trávení dovolené
- přínosová – podle toho, jaký přínos očekávají zákazníci od produktů
- situací užití – charakterizace situaci (nikoliv respondentů) – různé situace diktují různá kriteria pro výběr značky
- ekonomická – příjmové skupiny, vybavenost domácností, kvalita bydlení
Způsoby segmentace
- porovnání a spojování podobných skupin jednotek, které jsou předem definovány, u malých agregátů se vytvářejí větší – výchozí skupiny se již nedělí
- porovnání a sjednocování jednotek do skupin bez ohledu na umístění v jiných skupinách (např. vzdělání nebo věk) – vznikají specifické skupiny podle zvolených kriterií, nezávislé na jiných kriteriích
- postupné rozkládání populace na od sebe se lišící podskupiny podle zvolených kriterií, která se postupně hierarchicky kombinují na jemnější strukturu – např. věk, vzdělání, region, velikost bydliště, velikost domácnosti, příjmové skupiny
10.6. Stanovení velikosti výběru
Přípustná chyba pro průměr
kde je odhadem směrodatné odchylky a nazývá se standardní chyba a je
kvartil studentova rozdělení pro (m-1) stupňů volnosti, kde m je počet jednotek ve statistickém souboru a Δ je přípustná chyba. a α je hladina spolehlivosti (obvykle 0,05).
Tento vztah můžeme využít trojím způsobem:
máme k dispozici předepisujeme spočítáme
1-
= ?
1- ,
,n = ?
1- = ?
Nás zajímá případ, kdy z předběžného šetření o m počtu jednotek jsme stanovili směrodatnou odchylku s a chceme stanovit velikost náhodného výběru tak, aby chyba zjištěného průměru sledovaných hodnot Δ nepřekročila námi stanovenou hodnotu. Pak velkost výběrového souboru vypočteme ze vztahu
Přípustná chyba pro podíl
Jestliže určitý jev očekáváme s pravděpodobností P (např. vybavenost určitým předmětem dlouhodobé spotřeby), pak při počtu respondentů n je při 95% pravděpodobnosti interval spolehlivosti dán vztahem
běžně uvažujeme s chybou rovnou dvojnásobku uvedené odmocniny. Potom počet měření při námi stanovené chybě Δ vypočteme takto
Příklady intervalu spolehlivosti (v%) na hladině pravděpodobnosti 95 % jsou uvedeny v tabulce
Maximální chyba výsledku při alternativních odpovědích a různém počtu respondentů (95%pravděpodobnost)
počet
respondentů podíl alternativních odpovědí P : (1-P)
2:98 5:95 10:90 20:80 35:65 50:50
25 5,6 8,7 12,0 16,0 19,1 20,0
50 4,0 6,2 8,5 11,3 13,5 14,1
100 2,8 4,4 6,0 8,0 9,5 10,0
150 2,3 3,6 4,9 6,5 7,8 8,2
200 2,0 3,1 4,2 5,7 6,7 7,1
250 1,8 2,8 3,8 5,1 6,0 6,3
300 1,6 2,5 3,5 4,6 5,5 5,8
400 1,4 2,2 3,0 4,0 4,8 5,0
500 1,3 1,9 2,7 3,6 4,3 4,5
600 1,1 1,8 2,4 3,3 3,9 4,1
800 1,0 1,5 2,1 2,8 3,4 3,5
10.7. Základní statistické pojmy a matice dat
Je to tabulka údajů pro statistické jednotky umístěné v řádcích tabulky a charakterizované sloupci tabulky. Datový soubor v počítači má své jméno, kterým je identifikován.
Data sloupce matice tvoří tzv. statistickou řadu. Jsou-li hodnoty číselné statistické řady uspořádány podle velikosti tvoří uspořádanou statistickou řadu
řádek = jednotka, případ, respondent, objekt
sloupec = proměnná, záznam informace o jedné vlastnosti jednotky
Statistika zkoumá hromadné jevy
Pod pojmem statistika rozumíme
• Množinu informací o hromadných jevech
• Zjišťování dat
• Zpracování dat a analýza výsledků
Statistická jednotka - předmět zkoumání
Statistický soubor – počet statistických jednotek (n)
Statistické znaky – vlastnosti statistických jednotek
Typy statistických znaků
Podle způsobu
• Numerické (kvantitativní)
• Kategoriální (kvalitativní)
Podle počtu obměn
• Alternativní (dvě možnosti)
• Množné (více možností)
Podle vztahů
• Nominální (nelze odstupňovat)
• Ordinální (kvalitativní pořadí)
• Metrické (číselná velikost)
• Kardinální (metrické, pouze kladné)
Podle počtu hodnot
• Diskrétní (konečný nebo spočetný)
• Spojitý (nekonečné množství hodnot)
Typy statistických souborů
Základní statistický soubor
• Konečný
• Nekonečný
Výběrový soubor
• Záměrný výběr
• Náhodný výběr
statistická
Výběrový soubor Vlastnosti základního souboru
Indukce
Zpracování údajů ze statistických šetření
Třídění
Podle počtu tříděných znaků Podle počtu tříděných hodnot
- jednostupňové - prosté
- vícestupňové - intervalolvé
Žádné komentáře:
Okomentovat