Reklama
Nepřihlášený uživatel | Zaregistrovat se
 

Téma:

Věda a technika, mládeži

Spravuje:

FiS



Reklama



Problemy, dotazy, hadky ohledne statictickeho modelovani a inference, od t-testu po zobecnene linearni smisene modely, modelovani strukturnich rovnic, item-response theory... Taky vymena informaci mezi zoufalci, kteri pouzivaji R, MX, xgobi, gauss, pripadne i podradne softwery jako SAS nebo SPSS.

Vitany jak zprazujici prispevky zkusenych matematiku, tak dotazy zacatecniku.


Ještě úplně jinak: nedaří se mi prokázat, že průměr v obou souborech se liší (oboustranným testem), ale daří se mi prokázat, že je v jednom větší než ve druhém (testem jednostranným). To mi samo o sobě přijde jako velmi solidní psycho. Samozřejmě si asi dokážeš představit, jak se dělá věda - já skutečně POTŘEBUJU, aby mi to vyšlo :o)
 
Jde mi právě o tu interpretaci dat; pokud mám odpovědi ano/ne a zároveň údaje o vzdělání respondenta, chtěl bych jednoznačně říci, že poměr odpovědi ano je u lidí s vyšším vzděláním větší, nikoliv pouze, že se v závislosti na vzdělání liší.

Jinak teda s tou jednostranností testu jsi mě dokonale zmátl - mě skutečně zajímá rozdíl pouze v jednom směru, hypotéza je, že průměr výběru prvního je větší než průměr výběru druhého (nikoliv, že se nerovná, což by byl imho případ oboustranného testu). Všechno, co jsem si přečetl, nasvědčovalo tomu, že volím dobře, ale rozumím tomu jako Hurvínek válce…

 
FiS there being no objections offered, I res 
Jinak nerozumím formulaci: "Pokud bych chtěl řešit jejich rozdílnost, byl mi na to doporučen test pro dva podíly". Rozdílnost proporcí je přesně to, co se testuje v chí-kvadrát testu.
 
FiS there being no objections offered, I res 
Test pro podíly neznám, pro statistické usuzování je klíčové, jestli je podíl udělaný ze 4 nebo ze 400 pozorování (ve druhém případě je to samozřejmě mnohem spolehlivější), proto se v chí-kvadrát testu používají absolutní čísla. Pokud k tomu podílu neznáš velikost skupin, neotestuješ nic. Pokud ji znáš, máš dostatek dat na chí-kvadrát (nebo Fishera, pokud nesplňuješ přdepoklady chí-kvadrátu). Jinak t-test chceš dvoustranný, smysluplná situace pro použití jednostranného testu je velice vzácná (musí tě zajímat rozdíl jen v jednom směru a druhý být úplně irelevantní). Tvoje formulace ohledně testovaných hypotéz je správná, ale je třeba ji používat opatrně.
 
Á propos, existuje nějaký blbuvzdorný test (pokud možno takový, která jde udělat jednoduše v Excelu), kterým se dá dokázat, že podíl Ano/Ne v jedné skupině je prokazatelně vyšší než ve skupině jiné? Protože test pro dva podíly se mi v Excelu najít nepodařilo a ručně ho fakt neudělám.
 
Díky. Už jsem k tomu postupným studiem dospěl, že u chí-testu nezávislosti v kontingenční tabulce může být závěrem zkrátka jenom to, že ta data nejsou navzájem nezávislá. Pokud bych chtěl řešit jejich rozdílnost, byl mi na to doporučen test pro dva podíly, ale ten jsem nějak neobjevil v excelu a ručně to nespočítám ani omylem.

Teď řeším úplně jiný problém: Dělám test shodnosti dvou průměrů (konkrétně průměrů mezd u skupin Ano/Ne). V Excelu by na to měl být normální TTESST, do kterého zadám pole prvního souboru, pole druhého souboru, vyberu, že rozptyly jsou různé, a pak je tam cosi, co je nazýváno "chvosty". Přičemž jsem se dozvěděl, že by snad mělo platit, že chvosty jsou dva, pokud řeším hypotézu o nerovnosti, a jeden, pokud větší/menší. Je to tak, nebo úplně jinak? :)

Reakce na | Vlákno  
FiS there being no objections offered, I res 
Čistě statisticky by měl stačit chí-kvadrát test, pokud ti jde o posouzení toho, jestli distribuce ano/ne je rozdílná v těch dvou skupinách, kde to děláš. Máš tabulku vypadající cca takto:
Ano Ne
Vzorek 1 190 210
Vzorek 2 20 80
Vkládáš tam absolutní čísla, ne poměry. Kalkulačna na to je třeba zde (dole na stránce): http://www.quantpsy.org/chisq/chisq.htm
Jinak je dost evidentní, že ta distribuce je odlišná, budeš mít p hodnoty prakticky nulové.

Druhá otázka je, jestli jestli tvůj závěr lze učinit ze tvých dat. To není statistická záležitost. Ten test ti řekne maximálně tolik, že distribuce odpovědí v těch dvou vzorcích je odlišná. Jestli to můžeš svést zrovna na SES, to je otázka. Takže s interpretací velice opatrně.
 
Chápu ten test dobré shody dobře tak, že vezmu celosouborový průměr, na jeho základě vypočítám teoretické počty lidí ochotných platit v rámci jednotlivých skupin, porovnám je se skutečnými počty lidí v rámci jednotlivých skupin, napasuju to do vzorečku a budu moci říct "ano, rozdělení do skupin má vliv na odpovědi", avšak nikoliv "s rostoucím vzděláním/příjmem roste ochota platit"?
 
Jde zcela konkrétně o tenhle průzkum, kde potřebuji nějak dokázat, že socioeko má vliv na odpovědi v prvních dvou otázkách.

Dobrou shodu jsem původně vyřadil, ale teď koukám, že by to možná šlo. Na Fishera a logistickou regresi mrknu, díky.

 
DadB jsem zralý na  šrotovné
Co všechno víš o těch 400 lidech - jenom ano/ne - nebo i nějaké další údaje - vzdělání, příjem...
grigorij hmmmm 
Ja bych bud udelal test dobre schody (eventuelne Fisheruv test, proste koukal na to jako na kontingencni tabulku), nebo (a to asi radsi) logistickou regresi.
totálně začátečnický dotaz
Ahoj, pokud to tady totálně nechcíplo, tak prosím přítomné zkušené matematiky, jestli by mě mohli trochu nakopnout, neboť zkoušku ze statistiky už mám pár let za sebou a totálně v tom plavu.

Mám data, která říkají, že mezi cca 400 lidmi je odpověď na otázku Ano/Ne rozložená v poměru 55:45. Zároveň mám nějaká socioekonomická data, která ukazují, že u vysokoškoláků či lidí s vysokými příjmy je 80:20 (přičemž tyto skupiny čítají nějakých 100, resp. 50 lidí). Potřebuji nějak statisticky průchozím způsobem dokázat, že platí hypotéza, že vyšší příjem (vzdělání, pracovní status…) indikuje větší pravděpodobnost odpovědi "Ano", ale nejsem na to schopen napasovat žádný z testů, o kterých jsem se kdysi učil.

Může mě někdo prosím nakopnout, popřípadě mi doporučit, co bych si měl přečíst/jaký soft použít? Díky.

 
igi mors ontologica  -
Muze mi prosim nekdo statisticky zbehly slovy jednoduchymi vysvetlit co toto znamena?
http://www.reuters.com/article/2012/01/11/nuclear-leukaemia-france-idUSL6E8CB5QY20120111

Tedy to, ze okolo fr. JE maji 14 deti s leukemii i kdyz ocekavali 7.
Muze to byt nahodna fluktuace? Nemely by podobne potom vyjit i pro jine metody vyberu podmnozin, jako jsou ty okoli rek ci mori?
 
DadB jsem zralý na  šrotovné
Nebyl by po ruce vzorec na výpočet tabulky kritických hodnot Dixonova Q-testu odlehlých hodnot? Dík
 
Nevíte někdo, jak vyexportovat data z SPSS do ASCII souboru tak, aby se za chybějící číslice doplnily podle formátu nuly? (tedy např. kód 6 v proměnné formátu F2 by se zapsal jako 06?)
 
lillyofthevalley   >°ß°<
Děkuji :-)
a) už koukám vysvětlil bwian v matematice, tak ještě to b):
zase je potřeba si představit, z čeho všeho se ten případ může skládat: může se narodit nula chlapců, jeden chlapec, dva, tři... až šest. Celkem tedy sedm pozitivních možností, každá má svoji dílčí pravděpodobnost. Těch negativních možností je míň (narodí-li se sedm, osm, devět nebo deset chlapců). Takže chceme-li si ušetřit trochu počítání, vypočítáme ty čtyři negativní a odečteme je od jedna (to udělal i snop vedle).

Je-li pravděpodobnost narození chlapce p, je pravděpodobnost narození x chlapců mezi n dětmi = (n nad x) * p^x * (1-p)^(n-x)
(detailně: p^x= narodilo se tolik kluků, (1-p)^(n-x)=narodilo se tolik holek, (n nad x) - počet kombinací, jak se tam může těch x kluků naskládat)

Např. pravděpodobnost, že se narodí právě sedm chlapců (a tři holky), je (10 nad 7) * 0.513^7 * (1-0.513)^(10-7), což je ten člen, co napsal snop do matematiky až dodatečně.

Podobně si kámoška spočítá i ty další dílčí pravděpodobnosti.
lillyofthevalley   >°ß°<
Kamarádka moc děkuje a pokud byste ještě měli chvilku, tak prosí o pomoc s řešením následujícího příkladu:

Pravděpodobnost narození chlapce v ČR je 0,513.

a) Určete, kolik narozených dětí je třeba, aby pravděpodobnost, že mezi nimi bude aspoň jeden chlapec, byla větší než 0,97.

b) Jaká je pravděpodobnost, že mezi 10 narozenými dětmi bude méně než 7 chlapců? (Uveďte s přesností na tři desetinná místa.)

Kamarádka studuje dálkově a jejich škola vypadá tak, že 20 minut vidí přednášejícího, ten jim zadá literaturu a úkoly a tím jsou konzultace s dálkaři u konce ;-/. Sehnala si učitelku na doučování, ale ta jí s tímhle neumí pomoci....
 
lillyofthevalley   >°ß°<
:-)
Chyba je na mé straně, počítal jsem p(manžel přijde) a ono je v zadání p(manžel nepřijde). To mám takhle furt :)