Reklama
Nepřihlášený uživatel | Zaregistrovat se
 

Téma:

Věda a technika, mládeži

Spravuje:

FiS



Reklama



Problemy, dotazy, hadky ohledne statictickeho modelovani a inference, od t-testu po zobecnene linearni smisene modely, modelovani strukturnich rovnic, item-response theory... Taky vymena informaci mezi zoufalci, kteri pouzivaji R, MX, xgobi, gauss, pripadne i podradne softwery jako SAS nebo SPSS.

Vitany jak zprazujici prispevky zkusenych matematiku, tak dotazy zacatecniku.


DadB jsem zralý na  šrotovné
Já vím, doba je zlá. Není čas chodit na přednášky, není čas chodit na cvika. Tak se to hodí na internet a on to za mě někdo spočítá a já dostanu zápočet...
Sorry, ale tohle mě dost nasralo, už jen prostě proto, že tu VŠ pravděpodobnost učím.
Ty příklady jsou dost elementární na to, abys to milé Jamalkaao alespoň samo zkusilo.
Zkus to spočítat, naskenuj nebo ofoť sem svůj postup a pak se budeme bavit co s tím dál.
Protože i když to na těch papírech nebude dobře, alespoň bude poznat, máš-li o tom nějakou představu.
Ale sázet na to, že ti to někdo zdarma naservíruje, to už kapánek překračuje meze i jinak relativně tolerantního Okouna.
Paráda, díky, konečně jsem to pobral.
Reakce na | Vlákno  
FiS there being no objections offered, I res 
Pokud tě zajímá vztah mezi vzděláním respondenta a pravděpodobností ano/ne v nějaké otázce, a zároveň máš to vzdělání na nějaké podrobnější metrice než vyšší/nižší, pak je skutečně nejlepší logistická regrese. Ale soudě podle tvých otázek to asi není metoda, kterou bys chtěl na svojí úrovni dovedností používat. Můžeš si pro každé pásmo vzdělání (jako zš, sš, vš) spočítat poměr ano/ne a testovat to jako kontigenční tabulku.
Ohledně jednostranného a dvoustranného testu trochu pedagogicky (na příkladu srovnávání průměrů, ale platí to obecně): jednostranný test je "měkčí", najde významný rozdíl i tam, kde dvoustranný ho nenajde. Ale pokud testuješ, že A<B a ve skutečnosti v datech vyjde, že A>B, nemůžeš testovat, že B je skutečně vyšší. O použití jedno- nebo dvoustranného testu by ses tedy měl rozhodnout předtím, než uvidíš data, jinak by si každý vybíral jednstranný test a tvrdil, že od začátku měl tuhle hypotézu. Jelikož tomu nikdo nevěří, v praxi se to nepoužívá. Resp. používá se to jenom tehdy, když typ otázky vylučuje rozumnou možnost, že by věci byly naopak, případně rovnost průměrů nebo jejich nerovnost v opačném směru jsou zjevně irelevantní. Prostě nejde o to, jak potřebuješ, aby to nějak vyšlo, ale o to, jestli výsledek v opačném směru nestojí za testování. Což většnou není pravda (čekám, že lék A je lepší než B: ok, je to jednostranná hypotéza, ale bylo by sakra důležitý, kdyby se A ukázalo jako horší; proto nesmím jednostranný test použít).
 
grigorij hmmmm 
Zkus tu logistickou regresi. Ta odpovida presne na otazku, kterou klades.
Ještě úplně jinak: nedaří se mi prokázat, že průměr v obou souborech se liší (oboustranným testem), ale daří se mi prokázat, že je v jednom větší než ve druhém (testem jednostranným). To mi samo o sobě přijde jako velmi solidní psycho. Samozřejmě si asi dokážeš představit, jak se dělá věda - já skutečně POTŘEBUJU, aby mi to vyšlo :o)
 
Jde mi právě o tu interpretaci dat; pokud mám odpovědi ano/ne a zároveň údaje o vzdělání respondenta, chtěl bych jednoznačně říci, že poměr odpovědi ano je u lidí s vyšším vzděláním větší, nikoliv pouze, že se v závislosti na vzdělání liší.

Jinak teda s tou jednostranností testu jsi mě dokonale zmátl - mě skutečně zajímá rozdíl pouze v jednom směru, hypotéza je, že průměr výběru prvního je větší než průměr výběru druhého (nikoliv, že se nerovná, což by byl imho případ oboustranného testu). Všechno, co jsem si přečetl, nasvědčovalo tomu, že volím dobře, ale rozumím tomu jako Hurvínek válce…

 
FiS there being no objections offered, I res 
Jinak nerozumím formulaci: "Pokud bych chtěl řešit jejich rozdílnost, byl mi na to doporučen test pro dva podíly". Rozdílnost proporcí je přesně to, co se testuje v chí-kvadrát testu.
 
FiS there being no objections offered, I res 
Test pro podíly neznám, pro statistické usuzování je klíčové, jestli je podíl udělaný ze 4 nebo ze 400 pozorování (ve druhém případě je to samozřejmě mnohem spolehlivější), proto se v chí-kvadrát testu používají absolutní čísla. Pokud k tomu podílu neznáš velikost skupin, neotestuješ nic. Pokud ji znáš, máš dostatek dat na chí-kvadrát (nebo Fishera, pokud nesplňuješ přdepoklady chí-kvadrátu). Jinak t-test chceš dvoustranný, smysluplná situace pro použití jednostranného testu je velice vzácná (musí tě zajímat rozdíl jen v jednom směru a druhý být úplně irelevantní). Tvoje formulace ohledně testovaných hypotéz je správná, ale je třeba ji používat opatrně.
 
Á propos, existuje nějaký blbuvzdorný test (pokud možno takový, která jde udělat jednoduše v Excelu), kterým se dá dokázat, že podíl Ano/Ne v jedné skupině je prokazatelně vyšší než ve skupině jiné? Protože test pro dva podíly se mi v Excelu najít nepodařilo a ručně ho fakt neudělám.
 
Díky. Už jsem k tomu postupným studiem dospěl, že u chí-testu nezávislosti v kontingenční tabulce může být závěrem zkrátka jenom to, že ta data nejsou navzájem nezávislá. Pokud bych chtěl řešit jejich rozdílnost, byl mi na to doporučen test pro dva podíly, ale ten jsem nějak neobjevil v excelu a ručně to nespočítám ani omylem.

Teď řeším úplně jiný problém: Dělám test shodnosti dvou průměrů (konkrétně průměrů mezd u skupin Ano/Ne). V Excelu by na to měl být normální TTESST, do kterého zadám pole prvního souboru, pole druhého souboru, vyberu, že rozptyly jsou různé, a pak je tam cosi, co je nazýváno "chvosty". Přičemž jsem se dozvěděl, že by snad mělo platit, že chvosty jsou dva, pokud řeším hypotézu o nerovnosti, a jeden, pokud větší/menší. Je to tak, nebo úplně jinak? :)

Reakce na | Vlákno  
FiS there being no objections offered, I res 
Čistě statisticky by měl stačit chí-kvadrát test, pokud ti jde o posouzení toho, jestli distribuce ano/ne je rozdílná v těch dvou skupinách, kde to děláš. Máš tabulku vypadající cca takto:
Ano Ne
Vzorek 1 190 210
Vzorek 2 20 80
Vkládáš tam absolutní čísla, ne poměry. Kalkulačna na to je třeba zde (dole na stránce): http://www.quantpsy.org/chisq/chisq.htm
Jinak je dost evidentní, že ta distribuce je odlišná, budeš mít p hodnoty prakticky nulové.

Druhá otázka je, jestli jestli tvůj závěr lze učinit ze tvých dat. To není statistická záležitost. Ten test ti řekne maximálně tolik, že distribuce odpovědí v těch dvou vzorcích je odlišná. Jestli to můžeš svést zrovna na SES, to je otázka. Takže s interpretací velice opatrně.
 
Chápu ten test dobré shody dobře tak, že vezmu celosouborový průměr, na jeho základě vypočítám teoretické počty lidí ochotných platit v rámci jednotlivých skupin, porovnám je se skutečnými počty lidí v rámci jednotlivých skupin, napasuju to do vzorečku a budu moci říct "ano, rozdělení do skupin má vliv na odpovědi", avšak nikoliv "s rostoucím vzděláním/příjmem roste ochota platit"?
 
Jde zcela konkrétně o tenhle průzkum, kde potřebuji nějak dokázat, že socioeko má vliv na odpovědi v prvních dvou otázkách.

Dobrou shodu jsem původně vyřadil, ale teď koukám, že by to možná šlo. Na Fishera a logistickou regresi mrknu, díky.

 
DadB jsem zralý na  šrotovné
Co všechno víš o těch 400 lidech - jenom ano/ne - nebo i nějaké další údaje - vzdělání, příjem...
grigorij hmmmm 
Ja bych bud udelal test dobre schody (eventuelne Fisheruv test, proste koukal na to jako na kontingencni tabulku), nebo (a to asi radsi) logistickou regresi.
totálně začátečnický dotaz
Ahoj, pokud to tady totálně nechcíplo, tak prosím přítomné zkušené matematiky, jestli by mě mohli trochu nakopnout, neboť zkoušku ze statistiky už mám pár let za sebou a totálně v tom plavu.

Mám data, která říkají, že mezi cca 400 lidmi je odpověď na otázku Ano/Ne rozložená v poměru 55:45. Zároveň mám nějaká socioekonomická data, která ukazují, že u vysokoškoláků či lidí s vysokými příjmy je 80:20 (přičemž tyto skupiny čítají nějakých 100, resp. 50 lidí). Potřebuji nějak statisticky průchozím způsobem dokázat, že platí hypotéza, že vyšší příjem (vzdělání, pracovní status…) indikuje větší pravděpodobnost odpovědi "Ano", ale nejsem na to schopen napasovat žádný z testů, o kterých jsem se kdysi učil.

Může mě někdo prosím nakopnout, popřípadě mi doporučit, co bych si měl přečíst/jaký soft použít? Díky.

 
igi mors ontologica  -
Muze mi prosim nekdo statisticky zbehly slovy jednoduchymi vysvetlit co toto znamena?
http://www.reuters.com/article/2012/01/11/nuclear-leukaemia-france-idUSL6E8CB5QY20120111

Tedy to, ze okolo fr. JE maji 14 deti s leukemii i kdyz ocekavali 7.
Muze to byt nahodna fluktuace? Nemely by podobne potom vyjit i pro jine metody vyberu podmnozin, jako jsou ty okoli rek ci mori?
 
DadB jsem zralý na  šrotovné
Nebyl by po ruce vzorec na výpočet tabulky kritických hodnot Dixonova Q-testu odlehlých hodnot? Dík
 
Nevíte někdo, jak vyexportovat data z SPSS do ASCII souboru tak, aby se za chybějící číslice doplnily podle formátu nuly? (tedy např. kód 6 v proměnné formátu F2 by se zapsal jako 06?)
 
lillyofthevalley   >°ß°<
Děkuji :-)