Vad betyder icke-parametrisk
Det visar sig också att många statistiska tester är robusta, vilket innebär att de behåller sina statistiska egenskaper även när antagandena inte är helt uppfyllda. Tester är robusta i närvaro av överträdelser av normalitetsantagandet när provstorleken är stor baserat på Central Limit Theorem, se sidan 11 i modulen om sannolikhet. När urvalsstorleken är liten och fördelningen av resultatet inte är känd och inte kan antas vara ungefär normalfördelad, är alternativa tester som kallas icke-parametriska tester lämpliga.
Lärandemål Efter genomgånget moment ska studenten kunna: Jämföra och kontrastera parametriska och icke-parametriska tester Identifiera flera applikationer där icke-parametriska metoder är lämpliga Utför och tolka Mann Whitney U-testet Utför och tolka Sign-testet och Wilcoxon Signed Rank Test Jämför och kontrastera Sign-testet och Wilcoxon Signed Rank Test Utför och tolka Kruskal Wallis-testet Identifiera lämplig icke-parametrisk hypotestestprocedur baserat på typ av resultatvariabel och antal prover När ska man använda ett icke-parametriskt test Icke-parametriska tester kallas ibland distributionsfria tester eftersom de baseras på färre antaganden e.
Parametriska tester involverar specifika sannolikhetsfördelningar e.
Kostnaden för färre antaganden är att icke-parametriska tester i allmänhet är mindre kraftfulla än deras parametriska motsvarigheter i. Det kan ibland vara svårt att bedöma om ett kontinuerligt utfall följer en normalfördelning och därmed om ett parametriskt eller icke-parametriskt test är lämpligt. Det finns flera statistiska tester som kan användas för att bedöma om data sannolikt kommer från en normalfördelning.
icke-parametriskt exempel .Varje test är i huvudsak ett lämplighetstest och jämför observerade data med kvantiler av det normala eller andra specificerad fördelning.
Nollhypotesen för varje test är H0: Data följer en normalfördelning jämfört med H1: Data följer inte en normalfördelning. Om testet är statistiskt signifikant e. Det bör noteras att dessa tester för normalitet kan utsättas för låg effekt. Specifikt kan testerna misslyckas med att avvisa H0: Data följer en normalfördelning när data faktiskt inte följer en normalfördelning. Låg effekt är ett stort problem när provstorleken är liten - vilket tyvärr ofta är när vi vill använda dessa tester.
icke-parametriska tekniker .Det mest praktiska tillvägagångssättet för att bedöma normalitet innebär att undersöka fördelningsformen för resultatet i provet med hjälp av ett histogram och att utöka det med data från andra studier, om tillgängliga, som kan indikera den sannolika fördelningen av resultatet i befolkningen. Det finns vissa situationer när det är uppenbart att resultatet inte följer en normal fördelning.
Dessa inkluderar situationer: när resultatet är en ordinal variabel eller en rang, när det finns bestämda avvikare eller när resultatet har tydliga gränser för upptäckt.
Använda en ordinal skala Tänk på en klinisk prövning där studiedeltagarna uppmanas att betygsätta deras symtomsvårighetsgrad efter 6 veckor på den tilldelade behandlingen. Symtomens svårighetsgrad kan mätas på en 5-punkts ordinal skala med svarsalternativ: Symtomen blev mycket värre, något sämre, ingen förändring, något förbättrad eller mycket förbättrad. Fördelning av symtomens svårighetsgrad i totalt prov Fördelningen av symtomens svårighetsgrad verkar inte vara normal eftersom fler deltagare rapporterar förbättring av symtom i motsats till försämring av symtom.
När resultatet är en rangI vissa studier är resultatet en rang.
Poängen, som sträcker sig från , är summan av fem komponentpoäng baserat på barnets tillstånd vid födseln. APGAR-poäng gör det i allmänhet inte Följ en normalfördelning, eftersom de flesta nyfödda har poäng på 7 eller högre normalintervall. När det finns avvikande värden I vissa studier är resultatet kontinuerligt men föremål för extremvärden eller extrema värden. Till exempel är dagar på sjukhuset efter ett visst kirurgiskt ingrepp ett resultat som ofta är föremål för outliers.
Antag att utredare i en observationsstudie vill bedöma om det finns en skillnad i de dagar som patienterna tillbringar på sjukhuset efter levertransplantation på vinstdrivande kontra ideella sjukhus.
Antalet dagar på sjukhuset sammanfattas av box-whisker-diagrammet nedan. Minns från sidan 8 i modulen om sammanfattande data som vi använde Q I box-whisker-diagrammet ovan, Detektionsgränser I vissa studier är resultatet en kontinuerlig variabel som mäts med viss oprecision e.
Vad är parametriska data .Till exempel kan vissa instrument eller analyser inte mäta närvaron av specifika kvantiteter över eller under vissa gränser.
HIV-virusbelastning är ett mått på mängden virus i kroppen och mäts som mängden virus per en viss volym blod. Det kan sträcka sig från "inte upptäckt" eller "under detektionsgränsen" till hundratals miljoner kopior. Således kan vissa deltagare i ett urval ha mått som 1,, eller , kopior och andra mäts som "inte detekterade.
Hypotesprövning med icke-parametriska testerI icke-parametriska tester handlar hypoteserna inte om populationsparametrar e.
Vad är icke-parametriska data Boston University School of Public Health Inledning De tre modulerna om hypotesprövning presenterade ett antal hypotestester för kontinuerliga, dikotoma och diskreta resultat.Tester för kontinuerliga resultat fokuserade på att jämföra medel, medan tester för dikotoma och diskreta resultat fokuserade på att jämföra proportioner.
Hypotes d är också icke-parametrisk men dessutom Det specificerar inte ens den underliggande formen av distributionen och kan nu rimligen kallas distributionsfri. Trots dessa skillnader tillämpar den statistiska litteraturen nu vanligtvis etiketten "icke-parametrisk" på testprocedurer som vi just har kallat "distributionsfria" och förlorar därmed en användbar klassificering.
Den andra betydelsen av icke-parametrisk innefattar tekniker som inte antar att strukturen hos en modell är fixerad. Vanligtvis växer modellen i storlek för att tillgodose komplexiteten i data.
icke-parametrisk vs parametrisk Från Wikipedia Gren av statistik som inte enbart baseras på parametriserade familjer av sannolikhetsfördelningar Icke-parametrisk statistik är den typ av statistik som inte begränsas av antaganden om arten av den population från vilken ett urval dras.Detta står i motsats till parametrisk statistik , för vilken ett problem är begränsat a priori genom antaganden om populationens specifika fördelning, t.ex. normalfördelning och parametrar såsom medelvärde eller varians.
I dessa tekniker antas enskilda variabler typiskt tillhöra parametriska fördelningar, och antaganden om typerna av föreningar mellan variabler görs också. Dessa tekniker inkluderar bland annat: icke-parametrisk regression , som är modellering där strukturen för förhållandet mellan variabler behandlas icke-parametriskt, men där det ändå kan finnas parametriska antaganden om fördelningen av modellrester.
Applikationer och syfte[ redigera ] Icke-parametriska metoder används ofta för att studera populationer som har en rangordnad ordning, till exempel filmrecensioner som får en till fyra "stjärnor".
Användning av icke-parametriska metoder kan vara nödvändig när data har en rangordning men ingen tydlig numerisk tolkning, t.ex. vid bedömning av preferenser.
icke parametriskt testNär det gäller mätnivåer resulterar icke-parametriska metoder i ordinära data. Eftersom icke-parametriska metoder gör färre antaganden är deras tillämplighet mycket mer generell än motsvarande parametriska metoder. De kan särskilt tillämpas i situationer där mindre är känt om ansökan i fråga. På grund av beroendet av färre antaganden är icke-parametriska metoder mer robusta.
En annan motivering för användningen av icke-parametriska metoder är enkelhet. I vissa fall, även när användningen av parametriska metoder är motiverad, kan icke-parametriska metoder vara lättare att använda.
På grund av både denna enkelhet och deras större robusthet anses icke-parametriska metoder av vissa statistiker vara mindre mottagliga för felaktig användning och missförstånd. Den bredare tillämpligheten och den ökade robustheten hos icke-parametriska tester har en kostnad: i fall där ett parametriskt test skulle vara Lämpliga, icke-parametriska tester har mindre statistisk styrka.
Med andra ord kan en större provstorlek krävas för att dra slutsatser med samma grad av säkerhet.
Icke-parametriska modeller[redigera] Icke-parametriska modeller skiljer sig från parametriska modeller genom att modellstrukturen inte specificeras a priori utan istället bestäms från data. Termen icke-parametrisk är inte avsedd att innebära att sådana modeller helt saknar parametrar, utan att parametrarnas antal och karaktär är flexibla och inte fastställda i förväg.
Ett histogram är en enkel icke-parametrisk uppskattning av en sannolikhetsfördelning.
Icke-parametrisk betydelse i statistik
Uppskattning av kärndensitet är en annan metod för att uppskatta en sannolikhetsfördelning. Icke-parametrisk regression och semiparametriska regressionsmetoder har utvecklats baserat på kärnor, splines och wavelets. Datakuvertanalys ger effektivitetskoefficienter som liknar dem erhållen genom multivariat analys utan något fördelningsantagande. KNN klassificerar den osynliga instansen baserat på K-punkterna i träningsuppsättningen som ligger närmast den.
En stödvektormaskin med en gaussisk kärna är en icke-parametrisk klassificerare med stor marginal.
Icke-parametriska eller distributionsfria inferentiella statistiska metoder är matematiska procedurer för statistisk hypotesprövning som, till skillnad från parametrisk statistik, inte gör några antaganden om sannolikhetsfördelningarna för de variabler som bedöms.