Begrensninger av felles løsninger manglende Data
En tidligere artikkel diskutert noen av årsakene til manglende data og noen av konsekvensene av å analysere eneste komplette tilfeller. Dette nyhetsbrevet vil diskutere noen andre vanlige måter å håndtere manglende data, med en diskusjon av sine fordeler og ulemper.
Ledige case analyse (parvise sletting) beregner hvert trinn av analysen separat med de sakene som har data tilgjengelig for dette trinnet. Derfor vil et tilfelle med data mangler på en variabel kun brukes i trinn som ikke involverer at variabelen. Fordelen er at prøvestørrelsen for hver enkelt analyse er generelt høyere enn tilfellet med fullstendig analyse, men resultatene er objektivt bare hvis data er MCAR. Det kan også føre til matematiske problemer i databehandling estimater av noen parametere, og anbefales ikke.
De fleste andre metoder innebærer godtgjørelses-erstatter de manglende verdier med et anslag, deretter analysere hele datasettet som om de beregnede verdier var faktisk observerte verdier. Det er mange måter å velge et estimat. Følgende er vanlige metoder:
* Mean: gjennomsnittet av de observerte verdiene for den variabelen product: * Innbytte: verdien fra en ny person som ikke ble valgt ut til å være i prøven product: * Hot dekk: en tilfeldig valgt verdi fra en person som har tilsvarende verdier på andre variabler
* Cold dekk: en systematisk valgt verdi fra en person som har samme verdier på andre variabler
* Regresjon: den anslåtte verdien oppnådd ved tilbakegang på mangler variabel på andre variabler
* Stochastic regresjon: den anslåtte verdi fra en regresjon pluss en tilfeldig restverdi product: * interpolering og ekstrapolering.. en estimert verdi fra andre observasjoner fra samme individ
Imputation er populære fordi det er begrepsmessig enkel, og fordi den resulterende prøven har samme antall observasjoner som hele datasettet. Det kan være fristende når fullført-case analyse eliminerer en stor del av datasettet. Men det har begrensninger. Noen imputering metoder resultere i forutinntatte parameterestimatene, for eksempel virkemidler og sammenhenger, med mindre dataene er MCAR. Bias er ofte verre enn med komplett-case analyse, spesielt for middel imputering. Omfanget av skjevhet avhenger av mange faktorer, blant annet manglende data mekanisme, andelen av data som mangler, og den informasjonen som er tilgjengelig i datasettet.
Dessuten, alle disse imputering metoder undervurdere standardfeil . Siden de beregnede observasjonene er selv anslag, har sine verdier tilsvarende tilfeldige feil. Til tross for dette, er kalkulatoriske verdier behandles som faktiske observasjoner i analysene. Den ekstra feilkilde er ignorert, noe som resulterer i altfor liten standardfeil og altfor liten p-verdier. Videre, selv om godtgjørelses er konseptuelt enkle, er det vanligvis vanskelig å gjøre det bra i praksis. Derfor er disse imputering metoder ikke tilfredsstillende i de fleste tilfeller
to alternative metoder for å opprettholde den fulle prøvestørrelse og kan resultere i objektive estimater av parametre og standardfeil for ignorable manglende data:. Multiplum godtgjørelses og maksimum sannsynlighetsestimering. Disse teknikkene er nå tilgjengelig i vanlig statistisk programvare. Påfølgende nyhetsbrev vil beskrive disse metodene og diskutere deres tilgjengelighet i programvarepakker
.
forretningsrådgivning
- Et system for prioritering Relationships
- Flere teknologiske verktøy for omtrent alle Better Organization
- Reklame utstyr utover limits
- Hvordan megler daglige tilbud fra daglig deal builder
- Franchise Brokers Kan Egentlig Legg Value
- Erverve Siste Photocopiers
- Begynn å oppnå suksess gjennom Small Business Loans
- Kan lokale bedrifter handle internasjonalt med hjelp fra Google Places
- Har bedriften din trenger telemarketing tjenester?
- Trening for Ledelse Consulting
- Hvordan bli en Scentsy Consultant
- Managing Conflict Innenfor Office
- Oppskrift på problemer: Expansion
- Forretnings nøklene til suksess: Når du lager Decisions
- BROAN deler-et rimelig alternativ for You
- En vellykket bedrift gjennom Employee Engagement
- Market Research for lønnsom Business
- Kvaliteten på internett VoIP
- Tips om datasikkerhet For Your Business
- Hva kan Laws gjøre uten moral