Anbefalte løsninger på Missing Data

Det finnes to metoder for å håndtere manglende data som har blitt tilgjengelig i mainstream statistisk programvare i de siste årene. Disse to metodene er store forbedringer i forhold til tradisjonelle tilnærminger, som beskrevet i Begrensninger til felles tilnærming til manglende data. Denne artikkelen skisserer disse to metodene.

Begge metodene diskutert her krever at den manglende data mekanismen er ignorable, det er, ikke relatert til manglende verdier (se manglende data Mekanismer). Hvis mekanismen er ignorable vil følge estimater (dvs. regresjonsparametrene og standardfeil) være objektiv uten tap av kraft.

Den første metoden er Multiple Imputation (MI). Akkurat som godtgjørelses metodene diskutert i Begrensninger på vanlige tilnærminger til manglende data, fyller Multiple Imputation i estimatene for de manglende data. Imidlertid, for å fange usikkerheten i disse estimatene, MI imputes verdiene flere ganger. Fordi den bruker en godtgjørelses metode med feilinnebygd, bør de multiple estimater være like, men ikke identiske. Resultatet er flere datasett med identiske verdier for alle de ikke-manglende verdier og litt andre verdier for de beregnede verdiene i hvert datasett. Den statistiske analyse av interesse, for eksempel ANOVA eller logistisk regresjon utføres separat på hvert datasett, og resultatene blir deretter kombinert. På grunn av variasjonen i den beregnede verdier, bør det også være variasjon i parameterestimatene, som fører til passende anslag for standardfeil og passende p-verdier.

Multiple Imputation er tilgjengelig i SAS, S-Plus, og Solas. I SAS, skaper PROC MI flere datasett, som deretter kan enkelt analyseres separat ved hjelp av standard statistiske prosedyrer. PROC MIANALYZE vil deretter kombinere resultatene fra disse separate analyser. Joe Schafer ved Penn State har utviklet fire S-Plus biblioteker for flere imputing normale, kategoriske, blandet, og paneldata. Han har gjort biblioteket for vanlige data tilgjengelig som en gratis frittstående pakke kalt NORM. Multiple Imputation er også tilgjengelig i Solas, men sine algoritmer har blitt avhørt som upassende, og vi kan ikke anbefale bruk på denne tiden.

Den andre metoden er å analysere den fullstendige, ufullstendige datasett ved hjelp av maximum likelihood estimering. Denne metoden ikke tilregner noen data, men heller bruker alle data som er observert for hver sak å beregne maksimum likelihood estimatene. Maximum likelihood estimat av en parameter er verdien av den parameter som er mest sannsynlig å ha ført til de observerte data. Når data mangler, kan vi faktor sannsynlighetsfunksjonen. Sannsynligheten er beregnet separat for de tilfeller med fullstendige data om noen variabler og de med komplette data på alle variabler. Disse to likelihoods blir så maksimert sammen for å finne estimatene. Som multippel imputering, gir denne metoden objektive parameter estimater og standardfeil. En fordel er at det ikke krever nøye utvalg av variabler som brukes til tilregner verdier som Multiple Imputation krever. Det er imidlertid begrenset til lineære modeller.

Analyse av full, ufullstendige datasett ved hjelp av maximum likelihood estimering er tilgjengelig i AMOS. AMOS er en strukturell likningsmodellering pakken, men det kan kjøre flere lineære regresjonsmodeller. AMOS er enkel å bruke og er nå integrert i SPSS, men det vil ikke produsere residualplott, innflytelse statistikk og andre typiske utgang fra regresjon pakker. Den manglende verdianalyse pakke i SPSS vil gjøre noen svært begrensede maksimum likelihood estimatene for hjelp og korrelasjoner bare

Referanser:.
Schafer, J. programvare for flere Imputation
Hox, JJ (1999) En gjennomgang av aktuell programvare for håndtering av manglende data, Kwantitatieve Methoden, 62, 123-138.
Allison, P. (2000). Multiple Imputation for manglende data: En advarende historie, Sosiologiske Methods and Research, 28, 301-309
. .

forretningsrådgivning

  1. Hvordan små bedrifter kan unngå "Crisis Marketing" ved å opprette en lokal virksomhet markedsfør…
  2. Hva Aged Care Services er tilgjengelig i Home?
  3. Måter å velge riktig Forretnings Consultant
  4. Online trykkeriet og dens Advantages
  5. En vellykket bedrift gjennom Employee Engagement
  6. Administrere Credit i et Recession
  7. Hva å huske på når du deltar Gold Parties
  8. Hvordan Vital Er webutvikling til A Business
  9. Nettbank bedrift -a risikofri transaksjon ...
  10. Topp 5 Favoritt Wordpress Temaer for tøy Kontor Owners
  11. Gode ​​kontorplasser i Tysons, VA
  12. Chinese Computer Hacking av Chamber of Commerce har allerede Hurt Din Business
  13. Social Media Marketer
  14. Forstå IT Managed Services
  15. 4 ting Home Builders i Maryland vil du skal Know
  16. Adopter en Pre-Sell strategi for å drive interessen for prosjektet før de søker å tiltrekke seg …
  17. Finans og utstyr Lease Valg for kanadiske IT og medisinsk Hardware Og Software
  18. 10 måter å forbedre virksomheten og Planet
  19. Trekk & Kjennetegner vellykkede Consultants
  20. Definisjon: Forretninger Consulting