Për t'iu përgjigjur saktë një pyetjeje të dhënë, duhet të keni të gjitha faktet. Ju mund ta merrni me mend përgjigjen e një pyetjeje pa të gjitha faktet, por atëherë përgjigja ka po aq gjasa të jetë e gabuar aq edhe e saktë. Shpesh, dikush që merr një vendim, në thelb duke iu përgjigjur një pyetjeje, pa të gjitha faktet, thuhet se shpejton në një përfundim. Kur analizoni të dhënat, ndoshta keni nxituar në më shumë përfundime sesa mendoni për shkak të mungesës së të dhënave. Një regjistrim i të dhënave, një hyrje në një grup të dhënash (që janë të gjitha të dhënat), përbëhet nga fusha që përmbajnë fakte të përdorura për t'iu përgjigjur një pyetjeje. Çdo fushë përmban një lloj të vetëm të dhënash që adresojnë një fakt të vetëm. Nëse kjo fushë është bosh, nuk i keni të dhënat që ju nevojiten për t'iu përgjigjur pyetjes duke përdorur atë regjistrim specifik të të dhënave.
Si pjesë e procesit të trajtimit të të dhënave që mungojnë, duhet të dini se të dhënat mungojnë. Identifikimi që në të dhënat tuaja i mungon informacioni në fakt mund të jetë mjaft i vështirë sepse kërkon që ju t'i shikoni të dhënat në një nivel të ulët - diçka që shumica e njerëzve nuk janë të përgatitur ta bëjnë dhe kërkon kohë edhe nëse keni aftësitë e nevojshme. Shpesh, e dhëna juaj e parë që të dhënat mungojnë janë përgjigjet e kota që pyetjet tuaja marrin nga algoritmi dhe grupi i të dhënave përkatëse. Kur algoritmi është i duhuri për t'u përdorur, grupi i të dhënave duhet të jetë në faj.
Një problem mund të ndodhë kur procesi i mbledhjes së të dhënave nuk përfshin të gjitha të dhënat e nevojshme për t'iu përgjigjur një pyetjeje të caktuar. Ndonjëherë është më mirë të hedhësh një fakt në vend që të përdorësh një fakt të dëmtuar ndjeshëm. Nëse zbuloni se një fushë të caktuar në një grup të dhënash i mungojnë 90 për qind ose më shumë të të dhënave të saj, fusha bëhet e padobishme dhe ju duhet ta hiqni atë nga grupi i të dhënave (ose të gjeni një mënyrë për të marrë të gjitha ato të dhëna).
Fushat më pak të dëmtuara mund të kenë mungesë të të dhënave në një nga dy mënyrat. Të dhënat që mungojnë rastësisht janë shpesh rezultat i gabimit njerëzor ose sensor. Ndodh kur regjistrimet e të dhënave në të gjithë grupin e të dhënave kanë hyrje që mungojnë. Ndonjëherë një defekt i thjeshtë mund të shkaktojë dëm. Të dhënat që mungojnë në mënyrë sekuenciale ndodhin gjatë një lloj dështimi të përgjithësuar. Një segment i tërë i regjistrimeve të të dhënave në grupin e të dhënave i mungon informacioni i kërkuar, që do të thotë se analiza që rezulton mund të bëhet mjaft e anuar.
Rregullimi i të dhënave që mungojnë rastësisht është më i lehtë. Ju mund të përdorni një vlerë të thjeshtë mesatare ose mesatare si zëvendësim. Jo, grupi i të dhënave nuk është plotësisht i saktë, por ka të ngjarë të funksionojë mjaft mirë për të marrë një përgjigje të arsyeshme. Në disa raste, shkencëtarët e të dhënave përdorën një algoritëm të veçantë për të llogaritur vlerën që mungon, gjë që mund ta bëjë grupin e të dhënave më të saktë në kurriz të kohës llogaritëse.
Të dhënat që mungojnë në mënyrë sekuenciale është dukshëm më e vështirë, nëse jo e pamundur, për t'u rregulluar sepse ju mungojnë të dhënat rrethuese mbi të cilat mund të bazoni çdo lloj hamendjeje. Nëse mund të gjeni shkakun e të dhënave që mungojnë, ndonjëherë mund t'i rindërtoni ato. Megjithatë, kur rindërtimi bëhet i pamundur, ju mund të zgjidhni të shpërfillni fushën. Fatkeqësisht, disa përgjigje do të kërkojnë atë fushë, që do të thotë se mund t'ju duhet të injoroni atë sekuencë të veçantë të regjistrimeve të të dhënave - duke shkaktuar potencialisht dalje të pasaktë.