Til að svara tiltekinni spurningu rétt verður þú að hafa allar staðreyndir. Þú getur giskað á svarið við spurningu án allra staðreynda, en þá er jafn líklegt að svarið sé rangt og rétt. Oft er sagt að einhver sem tekur ákvörðun, svarar spurningu, án allra staðreynda, dragi ályktun. Þegar þú greinir gögn hefur þú sennilega dregið fleiri ályktanir en þú heldur vegna gagna sem vantar. A gögn skrá, ein færsla í gagnasafni (sem er öllum gögnum), samanstendur af sviðum sem innihalda staðreyndir notaðar til að svara spurningu. Hver reitur inniheldur eina tegund af gögnum sem fjalla um eina staðreynd. Ef sá reitur er tómur hefurðu ekki gögnin sem þú þarft til að svara spurningunni með því að nota þá tilteknu gagnaskrá.
Sem hluti af ferlinu við að takast á við gögn sem vantar verður þú að vita að gögnin vantar. Að bera kennsl á að upplýsingar vantar í gagnasafnið þitt getur í raun verið frekar erfitt vegna þess að það krefst þess að þú horfir á gögnin á lágu stigi - eitthvað sem flestir eru ekki tilbúnir til að gera og er tímafrekt jafnvel þótt þú hafir tilskilin kunnáttu. Oft er fyrsta vísbendingin þín um að gögn vanti hin furðulegu svör sem spurningar þínar fá frá reikniritinu og tengdu gagnasafni. Þegar reikniritið er það rétta til að nota, hlýtur gagnasafnið að vera að kenna.
Vandamál geta komið upp þegar gagnasöfnunarferlið inniheldur ekki öll þau gögn sem þarf til að svara tiltekinni spurningu. Stundum er betra að sleppa staðreynd frekar en að nota töluvert skemmda staðreynd. Ef þú kemst að því að tiltekið reit í gagnasafni vantar 90 prósent eða meira af gögnum þess verður reiturinn ónýtur og þú þarft að sleppa því úr gagnasafninu (eða finna einhverja leið til að fá öll þessi gögn).
Minna skemmdir reitir geta vantað gögn á annan af tveimur vegu. Gögn sem vantar af handahófi eru oft afleiðing mannlegra villna eða skynjara. Það gerist þegar gagnaskrár í gegnum gagnasafnið vantar færslur. Stundum mun einfaldur galli valda tjóni. Gögn sem vantar í röð eiga sér stað við einhvers konar almenna bilun. Heilan hluta gagnaskránna í gagnasafninu skortir nauðsynlegar upplýsingar, sem þýðir að greiningin sem af því leiðir getur orðið ansi skekkt.
Auðveldast er að laga gögn sem vantar af handahófi. Þú getur notað einfalt miðgildi eða meðalgildi í staðinn. Nei, gagnasafnið er ekki alveg nákvæmt, en það mun líklega virka nógu vel til að fá sanngjarnt svar. Í sumum tilfellum notuðu gagnafræðingar sérstakt reiknirit til að reikna út gildið sem vantar, sem getur gert gagnasafnið nákvæmara á kostnað reiknitímans.
Gögn sem vantar í röð er verulega erfiðara, ef ekki ómögulegt, að laga vegna þess að þig skortir öll nærliggjandi gögn til að byggja hvers kyns ágiskun á. Ef þú getur fundið orsök gagna sem vantar geturðu stundum endurbyggt þau. Hins vegar, þegar endurbygging verður ómöguleg, geturðu valið að hunsa reitinn. Því miður munu sum svör krefjast þess reits, sem þýðir að þú gætir þurft að hunsa þessa tilteknu röð gagnaskráa - sem gæti valdið röngum framleiðslu.