Kur mbledhni të dhëna për algoritmet e inteligjencës artificiale, duhet të merrni parasysh mospërputhjet e të dhënave dhe si t'i korrigjoni ato. Të dhënat mund të ekzistojnë për secilin nga regjistrat e të dhënave në një grup të dhënash, por mund të mos përputhen me të dhënat e tjera në grupet e tjera të të dhënave që zotëroni. Për shembull, të dhënat numerike në një fushë në një grup të dhënash mund të jenë një lloj me pikë lundruese (me pikë dhjetore), por një tip numër i plotë në një grup tjetër të dhënash. Përpara se të kombinoni dy grupet e të dhënave, fushat duhet të përmbajnë të njëjtin lloj të dhënash.
Mund të ndodhin të gjitha llojet e tjera të mospërputhjeve. Për shembull, fushat e datës janë të njohura për formatimin e tyre në mënyra të ndryshme. Për të krahasuar datat, formatet e të dhënave duhet të jenë të njëjta. Megjithatë, datat janë gjithashtu tinëzare në prirjen e tyre për t'u dukur njësoj, por jo e njëjtë. Për shembull, datat në një grup të dhënash mund të përdorin si bazë kohën mesatare të Greenwichit (GMT), ndërsa datat në një grup tjetër të dhënash mund të përdorin një zonë tjetër kohore. Përpara se të krahasoni orët, duhet t'i vendosni ato në të njëjtën zonë kohore. Mund të bëhet edhe më e çuditshme kur datat në një grup të dhënash vijnë nga një vendndodhje që përdor orën e kursimit të ditës (DST), por datat nga një vendndodhje tjetër jo.
Edhe kur llojet dhe formati i të dhënave janë të njëjta, mund të ndodhin keqpërputhje të tjera të të dhënave. Për shembull, fushat në një grup të dhënash mund të mos përputhen me fushat në grupin tjetër të të dhënave. Në disa raste, këto dallime janë të lehta për t'u korrigjuar. Një grup të dhënash mund të trajtojë emrin dhe mbiemrin si një fushë të vetme, ndërsa një grup tjetër të dhënash mund të përdorë fusha të veçanta për emrin dhe mbiemrin. Përgjigja është të ndryshohen të gjitha grupet e të dhënave për të përdorur një fushë të vetme ose të ndryshohen të gjitha për të përdorur fusha të veçanta për emrin dhe mbiemrin. Fatkeqësisht, shumë keqpërputhje në përmbajtjen e të dhënave janë më të vështira për t'u kuptuar. Në fakt, është plotësisht e mundur që ju të mos jeni në gjendje t'i kuptoni ato fare. Megjithatë, përpara se të hiqni dorë, merrni parasysh këto zgjidhje të mundshme për problemin:
- Llogaritni të dhënat që mungojnë nga të dhënat e tjera që mund të keni akses.
- Gjeni të dhënat që mungojnë në një grup tjetër të dhënash.
- Kombinoni grupet e të dhënave për të krijuar një tërësi që ofron fusha të qëndrueshme.
- Mblidhni të dhëna shtesë nga burime të ndryshme për të plotësuar të dhënat që mungojnë.
- Ripërcaktoni pyetjen tuaj në mënyrë që të mos keni më nevojë për të dhënat që mungojnë.