AI-ga töötades võtke arvesse andmete väärjoondust

Tehisintellekti algoritmide jaoks andmete kogumisel peate arvestama andmete nihkega ja nende parandamisega. Andmed võivad olemas olla iga andmekogumi andmekirje kohta, kuid need ei pruugi ühtida teiste teile kuuluvate andmekogumite andmetega. Näiteks võivad ühe andmestiku väljal olevad arvandmed olla ujukomatüüpi (koos komaga), kuid teises andmekogumis täisarvu tüüpi andmed. Enne kahe andmestiku kombineerimist peavad väljad sisaldama sama tüüpi andmeid.

Võib esineda igasuguseid muid kõrvalekaldeid. Näiteks on kuupäevaväljad mitmel viisil vormindatud. Kuupäevade võrdlemiseks peavad andmevormingud olema samad. Kuid datlid on ka salakavalad oma kalduvuses näida ühesugused, kuid mitte olla samad. Näiteks võivad ühe andmestiku kuupäevad kasutada aluseks Greenwichi keskmist aega (GMT), samas kui mõne teise andmekogumi kuupäevad võivad kasutada mõnda muud ajavööndit. Enne aegade võrdlemist tuleb need joondada sama ajavööndi järgi. See võib muutuda veelgi veidramaks, kui ühes andmestikus olevad kuupäevad pärinevad asukohast, mis kasutab suveaega (DST), kuid teisest asukohast pärinevad kuupäevad mitte.

Isegi kui andmetüübid ja vorming on samad, võib esineda muid andmete nihkeid. Näiteks ei pruugi ühe andmestiku väljad kattuda teise andmekogumi väljadega. Mõnel juhul on neid erinevusi lihtne parandada. Üks andmestik võib ees- ja perekonnanime käsitleda ühe väljana, samas kui teine ​​andmestik võib kasutada ees- ja perekonnanime jaoks eraldi välju. Vastus on muuta kõik andmestikud nii, et need kasutaksid ühte välja, või muuta need kõik nii, et ees- ja perekonnanime jaoks kasutatakse eraldi välju. Kahjuks on paljusid andmesisu kõrvalekaldeid raskem välja selgitada. Tegelikult on täiesti võimalik, et te ei pruugi neist üldse aru saada. Kuid enne loobumist kaaluge neid võimalikke lahendusi probleemile:

  • Arvutage puuduvad andmed muude andmete põhjal, millele teil on juurdepääs.
  • Leidke teisest andmekogumist puuduvad andmed.
  • Kombineerige andmekogumid, et luua tervik, mis pakub ühtseid välju.
  • Puuduvate andmete täitmiseks koguge erinevatest allikatest lisaandmeid.
  • Määratlege oma küsimus uuesti, et te ei vajaks enam puuduvaid andmeid.

Eakate jaoks: kuidas sisestada lõikepilte PowerPointi slaidile

Eakate jaoks: kuidas sisestada lõikepilte PowerPointi slaidile

Lõikepilt on eeljoonistatud üldine kunstiteos ja Microsoft pakub oma Office'i toodetega tasuta palju lõikepildifaile. Saate sisestada oma PowerPointi slaidipaigutusse lõikepilte. Lihtsaim viis lõikepildi sisestamiseks on kasutada slaidipaigutamisel üht kohatäitjat: kuvage lõikepilte sisaldav slaid […]

Eakate jaoks: kuidas täita värvi Microsoft Excelis

Eakate jaoks: kuidas täita värvi Microsoft Excelis

Täitevärv (mida nimetatakse ka varjutamiseks) on värv või muster, mis täidab ühe või mitme Exceli töölehe lahtri tausta. Varjutuse rakendamine võib aidata lugejal kogu lehel teavet jälgida ning lisada töölehel värvi ja visuaalset huvi. Teatud tüüpi tabelites, näiteks tšekiraamatute registris, […]

Uute kontaktide lisamine seadusesse! 2005

Uute kontaktide lisamine seadusesse! 2005

Kõige lihtsamal tasandil ACTi peamine eesmärk! on koht, kuhu salvestada kõik kontaktid, kellega igapäevaselt suhtlete. Saate kõiki oma kontakte lisada ja muuta kontaktandmete aknas, kuna see sisaldab kogu teavet, mis puudutab ühte konkreetset kirjet ja […]

Discord For LuckyTemplates petuleht

Discord For LuckyTemplates petuleht

Kasutage seda petulehte, et otse Discordi kasutama hakata. Avastage kasulikke Discordi roboteid, rakendusi, mida saate integreerida, ja näpunäiteid külaliste intervjueerimiseks.

OpenOffice.org LuckyTemplatesi petulehe jaoks

OpenOffice.org LuckyTemplatesi petulehe jaoks

OpenOffice.org kontorikomplektis on palju tööriistu, mis muudavad tööelu lihtsamaks. Kui töötate saidil OpenOffice.org, tutvuge funktsioonide tööriistariba (mis näeb kõigis rakendustes üsna ühesugune välja) ja peamiste tööriistariba nuppudega, et saada abi põhikäskudega enamiku toimingute jaoks.

Alan Turingi pommimasin

Alan Turingi pommimasin

Alan Turingi Bombe masin ei olnud tehisintellekti (AI) vorm. Tegelikult pole see isegi päris arvuti. See purustas Enigma krüptograafilised sõnumid ja see on kõik. Siiski pakkus see Turingile mõtlemisainet, mis viis lõpuks artiklini "Arvutusmasinad ja intelligentsus". mille ta avaldas 1950. aastatel ja kirjeldab […]

Tehisintellekti standardsed riistvarapuudused

Tehisintellekti standardsed riistvarapuudused

Modulaarse süsteemi loomise võimalusel on olulisi eeliseid, eriti ettevõtluses. Üksikute komponentide eemaldamise ja asendamise võimalus hoiab kulud madalal, võimaldades samal ajal järk-järgult parandada nii kiirust kui ka tõhusust. Samas nagu enamiku asjadega, tasuta lõunasööki pole olemas. Von Neumanni arhitektuuri pakutav modulaarsus sisaldab mõningaid […]

10 toimingut ja keeldu QuarkXPressi kasutamisel

10 toimingut ja keeldu QuarkXPressi kasutamisel

Kui sa peaksid QuarkXPressi kohta välja valima kümme kergesti unustatavat, kuid ülikasulikku asja, siis järgmises loendis, hea lugeja, oleksid just need. Namaste. Rääkige oma kommertsprinteriga Kõik prindiprojektid algavad ja lõpevad printeriga. Seda seetõttu, et ainult printerid teavad oma piiranguid ja tuhandeid viise, kuidas projekt võib olla […]

Bitcoini päritolu

Bitcoini päritolu

Bitcoini kõige olulisem aspekt võib olla selle kontseptsioon. Bitcoini lõi arendaja Satoshi Nakamoto. Selle asemel, et püüda välja töötada täiesti uus makseviis, et kaotada viis, kuidas me kõik veebis asjade eest maksame, nägi Satoshi olemasolevates maksesüsteemides teatud probleeme ja soovis nendega tegeleda. Mõiste […]

Kuidas kaitsta oma privaatsust Bitcoini kasutamisel

Kuidas kaitsta oma privaatsust Bitcoini kasutamisel

Teatud anonüümsuse tase on seotud bitcoini ja digitaalse valuuta kasutamisega üldiselt. See, kas saate selle märgistada "piisavalt anonüümseks", on isiklik arvamus. Kui kasutate bitcoine raha ümberpaigutamiseks, on privaatsuse kaitsmiseks viise, kuid need nõuavad pingutust ja planeerimist: saate luua uue aadressi […]