Pri delu z umetno inteligenco upoštevajte neusklajenost podatkov

Pri zbiranju podatkov za algoritme umetne inteligence morate upoštevati neusklajenost podatkov in način, kako jih odpraviti. Podatki morda obstajajo za vsak podatkovni zapis v naboru podatkov, vendar se morda ne ujemajo z drugimi podatki v drugih naborih podatkov, ki jih imate. Na primer, številčni podatki v polju v enem naboru podatkov so lahko tipa s plavajočo vejico (z decimalno vejico), v drugem naboru podatkov pa celoštevilski tip. Preden lahko združite oba nabora podatkov, morajo polja vsebovati isto vrsto podatkov.

Pojavijo se lahko vse vrste drugih vrst neusklajenosti. Na primer, datumska polja so znana po tem, da so oblikovana na različne načine. Za primerjavo datumov morajo biti formati podatkov enaki. Vendar pa so zmenki tudi zahrbtni v svoji nagnjenosti, da izgledajo enako, a niso enaki. Na primer, datumi v enem naboru podatkov lahko za osnovo uporabljajo srednji čas po Greenwichu (GMT), medtem ko lahko datumi v drugem naboru podatkov uporabljajo drug časovni pas. Preden lahko primerjate čase, jih morate uskladiti z istim časovnim pasom. Lahko postane še bolj čudno, če datumi v enem naboru podatkov prihajajo z lokacije, ki uporablja poletni čas (DST), datumi z druge lokacije pa ne.

Tudi če so vrste in format podatkov enaki, lahko pride do drugih neusklajenosti podatkov. Na primer, polja v enem naboru podatkov se morda ne ujemajo s polji v drugem naboru podatkov. V nekaterih primerih je te razlike enostavno popraviti. En nabor podatkov lahko obravnava ime in priimek kot eno polje, medtem ko lahko drugi nabor podatkov uporablja ločena polja za ime in priimek. Odgovor je, da spremenite vse nabore podatkov za uporabo enega samega polja ali spremenite vse, da uporabljajo ločena polja za ime in priimek. Na žalost je veliko neusklajenosti vsebine podatkov težje ugotoviti. Pravzaprav je povsem mogoče, da jih sploh ne boste mogli ugotoviti. Vendar, preden obupate, razmislite o teh možnih rešitvah težave:

  • Izračunajte manjkajoče podatke iz drugih podatkov, do katerih lahko dostopate.
  • Poiščite manjkajoče podatke v drugem nizu podatkov.
  • Združite nabore podatkov, da ustvarite celoto, ki zagotavlja konsistentna polja.
  • Zberite dodatne podatke iz različnih virov, da zapolnite manjkajoče podatke.
  • Ponovno definirajte svoje vprašanje, da ne boste več potrebovali manjkajočih podatkov.

Za starejše: Kako vstaviti izrezke v diapozitiv PowerPoint

Za starejše: Kako vstaviti izrezke v diapozitiv PowerPoint

Izrezki so vnaprej narisane splošne umetnine, Microsoft pa s svojimi izdelki Office brezplačno ponuja številne datoteke z izrezki. Izrezke lahko vstavite v postavitev diapozitiva PowerPoint. Najlažji način za vstavljanje izrezka je uporaba enega od označb mesta na postavitvi diapozitiva: Prikažite diapozitiv, ki vsebuje izrezek […]

Za starejše: Kako zapolniti barvo v Microsoft Excelu

Za starejše: Kako zapolniti barvo v Microsoft Excelu

Barva polnila – imenovana tudi senčenje – je barva ali vzorec, ki zapolni ozadje ene ali več celic delovnega lista Excel. Uporaba senčenja lahko pomaga bralčevim očem slediti informacijam po strani ter lahko delovnemu listu doda barvo in vizualno zanimanje. V nekaterih vrstah preglednic, kot je register čekovne knjige, […]

Dodajanje novih stikov v Act! 2005

Dodajanje novih stikov v Act! 2005

Na zelo preprosti ravni je glavni namen ACT! služi kot prostor za shranjevanje vseh stikov, s katerimi dnevno komunicirate. Vse svoje stike lahko dodate in uredite v oknu s podrobnostmi o stiku, ker vsebuje vse informacije, ki se nanašajo na en določen zapis in […]

Discord For LuckyTemplates Cheat Sheet

Discord For LuckyTemplates Cheat Sheet

Uporabite to Cheat Sheet, da takoj začnete uporabljati Discord. Odkrijte koristne bote Discord, aplikacije, ki jih lahko integrirate, in nasvete za intervjuje z gosti.

OpenOffice.org Za LuckyTemplates Cheat Sheet

OpenOffice.org Za LuckyTemplates Cheat Sheet

Pisarniški paket OpenOffice.org ima veliko orodij za lažje delo. Ko delate v OpenOffice.org, spoznajte funkcijsko orodno vrstico (ki je v vseh aplikacijah videti skoraj enako) in glavne gumbe orodne vrstice za pomoč pri osnovnih ukazih za večino opravil.

Bombe Machine Alana Turinga

Bombe Machine Alana Turinga

Stroj Bombe Alana Turinga ni bil nobena oblika umetne inteligence (AI). Pravzaprav niti ni pravi računalnik. Razbil je kriptografska sporočila Enigme in to je to. Vendar pa je Turingu zagotovilo razmislek, kar je na koncu pripeljalo do članka z naslovom “Computing Machinery and Intelligenceâ€?? ki ga je objavil v petdesetih letih prejšnjega stoletja in opisuje […]

Standardne pomanjkljivosti strojne opreme za umetno inteligenco

Standardne pomanjkljivosti strojne opreme za umetno inteligenco

Sposobnost ustvarjanja modularnega sistema ima pomembne prednosti, zlasti v poslu. Zmožnost odstranjevanja in zamenjave posameznih komponent ohranja nizke stroške, hkrati pa omogoča postopno izboljšanje hitrosti in učinkovitosti. Vendar, tako kot pri večini stvari, ni brezplačnega kosila. Modularnost, ki jo zagotavlja Von Neumannova arhitektura, prihaja z nekaj […]

10 stvari, ki jih je treba storiti in kaj storiti pri uporabi QuarkXPress

10 stvari, ki jih je treba storiti in kaj storiti pri uporabi QuarkXPress

Če bi morali izbrati deset stvari o QuarkXPressu, ki jih je enostavno pozabiti, a izjemno uporabnih, ki bi si jih zapomnili, bi bile tiste na naslednjem seznamu, dragi bralec, to. Namaste. Pogovorite se s svojim komercialnim tiskalnikom. Vsi projekti tiskanja se začnejo in končajo s tiskalnikom. To je zato, ker samo tiskarji poznajo svoje omejitve in na tisoče načinov, kako je projekt lahko […]

Izvor Bitcoina

Izvor Bitcoina

Najpomembnejši vidik bitcoina je morda koncept, ki stoji za njim. Bitcoin je ustvaril razvijalec Satoshi Nakamoto. Namesto da bi poskušal oblikovati popolnoma novo plačilno sredstvo, ki bi uničil način, kako vsi plačujemo stvari na spletu, je Satoshi videl določene težave z obstoječimi plačilnimi sistemi in jih želel odpraviti. Koncept […]

Kako zaščititi svojo zasebnost pri uporabi Bitcoin

Kako zaščititi svojo zasebnost pri uporabi Bitcoin

Določena raven anonimnosti je vezana na uporabo bitcoina in digitalne valute na splošno. Ali lahko to označite kot "dovolj anonimno", je osebno mnenje. Obstajajo načini za zaščito vaše zasebnosti, ko uporabljate bitcoin za premikanje sredstev, vendar ti zahtevajo nekaj truda in načrtovanja: ustvarite lahko nov naslov za […]