Hej tamo! Kao dobavljač Nan proizvoda, često me pitaju kako vizualizirati podatke s 'Nan' vrijednostima. 'Nan', što znači 'a ne broj', može biti prava bol u vratu kada pokušavate smisliti svoje podatke. Ali ne brinite, imam nekoliko savjeta i trikova koji će vam pomoći u rješavanju ovih neugodnih vrijednosti i stvoriti fenomenalne vizualizacije.
Prvo, razgovarajmo o tome zašto se u prvom redu pojavljuju 'Nan' vrijednosti. Mogu se pojaviti iz gomile razloga. Možda je došlo do pogreške tijekom prikupljanja podataka, poput neispravnosti senzora ili unosa koji nedostaje u proračunskoj tablici. Ili možda podaci jednostavno ne postoje za određeno promatranje. Na primjer, ako prikupljate podatke o visinama ljudi, a neki ljudi nisu htjeli dijeliti te informacije, te bi vrijednosti bile 'nan'.
Sada, kada je u pitanju vizualizacija podataka s 'Nan' vrijednostima, prvi korak je shvatiti što učiniti s njima. Postoji nekoliko uobičajenih pristupa.
Jedna je opcija jednostavno uklanjanje redaka ili stupaca koji sadrže vrijednosti 'nan'. Ovo može biti brzo i jednostavno popraviti, pogotovo ako imate veliki skup podataka, a broj vrijednosti 'nan' relativno je mali. Međutim, morate biti oprezni s ovom metodom. Uklanjanje podataka može vam iskriviti rezultate i dati vam lažnu sliku onoga što se zapravo događa. Na primjer, ako analizirate podatke o prodaji i uklonite sve redove s 'Nan' vrijednostima, možda ćete propustiti važne trendove ili obrasce povezane s onima koji nedostaju unosi.
Drugi je pristup ispuniti 'Nan' vrijednosti s nečim drugim. Možete upotrijebiti srednju, srednju ili način dostupnih podataka. Na primjer, ako gledate skup podataka temperatura i postoji nekoliko 'nan' vrijednosti, možete izračunati prosječnu temperaturu vrijednosti koje nisu - 'nan' i koristiti je za popunjavanje praznina. To može pomoći u izglađivanju vaših podataka i olakšati vizualizaciju. Ali opet, to nije savršeno rješenje. Korištenje sažetaka statistike za popunjavanje vrijednosti 'Nan' također može iskriviti vaše podatke, pogotovo ako podaci imaju veliku varijabilnost.


Možete koristiti i naprednije tehnike poput interpolacije. Interpolacija uključuje procjenu nedostajućih vrijednosti na temelju vrijednosti okolnih podataka. Na primjer, ako imate vremena - serijski skup podataka s 'Nan' vrijednostima, možete upotrijebiti linearnu interpolaciju za procjenu kakve bi vrijednosti trebale biti u onim vremenskim točkama koje nedostaju. To može biti precizniji način suočavanja s 'Nan' vrijednostima, ali može biti složenije i vremena - konzumira.
Jednom kada odlučite što učiniti s vrijednostima 'Nan', vrijeme je da počnete vizualizirati svoje podatke. Postoje mnoštvo alata koji vam mogu pomoći u stvaranju sjajnih vizualizacija. Neke popularne uključuju Python knjižnice poput Matplotlib i Seaborn, kao i R pakete poput GGPLOT2.
Recimo da ste tijekom vremena dobili skup podataka o prodaji proizvoda, a postoji nekoliko vrijednosti 'Nan'. Odlučili ste ispuniti vrijednosti 'Nan' sa srednjim iznosom prodaje. Sada želite stvoriti linijski grafikon kako biste pokazali trend prodaje. S matplotlib u Pythonu možete učiniti ovako nešto:
uvoz matplotlib.pyplot kao PLT Uvezi pande kao PD # pretpostavljaju da je "podaci" vaš podatkovni okvir s podacima o prodaji = pd.read_csv ('Sales_Data.csv') # ispunite 'nan' vrijednosti sa srednjim podacima ['prodaja'] = DATA ['prodaja']. plt.xlabel ('datum') plt.ylabel ('prodaja') plt.title ('prodaja proizvoda tijekom vremena') plt.show ()
Ovaj kôd čita u vašim prodajnim podacima iz CSV datoteke, ispunjava vrijednosti 'Nan' s srednjim iznosom prodaje, a zatim stvara jednostavan linijski grafikon za prikaz trenda prodaje tijekom vremena.
Ako vas zanimaju složenije vizualizacije, poput raspršivanja ili grafikona, ovi alati mogu podnijeti i njih. Na primjer, ako imate skup podataka koji uspoređuje ocjene prodaje i korisnika različitih proizvoda, a u stupcu ocjene postoje neke 'NAN' vrijednosti, mogli biste stvoriti zaplet za raspršivanje da biste vidjeli postoji li odnos između prodaje i ocjena.
Sada želim spomenuti neke proizvode koje nudimo u našoj tvrtki. Imamo neke stvarno cool Xpon Onu uređaje. ProvjeritiXPON ONU 4GE WIFI5 AC1200. Odličan je uređaj za brzi pristup internetu s ugrađenim - u Wi - Fi 5 mogućnostima. A ako vam treba nešto s više značajki, pogledajteXon Un 4ge Catv Pots WiFi5 AC1200. Ovaj ne samo pruža pristup internetu, već i podržava CATV i Pots veze. Za najnovije u Wi - FI tehnologiji,Ovaj tut 4ge voip špilja cati6je put kojim treba ići. Nudi visoku - brzinu Wi - Fi 6 povezivanje zajedno s podrškom za VoIP i CATV.
Ako ste na tržištu za takve vrste proizvoda ili imate bilo kakvih pitanja o vizualizaciji podataka s 'nan' vrijednostima, ne ustručavajte se posegnuti. Tu smo da vam pomognemo da najbolje iskoristite svoje podatke i dobijete prave proizvode za svoje potrebe. Bez obzira jeste li vlasnik male tvrtke koji želi poboljšati internetsku infrastrukturu ili analitičar podataka koji pokušava smisliti neuredne podatke, imamo rješenja za vas. Dakle, započnimo razgovor i vidimo kako možemo raditi zajedno!
Reference
- Vanderplas, J. (2016). Priručnik za znanost Python: Bitni alati za rad s podacima. O'Reilly Media.
- Wickham, H. (2016). GGPLOT2: Elegantna grafika za analizu podataka. Springer.
