O knjizi
Analiza podataka u programskom jeziku R (drugo izdanje)
Šta ćete naučiti iz ove knjige i za šta će vam koristiti stečeno znanje?
upravljanje R okruženjem
opis i vizuelizacija ponašanja podataka i veze između podataka
bolje razumevanje statističkog rezonovanja i uzorkovanja
korišćenje testova hipoteza za izvođenje zaključaka iz podataka
učenje Bajesovih metoda za procenu parametara
izvršavanje regresije radi procene kontinualnih promenljivih
primena moćnih metoda klasifikacije za predviđanje kategorijskih podataka
elegantno upravljanje nedostajućim podacima pomoću višestruke amputacije
identifikovanje problematičnih tačaka podataka i upravljanje njima
korišćenje paralelizacije i Rcppa za skaliranje analize na veće podatke
primena najboljih tehnika za pojednostavljivanje posla i omogućavanje reproducibilnosti
Opis knjige
Programski jezik R, koji često koriste naučnici, veoma je rasprostranjen u privatnom sektoru i njegovu primenu možete videti na asortimanima proizvoda u nekim najnaprednijim i najuspešnijim preduzećima. Moć R-a i njegova prilagođenost određenoj oblasti omogućava korisniku da kompleksnu analitiku izrazi jednostavno, brzo i sažeto.
Počev od osnove R-a i statističkog rezonovanja, u ovoj knjizi je detaljno razmatrana napredna prediktivna analitika i prikazan je način primene ovih tehnika na podatke u stvarnom svetu pomoću primera iz stvarnog sveta.
Ova knjiga počinje pregledom R-a i njegove sintakse, a obiluje rešenjima za probleme u vezi sa njegovim korišćenjem i vežbama. Upoznaćete osnove statistike koja je primenjena, a zatim ćete nadgraditi to znanje da biste mogli da obavljate sofisticiranu i moćnu analitiku. Rešićete poteškoće koje se odnose na obavljanje analize podataka u praksi i pronaći ćete rešenja za korišćenje „neurednih“ i velikih podataka i za izveštavanje o rezultatima i omogućavanje reproducibilnosti.
Ova knjiga je napisana tako da služi kao dragoceni izvor za analitičare podataka kroz mnoge faze njihove karijere.
Autor
Tony Fischetti
Toni Fischetti je analitičar podataka na koledžu „Factual“ i svakodnevno koristi R da bi izgradio lične sisteme za rangiranje i preporuku. Diplomirao je kognitivnu nauku na institutu „Rensselaer Polytechnic“ - njegov diplomski rad je bio fokusiran na korišćenje statistike za proučavanje kratkoročne vizuelne memorije.
Uživa u pisanju softvera otvorenog koda i bloga na sajtu „onthelambda“, piše o sebi u trećem licu i deli svoje znanje, koristeći jednostavan pristupačan jezik i primere.
Takođe uživa u uobičajenim i uzbudljivim svakodnevnim aktivnostima, kao što su slušanje muzike, sviranje gitare i bubnjeva, dizanje tegova i pomaganje drugima.
Sadržaj
1: Osnove programskog jezika R
2: Oblik podataka
3: Opis veza
4: Verovatnoća
5: Korišćenje podataka za uzorkovanje i procenu
6: Testiranje hipoteza
7: Bajesove metode
8: Bootstrap
9: Predviđanje kontinualnih promenljivih
10: Predviđanje kategorijskih promenljivih
11: Predviđanje promena tokom vremena
12: Izvori podataka
13: Upravljanje nedostajućim podacima
14: Upravljanje neurednim podacima
15: Upravljanje velikim podacima
16: Korišćenje popularnih R paketa
17: Reproducibilnost i najbolje tehnike