Nobel
EDUKACIJA
Peti meetup u SPARKu: Big Data – Velika prilika
Objava: 5.6.2017 / 15:31
Prikaza: 558
Autor: Manager.ba
Peti meetup u SPARKu: Big Data – Velika prilika
0

SPARK Tech Meetup polako postaje tradicija, jer je u subotu održan čak peti po redu meetup! U SPARKu se okupilo više od 100 posjetitelja zainteresiranih za teme Big Data i Machine Learning.

Uvod u temu Big Dana uradio je Dario Jurčić iz tvrtke NSoft i objasnio zašto je Big Data velika prilika. Za one koji već znaju ponešto o ovim temama govorio je Blago Čuljak iz tvrtke Galileo, a za profesionalce u ovim područjima predavanje je održao Marko Štajcer iz tvrtke Poslovna inteligencija.

Dario Juričić je detaljno objasnio Što je to Big Data.

U današnje vrijeme često čujemo ovaj izraz, iako će mnogi reći da nisu sigurni u značenje. Ako provedete malo vremena na Google-u i pokušate shvatiti što je Big Data, možda ćete naići na neka objašnjenja koja nećete razumjeti. Kada pokušavamo objasniti pojam osobi koja ga prvi put čuje, jednostavan način je obično i najbolji. U ovom slučaju to je “Tri V Big Data-e”.

Ako imate problem s bilo kojim od sljedećih “V”, imate Big Data problem: brzina obrade podataka (potrebno obraditi tj. procesirati podatke u kratkom vremenu – Velocity), količina podataka (ogromne količine podataka koje je teško pohraniti – Volume) te raznolikosti podataka (puno podataka sa puno izvora – Variety).
Nekada su količina i brzina podataka bili najproblematičniji.

Međutim, pojeftinjenjem diskova i povećanjem raznolikosti oblika skladištenja podataka, uvelike se riješio problem pohranjivanja velike količine podataka. Povećanjem protoka podataka (npr. 40Gb Ethernet) problem s prevelikom brzinom pristižućih podataka više nije toliki izazov.

Ono što je danas najveći izazov Big Data-e je zadnje V – velika raznolikost podataka. Izvora podataka je sve više, a generirani podaci nisu isti – neki su strukturirani, neki nestrukturirani ili djelomično strukturirani, a tu su i audio i video zapisi, razni logovi, itd.

Danas jednostavne aktivnosti kao što su čitanje knjige, gledanje televizora ili slušanje glazbe generiraju podatke o našim aktivnostima. Svaki oblik ljudske komunikacije ostavlja digitalni trag, počevši od e-maila pa do razgovora preko telefona ili chat-a preko Facebook-a.

Zašto je onda Big Data i velika prilika? Vraćamo se na jednu staru izreku koja kaže: znanje je moć.

Samo za primjer, znati što vaši klijenti vole, kakve su im navike, demografija, predvidjeti što će kupiti ili uraditi daje vam moć da upravljate vašim biznisom na najbolji mogući način.

Naravno, u moru različitih izvora podataka koji pristižu velikom brzinom, izvući smisao i poslovnu vrijednost nije lako. Tu leži najveća prilika Big Data-e kao i možda najtraženiji, najbolje plaćen posao našeg vremena – data science.

Generalno, može se reći da je data science izvlačenje znanja iz podataka. Data scientist-i istražuju kompleksne probleme na osnovu poznavanja disciplina kao što su matematika, statistika i računalne znanosti. Vrijednost donose koristeći analitička znanja i alate kao što su R i SAS, tehnička znanja kao što je kodiranje u Python-u i SQL. Ipak, možda je najbitnije ono što donesu i jednom ne tehničkom osobinom koja razlikuje dobrog i lošeg data scientist-a – znatiželjom.

Prema izvješćima kompanija kao što je Deloitte, svjetske kompanije će već u 2018. trebati više od milijun data scientist-a. Ovisno o niši, neke kompanije će vrednovati data scientist-e više, neke manje, ali prosječne godišnje plaće u U.S.A. se uglavnom kreću između 100 000 i 200 000 $. Nije ni čudno što je Forbes nazvao“Data Scientist” najboljim odabirom za karijeru u 2016. godini.

Ipak, mnogi će reći da se sve što je ovako vruće mora i ohladiti. Međutim imajući u vidu sve prethodno rečeno – da se izvori, količina i brzina kojom podaci pristižu iz godine u godinu drastično povećava, da kompanije sve više žele izvući poslovnu vrijednosti iz podataka, sigurno je da je Data Science odličan odabir karijere koji će vas osigurati novčano i držati intelektualno ”napetim”.

Ako ste početnik, posjetite stranicu DataQuest.io i iskoristite besplatne uvodne lekcije, a ako se odlučite da je Data Science za vas, cijena nastavaka učenja je vrlo povoljna.

Ako posjedujete znanja, a još niste odlučili kojim putem krenuti, savjet je: Go for it. Jedino ograničenje je vaša znatiželja – napisao je u svom blogu Dario Jurčić iz tvrtke NSoft.

Sva prava pridržana © 2017 Manager.ba
Dizajn i programiranje: 4ANTS