Home : Tehnički uvjeti : Definicija rudarstva podataka

Data Mining

Data mining je postupak analize velikih količina datum kako bi se otkrili obrasci i druge informacije. Tipično se izvodi na baze podataka, koji pohranjuju podatke u strukturiranom formatu. "Iskopavanjem" velike količine podataka mogu se otkriti i koristiti skriveni podaci u druge svrhe.

Primjeri rudarenja podataka

Tvrtka koja izdaje kreditne kartice može koristiti rudarenje podataka kako bi saznala više o kupovnim navikama svojih članova. Analizirajući kupnje od vlasnika kartica širom Sjedinjenih Država, tvrtka može otkriti navike kupovine za različite demografske skupine, poput starosti, rase i mjesta. Ove bi informacije mogle biti korisne u nuđenju pojedinačnih promocija. Isti podaci mogu također otkriti obrasce kupovine u različitim regijama zemlje. Te bi informacije mogle biti dragocjene za tvrtke koje žele oglašavati ili pokretati posao u određenim državama.

Internetske usluge, kao što su Google i Facebook, miniraju ogromne količine podataka kako bi svojim korisnicima pružili ciljani sadržaj i oglase. Google bi, na primjer, mogao analizirati pretraživanje upita da biste otkrili popularna pretraživanja za određena područja i premjestili ih na vrh popisa samodovršavanja (prijedlozi koji se pojavljuju dok tipkate). Iskopavanjem podataka o korisničkim aktivnostima, Facebook bi mogao otkriti popularne teme među različitim dobnim skupinama i pružiti ciljane oglase na temelju tih podataka.

Iako se rudarenje podataka obično koristi u marketinške svrhe, ono ima i mnoge druge namjene. Na primjer, zdravstvene tvrtke mogu koristiti rudarenje podataka kako bi otkrile veze između određenih gena i bolesti. Vremenske tvrtke mogu iskopavati podatke kako bi otkrile vremenske obrasce koji mogu pomoći u predviđanju budućih meteoroloških događaja. Institucije za upravljanje prometom mogu iskopavati automobilske podatke kako bi predvidjele buduće razine prometa i stvorile odgovarajuće planove za autoceste i ulice.

Zahtjevi za rudarenje podataka

Data mining zahtijeva dvije stvari - puno podataka i puno računalne snage. Što su podaci organiziraniji, to ih je lakše dobiti zbog korisnih informacija. Stoga je važno da svaka organizacija koja se želi baviti rudarstvom podataka bude proaktivna u odabiru podataka koje će evidentirati i kako ih pohraniti. Što se tiče rudarenja podataka, superračunala i računalni klasteri može se koristiti za obradu petabajta podataka.

TechLib - računalni rječnik Tech Lib

Ova stranica sadrži tehničku definiciju Data Mininga. U računalnoj terminologiji objašnjava što znači Data Mining i jedan je od mnogih tehničkih izraza u rječniku TechLib.

Sve definicije na web mjestu TechLib napisane su kako bi bile tehnički točne, ali i lako razumljive. Ako smatrate da je ova definicija Data Mininga korisna, možete se na nju pozvati pomoću gore navedenih citata.