Uvod

Algoritmi za traženje uzoraka

Data mining u stvarnom svijetu

Zaključak

Linkovi

Autor

Data mining



U današnje vrijeme, zbog sve prisutnijeg procesa globalizacije, konkurencija je izrazito jaka. Uvijek postoji neka druga tvrtka koja nudi sličan proizvod, ali jeftiniji ili kvalitetniji. Stoga zadržavanje sadašnjih i privlačenje novih klijenata postaje sve teže, te je potrebno biti korak ispred konkurencije. Za postizanje tog cilja potrebno je predvidjeti klijentove potrebe, te svakom klijentu pristupiti individualno.

Zbog razvijene informatičke infratsrukture danas svaka tvrtka sprema goleme količine informacija o svakom klijentu. Da bi se te informacije, oplemenile potrebno ih je analizirati. Zbog velike količine informacija takvu analizu čovjek nije u stanju učiniti, nego se ona prepušta programima. Strojno pretraživanje baza podataka poznato je pod nazivom data mining

Data mining se definira kao automatsko traženje skrivenih informacija u bazama podataka. Pod skrivenim informacijama podrazumijeva se povezanost između pojedinih podataka u bazama podataka koja nije očita. Na temelju tako nađenih informacija kreira se model  ponašanja klijenata ili tržišta. Kreiranje modela temelji se na upotrebi statistike i umjetne inteligencije, te je za stvaranje boljeg modela potrebna veća količina podataka. Za stvaranje boljih modela potrebne su veće baze podataka, kao i sofisticiraniji algoritmi, koji profitiraju razvojem računala. Zato se tek u zadnje vrijeme data mining počinje izraženije korisiti.

Data mining analize temelje se na metodama raspoznavanja uzoraka, a koriste se za rješavanje problema:

  • Razvrstavanja – razvrstavanje klijenata u unaprijed određene grupe na temelju nekih zajedničkih karakteristika

  • Predviđanja – procjenjivanje ponašanja (karakteristika) klijenata u budućnosti

  • Procjene vrijednosti – procjenjivanje vrijednosti neke varijable u budućnosti (cijene)

  • Grupiranja – određivanje grupa u koje se poslije razvrstavaju klijenti

  • Metoda analiza košarice – otkrivanje koji su proizvodi međusobno povezani, gdje prodaja jednog proizvoda za sobom povlači i prodaju drugog proizvoda. Također se može vršiti i analiza slijeda prodaje