Hledejte v chronologicky řazené databázi studijních materiálů (starší / novější příspěvky).

DATA MINIG

- dolování, získávání dat

- základní metody:

1. Rozhodovací stromy

- rozhodovací strom nemůže být příliš hluboký – neměl by statisticky významné hodnoty pro rozhodování v nižších úrovních

- je třeba vybrat strom, který nejspolehlivěji předikuje výsledky

2. Shlukování (Clustering)

- problémy:

Ø je zadán postačující počet shluků?

Ø nalezení „nejlepších shluků“

Ø jsou shluky sémanticky smysluplné?

Ø ukládání shluků na disk?

3. Dolování asociačních pravidel

- trend – jaké položky se kupují spolu např. lyže si někdo koupí společně s vázáním

- asociační pravidla:

Ø pravidla P1, P3, P8

Ø support – počet košů obsahující tento produkt

Ø častá množina položek

Ø problém – nalezení všech častých položek

- důsledky:

- mohutnost množiny dvojic

- mohutnost množiny n-tic

Žádné komentáře:

Okomentovat