- dolování, získávání dat
- základní metody:
1. Rozhodovací stromy
- rozhodovací strom nemůže být příliš hluboký – neměl by statisticky významné hodnoty pro rozhodování v nižších úrovních
- je třeba vybrat strom, který nejspolehlivěji předikuje výsledky
2. Shlukování (Clustering)
- problémy:
Ø je zadán postačující počet shluků?
Ø nalezení „nejlepších shluků“
Ø jsou shluky sémanticky smysluplné?
Ø ukládání shluků na disk?
3. Dolování asociačních pravidel
-          trend – jaké položky se kupují spolu např. lyže si někdo koupí společně s vázáním
-          asociační pravidla:
Ø  pravidla P1, P3, P8
Ø  support – počet košů obsahující tento produkt
Ø  častá množina položek
Ø  problém – nalezení všech častých položek
-          důsledky:
- mohutnost množiny dvojic
- mohutnost množiny n-tic
 
Žádné komentáře:
Okomentovat