- dolování, získávání dat
- základní metody:
1. Rozhodovací stromy
- rozhodovací strom nemůže být příliš hluboký – neměl by statisticky významné hodnoty pro rozhodování v nižších úrovních
- je třeba vybrat strom, který nejspolehlivěji předikuje výsledky
2. Shlukování (Clustering)
- problémy:
Ø je zadán postačující počet shluků?
Ø nalezení „nejlepších shluků“
Ø jsou shluky sémanticky smysluplné?
Ø ukládání shluků na disk?
3. Dolování asociačních pravidel
- trend – jaké položky se kupují spolu např. lyže si někdo koupí společně s vázáním
- asociační pravidla:
Ø pravidla P1, P3, P8
Ø support – počet košů obsahující tento produkt
Ø častá množina položek
Ø problém – nalezení všech častých položek
- důsledky:
- mohutnost množiny dvojic
- mohutnost množiny n-tic
Žádné komentáře:
Okomentovat