- dolování, získávání dat
Základní metody:
1. Rozhodovací stromy
- rozhodovací strom nemůže být příliš hluboký – neměl by statisticky významné hodnoty pro rozhodování v nižších úrovních
- je třeba vybrat strom, který nejspolehlivěji předikuje výsledky
2. Shlukování (Clustering)
- problémy:
- je zadán postačující počet shluků?
- nalezení „nejlepších shluků“
- jsou shluky sémanticky smysluplné?
- ukládání shluků na disk?
3. Dolování asociačních pravidel
- trend – jaké položky se kupují spolu např. lyže si někdo koupí společně s vázáním
- asociační pravidla:
- pravidla P1, P3, P8
- support – počet košů obsahující tento produkt
- častá množina položek
- problém – nalezení všech častých položek
- důsledky:
- mohutnost množiny dvojic
- mohutnost množiny n-tic
Žádné komentáře:
Okomentovat