Hledejte v chronologicky řazené databázi studijních materiálů (starší / novější příspěvky).

DATA MINIG

- dolování, získávání dat

Základní metody:

1. Rozhodovací stromy

- rozhodovací strom nemůže být příliš hluboký – neměl by statisticky významné hodnoty pro rozhodování v nižších úrovních
- je třeba vybrat strom, který nejspolehlivěji předikuje výsledky

2. Shlukování (Clustering)

- problémy:
- je zadán postačující počet shluků?
- nalezení „nejlepších shluků“
- jsou shluky sémanticky smysluplné?
- ukládání shluků na disk?

3. Dolování asociačních pravidel

- trend – jaké položky se kupují spolu např. lyže si někdo koupí společně s vázáním
- asociační pravidla:
- pravidla P1, P3, P8
- support – počet košů obsahující tento produkt
- častá množina položek
- problém – nalezení všech častých položek

- důsledky:
- mohutnost množiny dvojic
- mohutnost množiny n-tic

Žádné komentáře:

Okomentovat