Př. Oracle SQL – Text Retrieval
SELECT 
FROM 
WHERE 
Textový výraz může být ve tvaru:
- výrazy bez použití tezauru
| „text“ | Obyčejný term | 
| „text“* | Zprava rozšířený term | 
| *„text“ | Zleva rozšířený term | 
| *“text“* | Oboustranně rozšířený term | 
| „t?xt“ | Term s libovolným znakem místo „?“ | 
| „t%xt“ | Term s libovolným podřetězcem místo „%“ | 
| „text1“(m,n)“text2“ | Text1 může být o m slov za text2 nebo, text2 o n slov za text1 | 
Boolský model:P vs. R
- upřesňováním dotazu v Boolském modelu získáváme větší P, ale menší R
Př. pokus (Blair, Maron 1985) – 40 000 právnických textů o dopravních nehodách, Cíl: nejen vysoké P ale i R., Výsledky: P=80%, R=20% - málo!!! (teoreticky 100%), Problém synonym – obecný jazyk, nelze zachytit tezaurem (Př. nehoda, neštěstí, srážka, karambol,...)
- automatická indexace neodstraní tyto problémy
 
Žádné komentáře:
Okomentovat