Hledejte v chronologicky řazené databázi studijních materiálů (starší / novější příspěvky).

Boolský model – aplikace

Př. Oracle SQL – Text Retrieval

SELECT

FROM

WHERE CONTAINS

Textový výraz může být ve tvaru:

- výrazy bez použití tezauru

„text“

Obyčejný term

„text“*

Zprava rozšířený term

*„text“

Zleva rozšířený term

*“text“*

Oboustranně rozšířený term

„t?xt“

Term s libovolným znakem místo „?“

„t%xt“

Term s libovolným podřetězcem místo „%“

„text1“(m,n)“text2“

Text1 může být o m slov za text2 nebo, text2 o n slov za text1

Boolský model:P vs. R

- upřesňováním dotazu v Boolském modelu získáváme větší P, ale menší R

Př. pokus (Blair, Maron 1985) – 40 000 právnických textů o dopravních nehodách, Cíl: nejen vysoké P ale i R., Výsledky: P=80%, R=20% - málo!!! (teoreticky 100%), Problém synonym – obecný jazyk, nelze zachytit tezaurem (Př. nehoda, neštěstí, srážka, karambol,...)

- automatická indexace neodstraní tyto problémy

Žádné komentáře:

Okomentovat