Dotaz #77

Stav řešení Schváleno
Typ dotazu věcný popis (VEC)
Odesláno 24. 10. 2000
MARC 21
Citační číslo RDA
Klíčová slova
Komentáře šlo přidávat do 21. prosince 2000

Charakteristika problému

Vína a vina. Vzhledem k tomu, že se v PH rozlišuje singulár a plurál "víno--druhy", "víno--servírování", "červená vína", "šumivá vína", dochází při vyhledávání záznamů se slovem "vína" k nepřesnému výsledku. Výsledkem dotazu jsou totiž záznamy nejen se slovem "vína", ale i se slovem "vina". Zajímal by nás názor ostatních katalogizátorů.

Rozhodnutí o řešení

Viz stanovisko č.1 a návrh řešení

Návrh řešení

Jde o problematiku homonym (zvláště pak homografů) a polysémů, která se obvykle v řízených slovnících odstraňuje
1. výběrem jiného synonymického tvaru (preferovaný termín)
2. upřesněním termínu pomocí adjektivního přívlastku, případně pomocí kvalifikátoru, tj. vysvětlujícího termínu, který se uvádí v závorce a je trvalou součástí preferovaného termínu/deskriptoru
Při vyhledávání metodou prohlížení přístupových rejstříků získá uživatel všechny potřebné relevantní informace bezprostředně.
K nepřesnému výsledku dochází při vyhledávání pomocí slov. V současnosti musí tedy být výsledek dotazu upřesněn kombinací dalších vhodných selekčních prvků, např. nadřazených termínů, notací MDT.
V budoucnosti lze tento nepříznivý dopad - velký ohlas irelevantních dokumentů - odstranit vhodným přímým zapojením řízených slovníků do procesu vyhledávání (dotváření uživatelova dotazu).

Komentáře

Nejsem si jist, že je dotaz šťastně formulován. Co který automatizovaný systém považuje za homograf, je individuální. Přísně vzato je jich v češtině velmi málo. Takže bychom před nimi neměli mít panický (snad jediný pravý příklad) strach.
Takové záležitosti by si měli ale řešit vlastníci jednotlivých systémů nejdříve sami. Mezi účastníky konference zřejmě převládají "majitelé" T-Series, tento "Angličan" původem nerozlišuje v Katalogu nejen velké a malé písmeno, délky, ale ani mnohá písmena s háčkem, takže již dávno jsme řešili zdánlivý homograf med a měď a několik dalších v tzv. výrazech tezauru (řízených klíčových slovech). Sami jsme si museli zjistit ukládání kvalifikátoru způsobem, který nevidí čtenář, ale vnímá stroj, sami jsme si museli vyjednat, aby konverzní program nepřeváděl kvalifikátory do formátu UNIMARC.
Tedy domnívám se, že zde by měly být řešeny obecně platné problémy (byť se vyjadřují pravidelně v zápisu pro UNIMARC). Nebo by mělo být předesláno, pro který systém platí. Obávám se, že jinak tento způsob řešení problémů (dotazy) zahltíme. Je zde ovšem platforma pro řešení otázky na obecné úrovni. Zdánlivé homografy nejsou takto počítačem vnímány, zapojíme-li slovo do řetězce (tedy klasického předmětového hesla).
Mělo by tedy být řešeno, zda i v případě "předmětových řetězců" musíme kvůli vyhledávání dle jednotlivých slov (filtrování) užívat alespoň skryté kvalifikátory. Tedy např. v případě T-Series výkladu v obrácených lomítkách.
Lze předpokládat, že při ukládání řetězce ve všech systémech zdánlivý homograf nečiní potíže a na "vadu" se přijde až při vyhledávání dle jednotlivých lexikálních jednotek. Tedy možná by se mělo spíše připomenout, že v různých MAKS se mohou jednotlivé lexikální jednotky chovat jako homografy (jednodušeji chovat jako zdánlivá homonyma podle citlivosti systémů na diakritiku) a diskutovat, je-li povinností je rozlišovat viditelně jako pravá homonyma a polysématická slova, nebo skrytě, nebo jinými nástroji.
08. 12. 2000 12:00

Schválený dotaz, diskuse je uzavřena