6B06149 – «Ақпараттық жүйелер» мамандығына арналған «AZhN 1202– АҚпараттық ЖҮйелер негіздері»



бет21/66
Дата13.09.2023
өлшемі3,7 Mb.
#180956
1   ...   17   18   19   20   21   22   23   24   ...   66
Байланысты:
umkd akparatt k zhuieler negizderi 2022
Протозология
Іздеу толықтығы(Recall) немесе іздеу толықтығының коэффициенті сұраныс нәтижесінде АІЖ тауып берген релевантты құжаттар санының тауып бермеген релевантты құжаттарының санына қатынасына тең:

Егер АІЖ индекстеген, бірақ шығарып бермеген релевантты құжаттарының саны нольге тең болса, іздеу толықтығы максималды мүмкін болады және 1-ге тең болады:
нулю:

жағдайда


Негізінен мұндай жағдайға да қол жеткізу мүмкіндігі өте аз. Сондықтан да іздеу толықтығын арттыру үшін АІЖ индекстеген, бірақ шығарып бермеген релевантты құжаттарының санын кемітуге тырысады:
с 0 жағдайында R 1
Нақты АІЖ іздеудің толықтық коэффициенті 0,7 мен 0,9 аралығындағы мәндерге ие. Мұнда да әртүрлі АІЖ-де бірдей сұранысқа әртүрлі іздеу толықтығы коэффициенті берілуі мүмкін.
Ақпарат іздеуде дәлдік пен толықтықтың қайсысы маңыздырақ? Егер бұл іздеу көрсеткіштерінің параметрлері жоғары болса, екеуі бірін бірі толықтырып, өте жақсы нәтиже береді. Бірақ шынайы жағдайда бұл параметрлер бір мезетте максималды жоғары көрсеткіштерге ие бола бермейді. Іздеу дәлдігі мен іздеу толықтығының өзара қатынасы келесі графикте бейнеленген:



Бұл графиктен іздеу дәлдігі маңызды емес, яғни мүмкіндігінше жан-жақты толық ақпарат қажет болған жағдайда іздеу толықтығы маңызды болатыны, ал ақпараттың көптігі емес нақтылығы маңызды кезінде іздеу дәлдігі маңыздырақ екендігін көруге болады. Яғни нақты сұраққа нақты жауап алу қажеттігі туындағанда іздеу дәлдігі алдыңғы орынға шығады. Негізінен барлық пайдаланушылар сұраныстарына орай нақты жауап алуға тырысатын болғандықтан, іздеу дәлдігі маңыздырақ деп саналады.



Ақпараттық іздеу жүйелері. Іздеу аппараты. Ақпараттық-іздеу тілі. Құрамы. Құрылымы.

Ақпараттық іздеу жүйесі ақпаратты іздеу құралы болғандықтан, оны қолданудың тиімділігі Адамның объектілердің табиғатын және сол объектілермен жұмыс істейтін құралдың қасиеттерін қаншалықты жақсы білетініне байланысты.


Білімді ұсынудың екі жүйесінің өзара әрекеттесуі ретінде қарастырылатын іздеу процесінің ерекшелігі-көп деңгейлі және көбінесе ақпараттық қайта құру тізбегіндегі объектілердің әртүрлілігінде. Өзара іс-қимылға (деректер базасындағы қажеттіліктер мен құжаттарды салыстыру) тікелей қатысатын операциялық объектілер құжаттың іздеу бейнесі және сұрау салудың іздеу бейнесі болып табылады, олардың сәйкестігі ресми деңгейде АІЖ-сі іздеу тетігімен белгіленеді. Шынайы сәйкестікті орнату мазмұнды семантикалық деңгейде байланыстыруды қамтиды: пайдаланушы негізгі ұғымдарды тізімдеу үшін мүмкін болатын мазмұнды іс жүзінде қайта жасайды, содан кейін алынған кескін нақты қажеттілікпен байланысты болады. Сонымен қатар, кескіннің құжаттың нақты мазмұнына сәйкестігі ақпаратты жинақтау процесінің сапасымен ғана емес, сонымен бірге рефлексия құралдарының субъектісі – пәндік аймақтың тұжырымдамалық схемасы мен ақпараттық-іздеу тілінің мүмкіндіктерімен де анықталады. Осы тұжырымдамамен байланысты анықтамаларды қарастырайық.
Ақпараттық - іздестіру тілі (АІТ) – ақпараттық жүйелерде, оның ішінде ақпараттық –кітапханалық жүйелерде (АКЖ) іздестіруді қамтамасыз ету мақсатында құжаттардың мазмұнын және ақпараттық сұратуларды білдіруге немесе фактілерді сипаттауға арналған жасанды тіл. Бірінші анықтаманы толықтыруда ақпараттық-іздестіру тілдері – пайдаланушының сұрауына сәйкес нәтиже алу үшін іздеуді қамтамасыз ету мақсатында деректер қорында (ДҚ) сақталатын объектілердің (құжаттар, фактілер және т.б.) арнайы сипаттамаларын (индекстер, дескрипторлар, тезаурустар, кілт сөздер және т. б.) қалыптастыруға арналған жасанды тілдер деп айтылады. Олар арнайы ережелер, соның ішінде грамматика, белгілеу жүйелері (алфавит) және т. б. негізінде қалыптасады. Қазіргі уақытта бұл мақсатта табиғи тілді әлі де толық пайдалану мүмкін емес, өйткені оны машиналық формада ұсынудың күрделілігі, сонымен қатар полисемия, сөздер арасындағы кейбір байланыстардың бейресми болуы және т. б.
Ақпараттық іздеу тілдерінің түрлерін қарастырайық. Кілт сөз – құжат немесе сұрау мәтінінен бөлінетін және ақпараттық іздеу тұрғысынан елеулі мағыналық жүктемесі бар жеке сөз немесе табиғи тілдің сөз тіркесі. Кілттік сөз индекстеу кезінде құжаттың негізгі мазмұнын көрсетеді. Түйінді сөздер тезауруста жүйе шеңберінде ақпараттық-іздестіру тезаурусына арналған стандартпен немесе әдістемемен белгіленетін біріздендірілген грамматикалық нысанда ұсынылады.
Кілт сөздерден басқа, әртүрлі жіктеулер кеңінен қолданылады, олар әдетте жіктеу кестелері түрінде ұсынылады.
Бұл аспект бойынша жіктеу дегеніміз-сынып кодынан, оның атауынан және бөлу мазмұнын ашатын әдістемелік нұсқаулардан, сілтемелерден және т. б. тұратын жіктеу жүйесіне топтастырылған элементтер жиынтығы.
Жіктеу жүйелері әмбебап және салалық болып бөлінетін жіктеу кестелерінде көрсетіледі.
Рубрикатор жүйеге енгізілген сыныптардың толық тізбесін қамтитын және ақпараттық қорларды, массивтерді және басылымдарды жүйелеуге, сондай-ақ оларды іздеуге арналған иерархиялық жіктеу кестесін білдіреді.
Жеке ұғымдарды жіктеу жүйесінде белгілеу үшін онда көптеген таңбаларды индекстеу және оларды қолданудың арнайы ережелері қолданылады.
Индекстеу термині-құжаттың іздеу үлгісінде (астында) ұсынылған және белгілі бір АІТ ережелеріне сәйкес жасалған бір немесе бірнеше байланысты лексикалық бірліктер (лар). АІТ классификациясында ол толық жіктеу индексінің көмегімен, пәндік – индекстеуде пәндік рубрикалардың жиынтығы түрінде көрінеді.
Пәндік-индекстеу түрі, онда құжаттың және (немесе) сұраудың мазмұны қандай да бір пәндік АІТ ережелеріне сәйкес пәндік рубрикамен көрсетіледі.
Тезаурус-бұл "аударылған" түсіндірме сөздіктің бір түрі. Егер сөздің кәдімгі түсіндірме сөздігінде оның мағынасы болса, онда тезауруста белгілі бір мағынада жазылған сөз немесе қажетті мағынаны білдіретін бірнеше сөз кездеседі.
"Тезаурус" терминін XIII ғасырда алғаш рет б.Латини "Қазына туралы кітап"еңбегінде қолданған. Алғашқы тезаурустар ақпараттық қызмет қажеттіліктерімен байланысты болмады. Кітапханалық-ақпараттық жүйелерде тезаурустың дамуы тек жекелеген салалар үшін нақты. АЖ-дағы тезаурусты оның семантикалық мазмұны ретінде қабылдауға болады. Әмбебап кітапханалар бар иерархиялық жіктеулерді немесе пәндік рубрикаларды пайдаланады.
Дескриптор (ағылш. "todescribe" — сипаттау), құжаттарды және (немесе) ақпараттық сұратуларды координаттық индекстеу үшін пайдаланылатын баламалы немесе мағынасы жағынан жақын кілт сөздерді қамтитын сөзбен, сөз тіркесімен немесе кодпен өрнектелген АІТ сөздік бірлігі; синонимдік немесе мағынасы жағынан жақын көптеген түйінді сөздерден таңдалған, нормаланған сөз немесе сөз тіркесі ұғынылатын ақпараттық-іздестіру тезаурусының лексикалық бірлігі.
Дескриптор дегеніміз-белгілі бір шығарманың тақырыбын белгілеу үшін қолданылатын термин, белгі немесе басқа таңбалар сериясы. Дескрипторды ұғымдарды біржақты сипаттауға арналған термин ретінде 1950 жылы американдық математик к.Мэрс енгізді. Ол сонымен қатар лексиканы бақылау үшін арнайы дескриптор сөздіктерін құруды ұсынды.
Терминдердің бірін дескриптор ретінде таңдау критерийлері-бұл құжаттар мен сұраулардың мәтіндерінде терминнің мағынасын, қысқалығын, түсінігін және кездесу жиілігін толық білдіру. Құжаттар мен сұраныстарды индекстеу кезінде алмастыратын берілген дескриптордың эквиваленттік класына кіретін ақпараттық іздеу тезаурусы лексикалық бірлігі аскриптор (нескриптор) деп аталады. Бұл жағдайда дескриптор сөздігі дескрипторлар мен аскрипторлардың алфавиттік тізімін ұсынады.
Ақпараттық-іздестіру тезаурусы-тезаурустың бір түрі, дескрипторлық ақпараттық-іздестіру тілінің сөздігі немесе дескрипторлар мен түйінді сөздердің нормативтік сөздігі, осы бірліктер арасында бекітілген парадигматикалық қатынастар бар. Құжаттар мен ақпараттық сұраныстарды координаттық индекстеуге арналған. Қысқаша айтса, ақпарат іздеу тезаурусы – бұл терминдер тізімі, олардың синонимдері мен байланыстары.


Достарыңызбен бөлісу:
1   ...   17   18   19   20   21   22   23   24   ...   66




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет