Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Лабораторна робота № 4
на тему: Застосування мови запитів пошукової системи Google для розвязання складних інформаційно-пошукових задач
Мета роботи: ознайомитися з мовою запитів пошукової системи Google, вивчити оператори, які використовуються у мові запитів, та їхній синтаксис, навчитися застосовувати мову запитів для формування складних запитів до пошукової системи з метою вирішення складних інформаційно-пошукових задач.
Теоретичні відомості
Для максимального зниження рівня інформаційного шуму у результатах пошуку необхідно використовувати розширені можливості пошукових систем. Доступ до розширених можливостей та їх застосування реалізується або через панель розширеного пошуку (лабораторна робота №3), або через мову запитів до пошукової системи.
Мова запитів передбачає наявність спеціальних операцій пошуку, які дають змогу параметризувати запит, щоб отримати якомога точніший результат. Використовуючи відповідний синтаксис мови запитів, створюється запит до конкретної пошукової системи.
Пошук виконується у стрічці загального пошуку Google.
Синтаксис операцій пошукової системи Google подано в таблиці 1.
Таблиця 1.
Синтаксис операцій пошукової системи Google
Синтаксис операцій Google |
Застосування |
“запит” |
Цитата, слова підряд в точній формі або конкретна морфологічна форма слова |
(складний запит) |
Групування в складних запитах. Використовується для того, щоб вказати, що під дію певного оператора потрапляє не одне слово, а група слів |
запит1 запит2 або запит1 AND запит2 |
Логічне “I”: вживання слів в межах одного документа |
запит1|запит2 запит1 OR запит2 |
Логічне “АБО” |
−запит |
Логічне “НЕ” |
запит1 * запит1 |
Встановлення відстані між словами |
~запит |
Пошук синонімічних одиниць |
число1..число2 |
Пошук числових значень у заданому проміжку |
allintitle:запит |
Пошук усіх слів в заголовку |
intitle:запит |
Пошук у заголовку сторінки |
allintext:запит |
Пошук усіх слів запиту у тексті веб-сторінки |
intext:запит |
Пошук у тексті сторінки |
inurl:запит |
Пошук в URL-адресі |
site:URL |
Пошук проіндексованих сторінок вказаного веб-сайту |
link:URL |
Пошук сторінок, які мають посилання на головну сторінку зазначеного ресурсу (зворотні посилання) |
filetype:розширення |
Пошук результатів у заданому форматі файла |
related:URL |
Пошук повязаних однотипних сторінок |
Розглянемо деякі оператори та їхній синтаксис детальніше.
Google інтерпретує слова, які записані у стрічці пошуку через пробіл, як окремі слова. Тому, якщо запит1 і запит2 складаються з одного слова, то пошукова система інтерпретує їх так: “і запит1 і запит2”. Тобто, можна сказати, що пошукова система завжди використовує цей оператор за змовчанням, якщо у стрічці пошуку є більше ніж одне слово.
Можливість вказувати синоніми або альтернативні форми дає оператор OR (записаний літерами верхнього регістру!) чи | (вертикальна риска).
Оператор OR, для якого також можна використовувати | (вертикальну риску), відноситься до пошукових термінів, які безпосередньо прилягають до нього:
Львів OR Тернопіль
Львів | Тернопіль
У першому і другому прикладах пошукова система знайде сторінки, які містять або “Львів” або “Тернопіль” або обидві умови, але не сторінки, які не містять ні “Львів”, ні “Тернопіль”.
Львів OR Тернопіль OR Хмельницький
Львів | Тернопіль | Хмельницький
У третьому і четвертому прикладах будуть знайдені сторінки, що містять одне, два або всі три слова “Львів”, “Тернопіль” і “Хмельницький”.
Примітка: Якщо оператор написати з малої літери, Google інтерпретує його як слово для пошуку, а не як оператор.
Примітка: На відміну від OR, | (вертикальна риска) не повинна бути оточена пробілами.
Для групування складних слів і фраз, використовуються лапки (“”) або дужки (), залежно від того, чи здійснюється пошук точної фрази чи лише групи слів.
(Львівська кав'ярня) OR (Тернопільська площа)
"Львівська кав'ярня" OR "Тернопільське озеро".
Символ зірочки (*), відомої також як “шаблон”, використовується, щоб замінити одне або декілька слів у фразі (укладеній в лапки). Кожен символ * представляє лише одне або декілька слів. Google розглядає * в якості заповнювача для одного або декількох слів. Наприклад, запит у формі ["Природа - це * яку * серцем"] говорить Google, щоб знайти сторінки, що містять фразу, яка починається з "Природа - це", а потім одне або декілька слів, тоді слово “яку”, а тоді "серцем". Фразами, які відповідають усім цим вимогам є:
Символ “-” усуває з результатів пошуку сторінки, які містять термін або фразу, перед яким стоїть цей знак. Для того, щоб усунути з результатів пошуку певний термін, необхідно перед цим терміном поставити знак “-“. Не слід ставити пробіл між символом та терміном. Якщо термін складний або складається з кількох слів, то його треба взяти в лапки.
Тильда (~) це оператор, який дозволяє знайти синоніми до слова, якому передує символ (~).
Оператор (~) бере слово, яке стоїть безпосередньо після нього, і шукає для цього конкретного слова його синоніми. Він також шукає терміни з альтернативними закінченнями. Оператор тильда працює найкраще, коли застосовується до загальних термінів та термінів з багатьма синонімами. Як і оператор (-), ~ (тильда) не відокремлюється пробілом від слова, для якого здійснюється пошук.
Для того, щоб знайти сторінки, на яких містяться числа з певного діапазону, використовується оператор (..). Для цього необхідно вказати два числа межі діапазону, між ними застосувати оператор (..).
Наприклад:
intitle:запит
Ці два оператори подібні за своєю функцією вони виконують пошук лише у заголовку обєкта, пошук якого здійснюється. Однак, ці оператори по-різному використовують складові запиту, які стоять безпосередньо після нього.
Якщо запит формується з оператором allintitle, наприклад [allintitle: університет ECTS], то пошукова система здійснюватиме пошук у заголовку сторінки абсолютно всіх слів (у цьому випадку обох), які є у стрічці пошуку (або всіх до наступного оператора).
Якщо запит формується з оператором intitle, наприклад [intitle: університет ECTS], то пошукова система здійснюватиме пошук у заголовку сторінки лише слова “університет”, а слово “ECTS” шукатиме будь-де на сторінці.
Таким чином, [allintitle: університет ECTS] = [intitle: університет intitle: ECTS]
intext:запит
Так само, як і у попередньому випадку, ці два оператори подібні за своєю функцією вони виконують пошук у тексті обєкта, пошук якого здійснюється. Однак, ці оператори по-різному використовують складові запиту, які стоять безпосередньо після нього.
Наприклад:
Оператор inurl виконує пошук у межах URL-адреси веб-сайту. Наприклад, такий оператор використовується тоді, коли необхідно знайти офіційні портали і веб-сайти українських міст. Можна припустити, що сайт міста може містити в адресі складову “misto”. Тоді, для відбору всіх сторінок, в адресі яких є така складова, використовується оператор inurl:
Наприклад: [inurl:misto]
Оператор site використовується для пошуку всіх існуючих сторінок заданого веб-сайту, або для пошуку конкретної інформації в межах заданого сайту. Наприклад, щоб дізнатися, скільки сторінок належить до офіційного веб-сайту львівської політехніки, достатньо ввести запит [site:lp.edu.ua].
Складний запит, наприклад [site:lp.edu.ua intitle:інститут] дозволить виявити, які сторінки веб-сайту Львівської політехніки містять у заголовку слово “інститут”.
Оператор link дозволяє здійснити пошук тих сторінок, які містять посилання на головну сторінку веб-сайту, URL-адреса якого введена у запиті.
Наприклад, для того, щоб дізнатися, хто посилається на сторінку Вашого веб-сайту, тобто перевірити зворотні посилання, достатньо сформувати запит такого вигляду: [link:misto.ridne.net].
Оператор filetype дозволяє обмежити формат файлів у результатах пошуку. Сьогодні доступні такі формати файлів:
Наприклад, пошук реферату про картографічні сервіси у форматі PDF або DOC: [allintext: реферат картографічний сервіс filetype:doc OR filetype:pdf].
Хід роботи
Завдання 1:
Таблиця 1.
Запропоноване вирішення пошукового завдання
№ |
Формулювання мети пошуку |
Структура запиту |
Отриманий результат |
Порядковий номер студента у списку підгрупи |
Назва міністерства |
Офіційний веб-сайт |
|
Міністерство соціальної політики України |
www.mlsp.gov.ua |
|
Міністерство юстиції України |
www.minjust.gov.ua |
|
Міністерство оборони України |
www.mil.gov.ua |
|
Міністерство освіти і науки України |
www.mon.gov.ua |
|
Міністерство фінансів України |
www.minfin.gov.ua |
|
Міністерство економічного розвитку і торгівлі України |
www.me.gov.ua |
|
Міністерство культури України |
mincult.kmu.gov.ua |
|
Міністерство екології та природних ресурсів України |
www.menr.gov.ua |
|
Міністерство інфраструктури України |
www.mtu.gov.ua |
|
Міністерство охорони здоров'я України |
www.moz.gov.ua |
|
Міністерство закордонних справ України |
www.mfa.gov.ua |
|
Міністерство з питань надзвичайних ситуацій |
www.mns.gov.ua |
|
Міністерство енергетики та вугільної промисловості України |
mpe.kmu.gov.ua |
|
Міністерство внутрішніх справ України |
mvs.gov.ua |
|
Міністерство аграрної політики України |
minagro.gov.ua |
Завдання 2:
Порядковий номер студента у списку підгрупи |
Назва міста |
|
Ужгород |
|
Мукачево |
|
Івано-Франківськ |
|
Чернівці |
|
Луцьк |
|
Тернопіль |
|
Вінниця |
|
Донецьк |
|
Сімферополь |
|
Харків |
|
Запоріжжя |
|
Кіровоград |
|
Луганськ |
|
Ялта |
|
Черкаси |
Завдання 3:
СТРУКТУРА ТА ОФОРМЛЕННЯ ЗВІТУ ДО ЛАБОРАТОРНої РОБоти
Звіт з лабораторної роботи оформлюється на аркушах формату A4, які заповнюються з однієї сторони. Текст повинен бути рукописним або друкованим на принтері. Використання кольорових чорнил дозволяється лише для ілюстративних матеріалів.
Звіт до лабораторної роботи формується відповідно до змісту і повинен містити такі розділи:
Звіт зшивається з лівої сторони листів формату A4. Титульна сторінка звіту обовязково друкується на принтері.