Поиск информации в сети Internet
Урок 7.
Проблема поиска и поисковые системы
- Поиск по ключевым словам
- Советы при поиске в системе Яндекс
- Синтаксис языка запросов
- Поиск по каталогам
7.4. Синтаксис языка запросов
В системе Яндекс существует специальный язык запросов,
использовать который более сложно, чем форму расширенного поиска но при
его использовании можно получить наилучший результат.
Поисковый запрос вводится в поисковое поле, он может содержать ключевые слова и
специальные символы, позволяющие установить
взаимосвязи между этими словами и ввести дополнительные параметры.
Большинство этих символов представлено в следующей таблице.
Синтаксис языка запросов системы Яндекс.
Символ
|
Назначение
|
Пример
|
" " |
поиск фразы |
"красная
шапочка" (эквивалентно красная /+1 шапочка) |
+ |
обязательное
наличие слова в найденном документе |
+быть или +не
быть |
~~ или - |
не должно быть
слова в пределах документа (И НЕ) |
путеводитель по
парижу ~~ (агентство | тур) |
~ |
не должно быть
слова в пределах предложения (И НЕ) |
банки ~ закон |
! |
искать только
указанную форму слова |
!Путин |
пробел
или & |
логическое И (в
пределах предложения) |
фабрика звезд |
&& |
логическое И (в
пределах документа) |
музыка &&
(фабрика звезд) |
| |
логическое ИЛИ |
рисунок |
картинка | фото | коллаж |
/(n m) |
расстояние между
словами (-назад +вперед) |
поставщики /2
кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов |
&&/(n m) |
расстояние в
предложениях (-назад +вперед) |
банк && /1
налоги |
( ) |
группировка слов |
(технология |
изготовление) (сыра | творога) |
Основные положения языка запросов:
- Если ключевые слова являются устойчивым
словосочетанием или единой фразой, то заключите их в кавычки.
- Если слова не объединены кавычками, то каждое слово
будет само по себе и перед каждым их них можно поставить знак плюс «+», если
слово обязательно должно быть в найденных документах, минус «-», если слово
не должно быть в найденных документах (пробел ставится перед знаком, но не
после). Если перед словом поставить знак ~ (тильда), то этого слова не
должно быть в пределах предложения в совокупности с рядом стоящим в запросе
словом. Примечание: по умолчанию будут найдены и те документы, которые
удовлетворяют хотя бы одному из ключевых слов. Такие ссылки будут иметь
низкую ревалентность и будут находиться в конце результатов запроса.
- Независимо от того, в какой форме вы употребили слово
в запросе, Яндекс учитывает все формы этого слова по правилам русского
языка. Чтобы этого не происходило, поставьте знак восклицания перед
неизменяемым словом.
- Все слова, написанные через пробел или знак &
(логическое И) должны одновременно находиться в найденных документах в
пределах предложения. Все слова, написанные через && должны одновременно
находиться в найденных документах, но расстояние между ними не
оговаривается.
- Слова, написанные через символ | (логическое ИЛИ)
являются заменяющими друг друга (синонимами), и будут найдены документы,
удовлетворяющие хотя бы одному из этих слов.
- Можно указать расстояние между словами. Если
пронумеровать слова в предложении, то расстояние между словами – это
разность номеров слов. Например, если между двумя словами может находиться
только одно слово, то расстояние между ними равно 2 (3 минус 1). Число
указывается после знака /, например региональный /2 центр. В
этом случае будут найдены документы, в которых эти слова находятся либо
вместе, либо между ними есть еще одно слово. Запись /2 эквивалентна записи
/(-2 +2), в такой форме можно указать максимальное и минимальное количество
слов, например, от 3 до 5 записывается /(3 5). Минус и плюс указывают на
порядок слов: минус – обратный порядок. Если перед символом / указать &&, то
расстояние будет вычисляться в предложениях.
- Для группировки отдельных частей запроса используйте круглые скобки.
Поиск в зонах и элементах web-страницы.
Web-страница состоит из определенных зон и элементов.
Соответственно можно осуществлять поиск в зонах и в элементах. Например, для
поиска в заголовке страницы (заголовок отображается в заголовке окна
обозревателя) указывают: $title (выражение), поиск в тексте
ссылок аналогичен (см. следующую таблицу), а общий синтаксис таков:
$имя_зоны (выражение)
Примечание: выражение может быть представлено как одним ключевым словом, так
и несколькими словами, объединенными указанными выше знаками логических
операций.
Для
поиска в элементах используется синтаксис:
#имя_элемента=(выражение)
Элементы отличаются от зон тем, что в большинстве своем не видны
пользователю, просматривающему страницу. Так, например, ключевые слова
указываются в невидимом заголовке Web-страницы и не выводятся в
обозревателе. Их можно увидеть только выполнив Вид
® В виде HTML.
Большинство документов имеют описание (abstract), которое также не выводится
на страницу. Подписи рисунков видны только в том случае, если загрузка
рисунков отключена, либо если навести мышь на рисунок, то подпись появится в
виде подсказки.
Синтаксис поиска в элементах и зонах.
Синтаксис
|
Назначение
|
Пример
|
$title
(выражение) |
поиск в
заголовке |
$title (Яндекс) |
$anchor
(выражение) |
поиск в тексте
ссылок |
$anchor (Яндекс
| Апорт) |
#keywords=(выражение) |
поиск в ключевых
словах |
#keywords=(поисковая система) |
#abstract=(выражение) |
поиск в описании |
#abstract=(искалка | поиск) |
#image="значение" |
поиск файла
изображения |
#image="tort*" |
#hint=(выражение) |
поиск в подписях
к изображениям |
#hint=(lenin |
ленин) |
#url="значение" |
поиск на
заданном сайте (странице) |
#url="www.comptek.ru*" |
#link="значение" |
поиск ссылок на
заданный URL |
#link="www.yandex.ru*" |
#mime="значение" |
поиск в
документах данного (pdf или rtf) типа |
#mime="pdf" |
Сортировка результатов запроса.
После
того, как поисковая система выберет страницы, удовлетворяющие запросу, она
сортирует ссылки на эти страницы в порядке убывания их ревалентности.
Ревалентность – это степень соответствия содержания документа поисковому
запросу. Релевантность документа зависит от ряда факторов, в том числе от
частотных характеристик искомых слов, веса слова или выражения, близости
искомых слов в тексте документа друг к другу и т.д.
Пользователь может повлиять на порядок сортировки, используя операторы
веса и уточнения запроса.
Вес указывается для того, чтобы увеличить ревалентность
документов, содержащих слово или выражение, вес которого указан.
Синтаксис: слово:число или (поисковое_выражение):число
Чем
больший вес указан у слова (или выражения), тем выше ревалентность
документов его содержащих.
Например, по запросу родина Путина:5 в результатах поиска
наверху списка окажутся документы, где чаще встречается именно слово Путин.
Уточняющее слово или выражение применяется для того, чтобы увеличить
релеватность документов, их cодержащих.
Синтаксис: <- слово или <- (уточняющее_выражение)
Например, по запросу телефон <- автоответчик будут найдены все
документы, содержащие слово телефон, но первыми будут выданы
страницы, содержащие слово автоответчик.
Примечание: кроме сортировки по ревалентности Вы можете выбрать
сортировку по дате документов, щелкнув по соответствующей ссылке.