Поисковые алгоритмы Google

Поисковые алгоритмы Google

Интерфейс Google поражает своей простотой: поле для ввода и две кнопки. Как говорится, все гениальное просто.





Прежде чем перейти к рассмотрению базового синтаксиса Google, поговорим о типах поисковых машин.

    Существуют два основных алгоритма поиска в Интернете:
  • поиск по предметному указателю (в англоязычной литературе называется «searchable subject index»);
  • поиск по всему тексту (full-text search).
Первый алгоритм довольно ограничен в своих возможностях, поскольку производит поиск введенных пользователем ключевых слов в заголовках описаниях сайтов. При поиске по всему тексту открываются огромные возможности: поисковые машины, использующие такой алгоритм, выполняют поиск не только в заголовках и описаниях, но и по всему тексту страниц. Сами понимаете, что во втором случае вероятность найти нужную информацию во много раз выше (примером поисковой машины первого типа может послужить Yahoo!). Поисковая машина Google использует поиск по всему тексту, поэтому в дальнейшем при рассмотрении различных примеров поисков мы будем ориентироваться только на поиск но всему тексту.

Примечание. Поиск по всему тексту возможен благодаря использованию роботов-пауков, которые периодически просматривают веб-страницы и индексируют их.

Предположим, что вы передали поисковой машине два слова «BMW» и «E39». Как поисковая машина должна отреагировать на эти ключевые слова? Будет ли она искать в тексте страниц оба слова или отдельно каждое слово? В первом случае поисковая машина возвратит ссылки страниц, в которых встречаются оба слова. Во втором случае вы можете получить страницы только со словом BMW, но в которых нет слова Е39, и страницы со словом Е39 без BMW. Говоря языком логики, в первом случае будет использован логический оператор AND (И), а во втором — OR (ИЛИ).

Поисковая машина Google по умолчанию использует оператор AND (И). То есть, если вы ищите BMW Е34 Е39, Google возвратит страницы, которые содержат все три текстовые константы: BMW и Е34 и Е39. Если вы хотите найти страницы, просто содержащие BMW, Е34, Е39 (не обязательно, чтобы все эти константы были на одной странице), тогда вам нужно использовать оператор OR (ИЛИ): BMW OR Е34 OR Е39

Вместо оператора OR можно указывать вертикальную черту — символ оператора OR в программировании:

BMW | Е34 | Е39

Еще один пример: вам нужно найти страницы, которые содержат BMW и страницы, которые содержат только Е34 и только Е39. Делается это очень просто: BMW (Е34 | Е39)

Оператор AND используется по умолчанию, поэтому перед скобками его можно не указывать. Только не забудьте указать сами скобки, а то результат будет несколько другим.

Если вы хотите исключить какую-то константу из результатов, используйте оператор N0, который записывается в виде знака «минус»: BMW Е34 — Е39

В этом случае вы получите страницы, на которых будут оба слова BMW Е34, но однозначно не будет Е39.

Нужно отметить, что движок Google (т.е. система управления содержимым сайта) игнорирует регистр синтаксиса. Если вы ищите «BMW», найдете также и «bmw», «Bmw» и «BMW». Другие поисковые машины зависят от регистра, поэтому при поиске «BMW» они возвращают только страницы, в которых слово «BMW» написано именно в таком регистре.

Предположим, что мы ищем фразу «Президент Украины». Если мы просто введем в Google эти два слова: Президент Украины, то по умолчанию между ними будет использоваться оператор AND, и Google возвратит нам все страницы, содержащие слова «Президент» и «Украины». Если же нам нужно найти фразу, чтобы слова следовали именно в указаной последовательности, их нужно заключить в кавычки: «Президент Украины»

Google не поддерживает маски (wildcards), т.е. вы не можете использовать символы * и ? для замены символов в искомом слове. Зато Google принимает символ * как отдельное подстановочное слово. Например, и поиске «Иванов * Иванович» вы найдете Иванов Александр Иванович, Иванов Иван Иванович, Иванов Сергей Иванович и т.д.

Следует также сказать и об ограничениях: Google не воспринимает более 10 ключевых слов (в том числе и специальный синтаксис). Правда, это ограничение можно обойти, но об этом чуть позже.

В заключении этого пункта поговорим о кнопке Мне повезет. Введите слово bmw и щелкните на кнопке Мне повезет. В отличие от кнопки Поиск в Google, когда Google возвратит вам список всех страниц, где встречается это слово, при щелчке по кнопке Мне повезет Google попытается угадать «основной сайт» для этого слова и перенаправит вас на сайт www.bmw.com.





Вы так же можете ознакомиться с другими статьями главы Поиск информации в сети Интернет:
  • Проблемы поиска в интернете, поисковые машины
  • Эффективность поиска
  • Как правильно искать информацию
  • Поисковые системы интернета
  • Типы поисковых систем
  • Краткая история Google
  • Специальный (расширенный) синтаксис Google
  • Модификатор inurl в Google
  • Язык поисковых запросов Google
  • Поисковые запросы в Google
  • Расширенный поиск Google
  • Установка свойств поиска Google в Cookies браузера
  • Результат поиска Google
  • Google поиск по картинкам
  • Службы Google
  • Электронная почта Google
  • Поисковая система Рамблер (Rambler)
  • Как работал поиск Рамблер
  • Рамблер запросы, синтаксис Рамблера
  • Поисковая система Yandex (Яndex)
  • Языковой поиск Яндекс
  • Синтаксис Яндекса
  • Синтаксис запросов Яндекс
  • Операторы поиска Яндекс
  • Дополнительные возможности поиска Яндекс
Удачи Вам! До скорых встреч на страницах сайта RusOpen.com

Опубликовано: 04.04.2015