Понимание поисковых запросов
Мы говорили о сотнях миллионов различных запросов, которые ежедневно вводятся в поисковую строку на портале Google, как о важном окне в души людей. Использование Google этого потока человеческих мыслей, к счастью, «Не вред». Поисковая система использует данное окно, чтобы лучше понять потребности своих пользователей и усовершенствовать их доступ к той части мировой информации, которая уже упорядочена компанией. Иногда сделать это относительно просто (если цель поиска ясна и однозначна), а иногда - гораздо сложнее, и поисковая система Google вынуждена усерднее работать, чтобы предъявить пользователям результаты поиска, которые, по ее мнению, отвечают их потребностям.
Внимательно изучив пример нечеткого поискового запроса, мы поймем, какие усилия приходится прилагать поисковой системе Google, чтобы определить, что именно нужно пользователю. Даже в случае такого простого поискового запроса, как английское слово «apple» {англ. «яблоко»), Google не в полной мере ясны потребности пользователя, поскольку у этого слова может быть несколько возможных значений в контексте мировой информации. Поисковая система должна сделать несколько предварительных заключений, чтобы прояснить эту неопределенность, определив возможную взаимосвязь искомого слова с другой информацией, которая, возможно, отвечает потребностям пользователя. На одном уровне Google может применить описанную в предыдущем разделе модель индексации, чтобы сравнить внесенную в ее индекс информацию, связанную со словом «apple», и предложить набор URL-адресов, которые, по ее оценке, являются полезными. Однако по мере увеличения количества данных одной этой техники становится недостаточно, поскольку может оказаться, что информация, которую поисковая система уже индексировала, искажается из-за объема и кажущейся полезности, не отражая базовую потребность пользователя.
Подобное возможное искажение, в частности, становится очевидным в примере со словом «apple», поскольку в преобладающей части задокументированной истории человечества данное слово, в первую очередь, обозначало фрукт яблони садовой. Однако в течение последних 30 лет, которые точно совпадают с зарождением и развитием компьютеризированного поиска информации, слово «apple» приобрело очень распространенное второе значение - название торговой марки крупного производителя компьютерной техники и электроники. И в Интернете в начале XXI века второе значение практически возобладало над исходным. Это особенно очевидно при сравнении поисковых запросов на единственное и множественное число слова «apple» в Google.
Чтобы постараться компенсировать такое неравномерное распределение уже упорядоченной Google информации, система в дополнение к проведенной ранее оценке полезности делает выводы, анализируя поток поисковых запросов. Для этого Google ищет другие слова, которые могут появляться рядом со словом «apple», когда в качестве поискового запроса выступает словосочетание. Среди этих данных она находит очень широкий диапазон поисковых запросов, включая «apple ipod», «компьютеры apple», «apple records» (звукозаписывающий лейбл), «apple pie recipe» (рецепт яблочного пирога) и «fiona apple» (Фиона Эппл, певица, композитор), но эти поисковые запросы очень отличаются по частоте своего появления. Поисковая система Google может уточнить возможную цель пользователя, обратившись к своим оценкам наиболее полезных URL-адресов, внесенных в ее индекс для слова «apple», и предположить, что данный пользователь преследует ту или иную цель, проанализировав частоту появления запросов.
Чем чаще пользователи делают поисковой запрос «apple ipod» по сравнению с другими сочетаниями со словом «apple» (например, «apple records»), тем выше вероятность, что человек, который сделал поисковый запрос «apple», хочет найти производителя устройства iPod, а вовсе не основанную группой Beatles звукозаписывающую компанию или фрукт. Для уточнения вероятной цели пользователя проводится тщательный анализ дополнительных условий поиска. Таким же трудоемким является и процесс определения этой цели, когда в поисковом запросе присутствуют те же самые слова, только в другом порядке; например, «пес укусил человека» значит не то же самое, что «человек укусил пса», точно так же «apple records» и «recording on an apple mac» (запись на apple mac) - это не одно и то же. Несмотря на весь этот анализ, Google пока продолжает играть в «угадывание», поскольку не может знать намерений пользователя, и даже при выдаче наилучших результатов в ответ на поисковый запрос «apple» все еще останется масса людей, которые искали информацию о фрукте, но не нашли ее.
В ответ на эти трудности поисковая система Google в своей оценке вероятности продвинулась на шаг вперед. Ничто так четко не указывает ей на цель пользователя, как действия этого пользователя. Здесь мы возвращаемся к «мудрости толпы» - «голосованию» за страницу с контентом, осуществляемому путем размещения ссылки в Интернете. Также существует море других действий и вариантов поведения, которые поисковая система Google может проанализировать, чтобы понять вероятную цель. Она «смотрит» на то, что делают пользователи после вывода первоначальных результатов поиска - первого набора из десяти ранжированных ссылок.
Запомните: поисковая система Google фанатично стремится к достижению релевантности своих результатов и к тому, чтобы пользователи были довольны, поэтому Google очень тщательно анализирует три основных действия, выполняемых после получения подборки результатов: по какому именно результату щелкает пользователь; сколько времени прошло, прежде чем пользователь щелкнул по следующему результату; и как в результате были изменены условия поиска. Временно отложим данный вопрос и посмотрим, что поисковая система Google узнает из этого анализа.
1. Система знает, по какому результату щелкает пользователь, перенаправляя каждый щелчок со страницы с результатами поиска через отслеживающий механизм. Выбор одного из результатов фиксируется в простой форме «голоса», отданного за URL-адрес, по которому щелкнул пользователь, а это позволяет улучшить оценку полезности данного URL-адреса в качестве ответа на запрос поиска соответствующего слова или фразы. Таким образом, щелчок по результату www. apple.com увеличивает шансы этого URL-адреса подняться в рейтинге при последующих поисковых запросах со словом «apple».
2. Поисковая система Google предполагает, что если щелчок по другому результату из этого же набора произошел достаточно быстро после щелчка по предыдущему результату, это приравнивается к «голосу», отданному против первой посещенной страницы. Такое предположение строится на том, что данная страница оказалась бесполезной для пользователя, вопреки первоначальному ожиданию Google. Щелчок по результату, соответствующему домашней странице компании Apple Records, сразу же после которого последовал щелчок по результату из той же подборки, но уже соответствующему странице под названием «How Apple Records Music» («Как Apple записывает музыку»), в глазах Google представит сайт компании Apple Records менее полезным для пользователей, которых интересует поисковый запрос «Apple Records».
3. Поисковая система Google тщательно отслеживает, как корректируется поисковый запрос: какие слова добавляются или исключаются из первоначального варианта запроса. Google применяет эти коррективы, чтобы понять взаимоотношения между словами и их возможные оттенки смысла. Если изменение заключается в добавлении слова «crumble» (особый вид пирога) к слову «apple», то в глазах поисковой системы Google цель первоначального поиска слова «apple» смещается в сторону рецептов из этого фрукта и отходит от названия фирмы.
Посещения и изменения, которые совершает отдельный пользователь, не окажут ощутимого влияния на то, как поисковая система Google оценивает полезность, но когда принимается в расчет ежедневный объем таких действий в отношении сайтов, найденных Google, отражается еще один аспект понятия «мудрость толпы», который может пригодиться поисковой системе. Ежедневное пользование поисковой системы подразумевает постоянный поток «голосований» и изменений, который чрезвычайно важен для Google и ее извечной задачи предоставления полезных результатов в ответ на наши поисковые запросы.
На базовом уровне миссия поисковой системы Google заключается в том, чтобы предоставить людям ответы на их потребности. Конечно, точного выражения этих потребностей, насколько Google может понять их из вводимых символов и слов, часто достаточно для полного ответа. Однако по мере увеличения объема информации в Интернете и расширения диапазона человеческих потребностей лежащее в основе данной поисковой системы программное обеспечение стремится к лучшему пониманию и более точным корректировкам.