Каталоги: легальной музыки для прослушивания — http://musiс. yandex.ru; веб-сайтов с сортировкой по индексу цитирования (имеется возможность платной регистрации) — http://yaсa.yandex.ru.
Новости: главные новости дня, полученные из основных СМИ, представленных в Интернете, с возможностью поиска по новостям, а также подписки на новости по заданному поисковому запросу — http://news.yandex.ru.
Услуги: сравнение вкладов, потребительских кредитов, автокредитов, ипотеки — http://uslugi.yandex.ru.
Погода: http://pogoda.yandex.ru.
Телепрограмма: http://tv.yandex.ru.
Время: http://time.yandex.ru.
Словари: http://slovari.yandex.ru.
Перевод: http://translate.yandex.ru.
Карты: карты мира и России, карты крупных городов РФ (с точностью до дома), поиск по карте, информация о пробках, прокладка маршрутов и панорамы улиц — http://maps.yandex.ru.
Расписания: поездов, самолетов и пригородных электричек — http://rasp.yandex.ru.
Самолетики: онлайн-сервис, позволяющий отслеживать расчетное местоположение любого самолета в реальном времени — http://rasp.yandex.ru.
Паровозики: онлайн-сервис, позволяющий отслеживать расчетное местоположение любого поезда в реальном времени — http://rasp.yandex.ru.
Метрика: измерение трафика, анализ поведения пользователей и оценка эффективности рекламных кампаний — http://metrika.yandex.ru.
Директ: система размещения контекстной рекламы с оплатой по кликам — http://direсt.yandex.ru.
Рекламная сеть: система, позволяющая владельцам сайтов зарабатывать, размещая блоки «Яндекс. Директа» на своих сайтах — http://partner.yandex.ru.
Почта: http://mail.yandex.ru, http://Я. ру.
Блоговый сервис: http://my.ya.ru.
«Мой Круг»: социальная сеть — http://moikrug.ru.
Фотки: бесплатный фотохостинг — http://fotki.yandex.ru.
Народ: бесплатный хостинг персональных веб-страниц, а также служба хранения файлов — http://narod.yandex.ru.
Диск: сервис для хранения файлов и работы с ними на любом устройстве, подключенном к Интернету, — http://disk.yandex.ru.
Народная карта: сервис, предоставляющий пользователям возможность самим нарисовать схематическую карту знакомой местности, расставить POI (точки интереса) — http://n.maps.yandex.ru.
Дзен: медитативный поиск (на основе запросов пользователей к «Яндексу» в реальном времени) — http://сompany.yandex.ru/researсhes/interes.
Поиск «Яндекса» позволяет искать документы на русском, татарском, украинском, белорусском, казахском, турецком, английском, немецком и французском языках с учетом морфологии этих языков и близости слов в предложении.
Индексирование: помимо веб-страниц в формате HTML, «Яндекс» индексирует документы в форматах PDF (Adobe Aсrobat), Riсh Text Format (RTF), двоичных форматах Word (.doс), Exсel (.xls), PowerPoint (.ppt), RSS (блоги и форумы).
Поиск и сервисы поддерживаются в России, Украине, Беларуси, Казахстане, Турции.
Самый узнаваемый рекламный слоган: «Найдется все».
Все о компании: http://company.yandex.ru, http://yandex-team.ru.
Понятийный словарь
Антиспам поисковый — набор алгоритмов, позволяющих отделить спам от качественных веб-страниц. С помощью алгоритмов антиспама «Яндекс» проверяет все сайты, которые индексирует. А уже проиндексированные страницы регулярно перепроверяет, чтобы убедиться, что на них не появился спам. Страницы, содержащие спам, могут быть понижены при ранжировании или исключены из поиска. Об этом говорится в лицензии на использование поисковой системы «Яндекс».
Архитектура продукта — структура программы или вычислительной системы, которая включает программные компоненты, видимые снаружи свойства этих компонентов, а также отношения между ними.
Асессоры — специалисты, оценивающие релевантность страницы тому запросу, по которому она была представлена в результатах поиска; основная задача асессора — улучшение качества выдачи; асессоры, оценивая сайт, смотрят и на его содержание, и на раскрытие тематики, и на удобство использования ресурса; асессоры не только оценивают релевантность документа запросу, но и помогают настраивать алгоритмы поисковой системы.
Бета-тестирование — распространение новой версии (бета-версии) продукта или сервиса, платформы среди ограниченного числа пользователей.
Браузер — программное обеспечение для просмотра сайтов, то есть для запроса веб-страниц (преимущественно из Сети), их обработки, вывода и перехода от одной страницы к другой.
Движок — выделенная часть программного кода для реализации конкретной прикладной задачи — программа, часть программы, комплекс программ или библиотека, в зависимости от задачи и реализации. Использование готового движка при разработке программы, сайта или другого продукта сокращает время разработки, позволяет уделить больше времени разработке других подсистем.
Дистрибутив (дистрибутивная копия) — копия программного продукта, предназначенная для распространения (бесплатного или платного) и установки пользователем. В большинстве случаев — установочная архивированная версия программного продукта.
Детектировать (от англ. detect) — замечать, открывать, обнаруживать, раскрывать.
Интерфейс — часть программы, взаимодействующая с пользователем, посредством него приложение получает доступ к операционной системе и другим сервисам.
Код — написанный человеком текст компьютерной программы на каком-либо языке программирования.
Колдунщики — информационные блоки в результатах поиска с ответами от сервисов «Яндекса».
«Матрикснет» (MatrixNet) — метод машинного обучения, с помощью которого строится формула ранжирования поиска «Яндекса», которую теперь можно настраивать отдельно для достаточно узких классов запросов. Например, локализовать поиск для региональных пользователей.
Машинное обучение — попытка научить компьютер решать задачи, которые легко даются человеку, но формализовать путь их решения сложно. В результате машинного обучения компьютер может демонстрировать поведение, которое в него не было явно заложено.
Морфология (от греч. morhpe — форма, logos — учение) — изучает слова как части речи с точки зрения их грамматических свойств, это наука о правилах словоизменения и словообразования. Основа морфологии: корень, суффикс, приставка, окончание (или флексия — самая большая головная боль разработчиков русскоязычных поисковиков), которое способно меняться в зависимости от рода, числа и падежа. Морфология русского языка еще в 1970-х гг. была исчерпывающе описана Андреем Анатольевичем Зализняком, будущим академиком Российской академии наук. Результатом этого научного прорыва стали базовые труды для русской морфологии — «Русское именное словоизменение» (1967) и особенно «Грамматический словарь русского языка» (1977), в котором для 100 000 слов русского языка указана точная модель словоизменения и предложена классификация самих этих моделей. Этот словарь стал основой для разработки компьютерных программ автоматического морфологического анализа, в том числе в информационном поиске, в машинном переводе. Именно этот труд лег в основу алгоритма поиска «Яндекса» и других поисковиков, основанного на морфологическом принципе опознавания слов.
Омонимия — совпадение слов (словоформ) с разным лексическим значением.
Паук (робот-паук) — регулярно обходит документы по заданному маршруту; если сайт на месте, то есть работает и доступен, паук выкачивает запланированные в маршруте документы. Он определяет тип скачанного документа (.html, pdf, swf и т. п.), кодировку и язык, а затем отправляет данные в хранилище.
Псевдооптимизация — попытка обмана поисковой системы и манипулирования ее результатами с целью завышения позиции сайтов (страниц) в результатах поиска; использование SEO-ссылок, которые на коммерческой основе размещаются на сторонних ресурсах (количество ссылок на страницу и их текст учитываются при ранжировании). Спрос на SEO-ссылки стимулирует наводнение Интернета сотнями тысяч бесполезных сайтов, забитых заимствованным или бессмысленным контентом.
Поиск — состоит из двух больших частей: первая — когда поисковик ищет различные документы в Интернете и составляет поисковый индекс; вторая — когда ищется ответ на конкретный запрос пользователя в уже подготовленной поисковой базе. Пользовательские запросы сначала попадают в компьютерную систему «метапоиск», который обрабатывает каждый запрос в реальном времени — выясняет все необходимые данные про запрос (из какого региона он был задан, к какому классу относится и т. п.), проводит лингвистическую обработку; затем метапоиск проверяет, формировались ли в последнее время результаты поиска для этого запроса, потому что результаты поиска по часто задаваемым запросам некоторое время хранятся в памяти метапоиска, а не формируются каждый раз заново; если вновь пришедший запрос оказался популярным, метапоиск покажет пользователю заранее сохраненные результаты. Если же ответа в памяти нет, то метапоиск передает запрос на сервера другой компьютерной системы — «базового поиска». На базовом поиске хранится слепок Интернета, по которому ищет «Яндекс», — поисковая база. Она разбита на части, которые хранятся на разных серверах — искать ответ одновременно по нескольким частям базы данных быстрее, чем по всей базе целиком. Кроме того, у каждого сервера есть несколько копий. Это позволяет распределять нагрузку и не терять данные — если один из серверов не сможет своевременно ответить, информация все равно найдется на дублирующих серверах. Из тысяч серверов базового поиска метапоиск выбирает наименее загруженные — таким образом, чтобы вместе они содержали целую поисковую базу. Каждый из серверов отдает список документов, в которых есть слова из запроса, обратно в метапоиск. Там они объединяются, ранжируются с помощью технологии «Матрикснет» и попадают на страницу результатов поиска. Благодаря такой организации поиска «Яндекс» может отвечать пользователю за доли секунды.
