бесплатно рефераты
 

Яндекс - основные сведения по популярному индексу

Яндекс - основные сведения по популярному индексу

Введение

История компании "Яндекс" началась в 1990 году с разработки поискового

программного обеспечения в компании "Аркадия". За два года работ были

созданы две информационно-поисковые системы - Международная Классификация

Изобретений, 4 и 5 редакция, а также Классификатор Товаров и Услуг. Обе

системы работали под DOS и позволяли проводить поиск, выбирая слова из

заданного словаря, с использованием стандартных логических операторов.

В 1993 году "Аркадия" стала подразделением компании CompTek. В 1993-1994

годы программные технологии были существенно усовершенствованы благодаря

сотрудничеству с лабораторией Ю. Д. Апресяна (Институт Проблем Передачи

Информации РАН). В частности, словарь, обеспечивающий поиск с учетом

морфологии русского языка, занимал всего 300Кб, то есть целиком грузился в

оперативную память и работал очень быстро. С этого момента пользователь мог

задавать в запросе любые формы слов.

На основе новой технологии в 1994 году был создан "Библейский компьютерный

справочник" (информационно-поисковая система, обеспечивающая работу с

Синодальным переводом Ветхого и Нового Заветов). В 1995 году стартовал

проект "Академическое издание классиков на CD ROM", разрабатываемый

совместно с НТЦ "Информрегистр" и ИМЛИ им. М.Горького РАН при поддержке

Роскоминформа. Для этого проекта была создана универсальная технология

"Аргонавт", которая включала как средства разметки и отображения текстов,

так и средства навигации, а так же различные поиски - и текстовые, и

атрибутные. На основе этой технологии вышло 3 издания - справочник

стандартов "Информ - Норматив", электронное научное издание "А.С.

Грибоедов" и "Пушкин. Электронный фонд русской классической литературы".

Также был создан словарь языка Грибоедова.

В начале 1996 года был разработан алгоритм построения гипотез. Отныне

морфологический разбор перестал быть привязан к словарю - если какого-либо

слова в словаре нет, то находятся наиболее похожие на него словарные слова

и по ним строится модель словоизменения.

В это время Интернет в России только начинался...

1. История Yandex.Ru

Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997

года на выставке Softool. Основными отличительными чертами Yandex.Ru на тот

момент были проверка уникальности документов (исключение копий в разных

кодировках), а также ключевые свойства поискового ядра Яndex, а именно:

учет морфологии русского языка (в том числе и поиск по точной словоформе),

поиск с учетом расстояния (в том числе в пределах абзаца, точное

словосочетание), и тщательно разработанный алгоритм оценки релевантности

(соответствия ответа запросу), учитывающий не только количество слов

запроса, найденных в тексте, но и "контрастность" слова (его относительную

частоту для данного документа), расстояние между словами, и положение слова

в документе.

Чуть позже в разделе «Сказки» (наблюдения за содержанием русского

Интернета) появилась первая сказка Рунета — «Web – гуманизм или чернуха?».

А в разделе «Числа» — первая оценка объема Рунета, 5 тысяч серверов и 4Гб

текстов.

Через два месяца, в ноябре 1997 года, был реализован естественно-языковый

запрос. Отныне к Yandex.Ru можно обращаться просто «по-русски», задавать

длинные запросы, например: «где купить компьютер», «генетически

модифицированные продукты» или «коды международной телефонной связи» и

получать точные ответы. Средняя длина запроса в Yandex.Ru сейчас — 2,7

слова. В 1997 году она составляла 1,2 слова, тогда пользователи поисковых

машин были приучены к телеграфному стилю.

В 1998 году на Yandex.Ru появилась возможность «найти похожий документ»,

список найденных серверов, поиск в заданном диапазоне дат и сортировка

результатов поиска по времени последнего изменения. За этот год «объем»

Русского Интернета удвоился, что привело к необходимости оптимизации

поисковых механизмов. И тогда, и сейчас (при объеме в 200 Гб) скорость

поиска на Yandex.Ru — доли секунды.

За 1999 год Рунет вырос на порядок, как в объемах текстов, так и в

количестве пользователей. Это был год бурного развития и для Yandex.Ru.

Новый поисковый робот позволил оптимизировать и ускорить обход сайтов

Рунета. Сегодня поисковая база Yandex.Ru вдвое больше, чем у ближайших

конкурентов.

Новый робот позволил предоставить пользователям новые возможности – поиск

по разным зонам текста (заголовкам, ссылкам, аннотациям, адресам, подписям

к картинкам), ограничение поиска на группу сайтов, поиск по ссылкам и

изображениям, а также выделять документы на русском языке. Появился поиск в

категориях каталога и впервые в Рунете было введено понятие «индекс

цитирования» — количество ресурсов, ссылающихся на данный.

В течение всего года продолжалась работа по количественному и качественному

анализу Рунета. Был открыт НИНИ-индекс (индекс «Непостоянства Интересов

Населения Интернет»), показывающий динамику изменения интересов

пользователей Интернета. Открылся поисковый Форум и новый сервис — подписка

на запрос, то есть можно оставить свой запрос на Yandex.Ru и регулярно

получать по электронной почте информацию о появлении новых и/или измененных

документов, соответствующих этому запросу. К началу учебного года был

открыт «Семейный Яndex», фильтрация результатов поиска от мата и

порнографии.

2. Яндекс — 2000

В этом году образовалась компания "Яндекс". "Яндекс" был учрежден

акционерами CompTek - компании, создавшей и в течение долгого времени

развивавшей проект Яndex. Компания ru-Net Holdings инвестировала 5

миллионов 280 тысяч долларов и получила в новой компании долю в 35,72%. В

число акционеров входят также менеджмент и ведущие разработчики поисковой

системы. Генеральным директором стал Аркадий Волож.

В новообразованную компанию перешли все права на торговую марку Яndex и

сайт www.yandex.ru, а также на поисковую технологию Яndex и семейство

одноименных программных продуктов. Кроме того, в "Яндекс" был передан

недавно стартовавший проект www.narod.ru.

В апреле на канале НТВ прошла рекламная кампания Яндекса, в которой впервые

был озвучен слоган "Найдется все!".

В июне открытием нового дизайна сайта Yandex.Ru началась "неделя Яндекса",

каждый день которой был посвящен одному из проектов. Тогда были открыты

Почта Яндекса, Яндекс.Новости, Яндекс.Открытки и Яндекс.Закладки, а также

"аскетический Яндекс" - для тех, кто торопится. Завершилась неделя

праздником Яндекса.

В этом же году Яндекс стал искать не только по веб-страницам, но и по

специализированным ("параллельным") массивам данных - новостям и товарам.

Был открыт свой собственный каталог c новым (фасетным) принципом описания

ресурсов. Его концепция и принципы классификации были разработаны

специалистами Яндекса.

3. Яндекс — 2001

Новый 2001-й год Яндекс ознаменовал акцией «Новогоднее обращение Народа

России к Президенту» и переездом в новый офис с собственной серверной.

В этом году Яндекс стал лауреатом Национальной Интел Интернет Премии,

получив призы в следующих номинациях:

Лучший сайт в области «Сетевые сервисы»

Лучший сайт в области «Рубрикаторы, поисковые системы, каталоги товаров и

услуг»

Человек Года: Аркадий Волож

Гран-при Российской академии Интернета

Специальный приз прессы (присуждается журналистским сообществом)

Веб Выбирает Вас (результат общего голосования пользователей Рунета)

Две последние номинации - особые. "Специальный приз прессы" присуждается

журналистским сообществом (400 анкет было разослано региональным

журналистам). "Веб Выбирает Вас" - результат общего голосования

пользователей Рунета.

В апреле Яндекс учредил новое интернет-соревнование — Открытый Кубок России

по поиску в интернете. В чемпионате могут принять участие все желающие,

владеющие русским языком и клавиатурой. Никаких ограничений на

использование инструментов поиска нет. Официальный сайт Кубка —

kubok.yandex.ru.

Первый розыгрыш Кубка прошел весной. Более 1000 человек состязались за

звание «Человек, который нашел все», и более 60.000 человек наблюдало за

играми. Второй розыгрыш Кубка состоялся осенью, сайт посетило более 100

тысяч человек.

Летом этого года Яндекс впервые вышел на первое место в Рунете по объему

аудитории, согласно данным исследовательских компаний Комкон-2 и Gallup

Media.

4. Яндекс — 2002

2002-й год Яндекс встретил информационной компанией новой европейской

валюты, за что получил первый в России наличный евро.

Яндексом был опубликован рейтинг потребительских торговых марок «Выбор

интернета 2001».

По решению Совета директоров был приближен срок выхода на самоокупаемость с

первой половины 2003 года на четвертый квартал 2002, в итоге уже в августе

2002 года было достигнуто превышение доходов над расходами, и в ноябре

Яндекс рапортовал о досрочном выходе на самоокупаемость.

Весной Яндекс зафиксировал объем русского интернета, равный одному

терабайту (2 в 40 степени байт).

Летом Яндексу был делегирован домен yandex.com, отобранный у

недобросовестного владельца. Это послужило началом борьбы Яндекса с

киберсквотингом.

«Яндекс» и группа компаний PayCash вывели на рынок новую систему цифровой

наличности Яндекс.Деньги, задачей которых стало создание в российском

интернете универсальной платежной среды.

Был внедрен новый сервис Яндекс.Почты - фильтрации массовых рассылок (bulk

mail).

В октябре на Яндексе был открыт официальный сайт проекта «Фабрика звезд»

(Первый канал) в формате «реальное шоу», таким образом Яндекс опробовал

взаимодействие трех информационных сред: телевидения, телефонии и

интернета.

Тогда же стартовал розыгрыш III Открытого Кубка России по поиску в

интернете.

Завершением 2002 года стало открытие нового торгового центра -

Яндекс.Маркет, который объединил все разработки Яндекса в сфере электронной

коммерции — Подбери, Товары и Гуру.

5. Яндекс — 2003

2003 — первый Новый год, который Яндекс встретил как самоокупаемая

компания. В этом же году Совет директоров компании "Яндекс" принял решение

о выплате дивидендов – первых в российском интернете.

Яндекс.Почта предоставила пользователям возможность выбора: смотреть или не

смотреть рекламу, освободила миллион неиспользуемых имен (логинов), а во

втором полугодии - удвоила размер почтового ящика и объявила борьбу со

спамом своей приоритетной задачей.

Яндекс научился находить документы не только в формате HTML, но и в

форматах RTF, PDF и DOC, а также заявил, что готов давать каждому жителю

страны по одному ответу в месяц - количество ответов Яндекса на поисковые

запросы превысило 147 миллионов.

На официальном сайте Президента России была запущена поисковая система

Яndex.Site.

По лицензии "Яндекса" был успешно проведен израильский Кубок по поиску в

интернете, организованный Яндексом и компаниями кабельного телевидения.

Летом служба Яндекс.Новости радикально преобразилась. Пользователям был

предложен совершенно новый и оригинальный сервис: автоматическое

объединение содержательно близких новостей в сюжеты и выделение главных тем

дня.

Яндекс в очередной раз изменил дизайн главной страницы и страницы выдачи

результатов поиска, но в этот пользователям была предоставлена возможность

протестировать новый дизайн до его окончательного внедрения и высказать

свое мнение.

В октябре прошел традиционный, четвертый по счету, розыгрыш Открытого Кубка

России по поиску в интернете.

Яндекс выпустил новую серию поисковых решений: Яndex.Server,

Яndex.Publisher и Яndex.SDK.

В ноябре служба автоматического размещения контекстных объявлений

Яндекс.Директ перешла на новую модель работы: оплату по кликам.

Яндекс открыл экспорт результатов поиска в формате XML.

Компании «1С», «Никита» и «Яндекс» запустили первую российскую онлайновую

многопользовательскую игру «Сфера».

6. Яндекс — 2004

2004 год принес компании «Яндекс» утроение рекламных оборотов. Основной

движущей силой стала поисковая реклама («Купи слова»), которая составила

80% оборота.

В этом году существенное внимание было уделено регионам. Проект

Яндекс.Города привлек много новых партнеров. Проведена «регионализация»

проектов — Новостей и Маркета. В 9 городах России прошло 10 семинаров

Яндекса, которые посетило более 1000 слушателей. 100 человек были

сертифицированы Яндексом как специалисты по интернет-рекламе.

Компания «Яндекс» приняла участие в создании Национального корпуса русского

языка и учредила научные стипендии в области автоматической обработки веб-

данных.

Поиск Яндекса научился понимать новые форматы файлов — PDF, DOC, RTF,

Flash, XLS и PPT. Среди новых сервисов стоит отметить поиск по Картам и

поиск по блогам и форумам.

На Яндекс.Почте внедрена защита от спама — Спамооборона и предложен

неограниченный размер почтового ящика.

Новый проект Яндекс.WiFi стимулировал развитие бесплатного беспроводного

доступа в интернет. За полгода Яндекс.WiFi стал крупнейшей сетью хот-спотов

России, к ней подключилось более 50-и участников.

7. Результаты поиска

После того, как вы задали запрос, Яндекс выведет список ссылок на

документы, наиболее точно ему соответствующие. На этой странице результатов

вы обнаружите некоторые специальные обозначения и ссылки, предназначенные

облегчить просмотр и сортировку найденных страниц. Ниже приведен общий вид

страницы результатов.

1. Поисковая форма. Главный ее элемент - строка запроса. При желании можно

искать только в результатах предыдущего поиска ("искать в найденном").

Можно также задать запрос по любому из источников информации ("Рунет",

"Новости", "Товары", "Энциклопедии", "Картинки").

2. Статистика поиска: число найденных документов и частота заданных в

запросе слов. По ссылке "страниц" можно перейти на несгруппированную по

серверам выдачу.

3. Рубрики каталога . По нажатию на ссылку происходит переход в

соответствующий раздел каталога (выводится только при точном соответствии

запросу).

4. Результаты поиска по вебу. Для каждого документа выдается следующая

информация: заголовок - ссылка на ресурс, [Показать найденные слова] -

переход на "подсвеченный" документ, в котором контекст запроса выделен

стрелочками, поиск похожего документа и, если найденный сайт описан в

каталоге, переход в рубрику каталога. Кроме этого, информация о размере,

кодировке и, дате документа, его URL.

5. Переход на следующие страницы результата. Сортировка по убыванию дат.

6. "Колдунщик запросов". Здесь даются советы и предложения по уточнению

вашего запроса. Можно сузить поиск по рубрике каталога или по региону.

7. Популярные находки наших пользователей - ссылки на документы (не с

первой страницы результатов!), выбранные пользователями по этому запросу

(выводится только при точном соответствии).

[pic]

8. Возможность поискать в других русскоязычных поисковых машинах.

9. Результат поиска в новостных лентах информационных агентств (выводится

только при точном соответствии запросу). При высоком соответствии и

актуальности эта секция может оказаться над результатами поиска по вебу.

10. Ссылки на прочие службы Яндекса.

11. Результат поиска в энциклопедических статьях (выводится только при

точном соответствии запросу).

12. Результат поиска в базе товарных предложений магазинов (выводится

только при точном соответствии запросу).

8. Советы по поиску в Яндексе

Проверяйте орфографию

Если поиск не нашел ни одного документа, то вы, возможно, допустили

орфографическую ошибку в написании слова. Проверьте правильность написания.

Если вы использовали при поиске несколько слов, то посмотрите на количество

каждого из слов в найденных документах (перед их списком после фразы

"Результат поиска"). Какое-то из слов не встречается ни разу? Скорее всего,

его вы и написали неверно.

Используйте синонимы

Если список найденных страниц слишком мал или не содержит полезных страниц,

попробуйте изменить слово. Например, вместо "рефераты" возможно больше

подойдет "курсовые работы" или "сочинения". Попробуйте задать для поиска

три-четыре слова-синонима сразу. Для этого перечислите их через

вертикальную черту (|). Тогда будут найдены страницы, где встречается хотя

бы одно из них. Например, вместо "фотографии" попробуйте "фотографии | фото

| фотоснимки".

Ищите больше, чем по одному слову

Слово "психология" или "продукты" дадут при поиске поодиночке большое число

бессмысленных ссылок. Добавьте одно или два ключевых слова, связанных с

искомой темой. Например, "психология Юнга" или "продажа и покупка

продовольствия". Рекомендуем также сужать область вашего вопроса. Если вы

интересуетесь автомобилями ГАЗа, то запросы "автомобиль Волга" или

"автомобиль ГАЗ" выдадут более подходящие документы, чем "легковые

автомобили".

Не пишите большими буквами

Начиная слово с большой буквы, вы не найдете слов, написанных с маленькой

буквы, если это слово не первое в предложении. Поэтому не набирайте обычные

слова с Большой Буквы, даже если с них начинается ваш вопрос Яндексу.

Заглавные буквы в запросе рекомендуется использовать только в именах

собственных. Например, "группа Черный кофе", "телепередача Здоровье".

Найти похожие документы

Если один из найденных документов ближе к искомой теме, чем остальные,

нажмите на ссылку "найти похожие документы". Ссылка расположена под

краткими описаниями найденных документов. Яndex проанализирует страницу и

найдет документы, похожие на тот, что вы указали. Но если эта страница была

стерта с сервера, а Яндекс еще не успел удалить ее из базы, то вы получите

сообщение "Запрошенный документ не найден".

Используйте знаки "+" и "-"

Чтобы исключить документы, где встречается определенное слово, поставьте

перед ним знак минуса. И наоборот, чтобы определенное слово обязательно

присутствовало в документе, поставьте перед ним плюс. Обратите внимание,

что между словом и знаком плюс-минус не должно быть пробела. Например, если

вам нужно описание Парижа, а не предложения многочисленных турагентств,

имеет смысл задать такой запрос "путеводитель по парижу -агентство -тур".

Плюс стоит использовать в том случае, когда нужно найти так называемые стоп-

слова (наиболее частотные слова русского языка, в основном это местоимения,

предлоги, частицы). Чтобы найти цитату из Гамлета, надо задать запрос

"+быть или +не быть".

Попробуйте использовать язык запросов

С помощью специальных знаков вы сможете сделать запрос более точным.

Например, укажите, каких слов не должно быть в документе, или что два слова

должны идти подряд, а не просто оба встречаться в документе. (Описание

синтаксиса языка запросов)

Искать без морфологии

Вы можете заставить Яндекс не учитывать формы слов из запроса при поиске.

Например, запрос !иванов найдет только страницы с упоминанием этой фамилии,

а не города "Иваново".

Поиск картинок и фотографий

Яндекс умеет искать не только в тексте документа, но и отыскивать картинки

Страницы: 1, 2


ИНТЕРЕСНОЕ



© 2009 Все права защищены.