Яndex оценил Рунет в миллион мегабайт

Машинное отделение Яндекса.

Можно сказать, что 5 марта 2002 года Рунет преодолел весьма значимый рубеж — по данным Яндекса, именно в этот день объём информации в русскоязычном Интернете перевалил за 1 терабайт (1024 гигабайта или миллион с лишним мегабайт).

Отныне интернетчики могут считать 5 марта своим небольшим, но профессиональным праздником — во всяком случае, до тех пор, пока объём не достигнет двух или трёх терабайтов, а случится это, надо думать, не скоро.

Согласно статистике Яндекса, путь Рунета до терабайта был долог и труден: до октября 2000 года рост был вялым, но последовал крутой подъём в гору, и весной-летом 2001 года половина терабайта была достигнута. Соответственно, вторую половину удалось набрать практически за год.

При такой положительной динамике, а она зафиксирована на всех без исключения графиках Яндекса, Рунет, того и гляди, наберёт скорость «терабайт в год», но загадывать не будем, а вместо этого посмотрим, что мы имеем и попытаемся понять: терабайт — это много или не очень?

Иллюстрация с сайта Яndex

Чтобы представить себе эту цифру, предположим, что вся проиндексированная информация распечатана в виде книг по 300 страниц каждая. Считаем, что на одной странице книги имеется 3 килобайта текста, а толщина книги 1,8 см — получится «собрание сочинений» в 1 миллион 200 тысяч томов. Если эти книги поставить друг на друга, высота столба составит 21,5 км. Выходит, что терабайт — это много.

С другой стороны, возьмём для сравнения другую поисковую машину и посмотрим, сколько чего она проиндексировала. Возьмём, конечно же, Google. В декабре 2001 года соучредитель Google Inc. Лари Пэйдж (Larry Page, Google’s co-founder and president of Products) с радостью сообщил, что Google предоставляет своим пользователям доступ к трём миллиардам документов: «Чтобы найти аналогичное количество документов вручную, потребуется 5 тысяч 707 лет, если искать 24 часа в сутки и находить по документу в минуту. Google на это потребуется меньше секунды».

Иными словами, Google индексирует терабайты сотнями, что ни в коем случае не в упрёк Яндексу — при чём тут поисковая машина, если в Рунете по состоянию на 5 марта 2002 года всего-навсего 62,5 миллиона уникальных документов и 430 тысяч уникальных серверов?

Илья Сегалович

Кстати, 6 марта 2002 года в форуме с разработчиками Яндекса был задан вопрос «Не могли бы вы вкратце сравнить Yandex и Google?». В ответ разработчик Илья Сегалович признал, что «в большинстве европейских стран самой популярной поисковой системой, как локальной, так и мировой, является Гугль. К России это пока не относится, и, я надеюсь, не будет относиться — No pasaran!»

No pasaran?



Кризис жанра, или почему закрылся «Нетоскоп»?

1 марта 2002

Европа требует скорейшего введения IPv6

25 февраля 2002

Как знак @ докатился до собачьей жизни

20 февраля 2002

AltaVista сделает почту и поиск платными

20 февраля 2002

Новый стандарт электронной подписи от изобретателя WWW

16 февраля 2002