Согласно статистике, приведенной в отчете [PDF 3,25 Мб] Яндекса «Контент Рунета», в российском секторе интернета размещено около 15 млн. веб-сайтов — примерно 6,5% от общего количества в Сети. Средний сайт состоит из 255 страниц, и четверть из них не содержат полезной информации, т.е. созданы, чтобы привлекать посетителей на другие сайты или влиять на их ранжирование в поисковых системах.
Отчет составлен на основе изучения текстовых копий всех открытых веб-страниц Рунета, которые хранятся в индексе поисковой системы Яндекс. В сегмент Рунета вошли сайты, написанные на русском, украинском, белорусском или казахском языках, а также сайты, размещенные в доменных зонах .am, .az, .by, .ge, .kg, .kz, .md, .ru, .su, .tj, .ua или uz.
Объем данных, представленных в Рунете в текстовом формате, на настоящий момент составляет более 140 тыс. гб. При этом 88% текста размещено менее чем на 1% сайтов, а половина сайтов состоит всего из одной страницы. Основной язык оформления — русский (91% сайтов). 3% сайтов выполнены на английском языке, 2% — на украинском, 1% на белорусском.
В Рунете размещено не менее 1,6 млрд. уникальных изображений, включая рекламные баннеры, а общее число картинок составляет около 2,1 млрд. При этом каждый третий сайт вообще не использует графику, а половина содержит не более десятка изображений. При подсчете Яндекс не учитывал фотографии, размещенные на крупных фотохостингах, но отметил, что на четырех из них содержится около 800 млн. изображений.
Флэш-объекты обнаружены на 15% сайтов, аудиозаписи в МР3-формате — менее чем на 0,5%. На крупнейших видеохостингах Рунета (без учета файлообмена, социальных сетей и YouTube) размещены 7,2 млн. видеороликов, которые присутствуют на 2,4% сайтов. Еще 0,7 процента сайтов практикуют прямые ссылки на видеоконтент.
Яндекс: четверть страниц Рунета — спам