Ученый из Массачусетского технологического института и по совместительству блогер Итан Цукерман вместе с коллегами подсчитал, что на YouTube опубликовано более 13 млрд роликов. Для этого им пришлось изобрести метод, который они назвали "пьяный дозвон".
К сожалению, Youtube не предоставляет никаких API, с помощью которых можно было бы оценить количество хранящейся там информации. Тем не менее, исследователи выяснили, что URL-адреса YouTube имеют вид "https://www.youtube.com/watch?v=<...>", где значение после "v=" состоит из 11 символов, причем первые 10 могут быть заглавными и строчными буквами латинского алфавита, цифрами от 0 до 9 и знаком подчеркивания, а последний символ принимает лишь одно из 16 значений. Таким образом, всего существует 264 возможных URL-адресов YouTube (примерно 18.4 квинтиллиона). После этого оставалось только генерировать случайные адреса и проверять их наличие. Соотношение существующих адресов к общему возможному их количеству позволило оценить объем YouTube в 13.235 млрд видео.
Кроме получения такой оценки, ислледователи смогли подсчитать и другие статистические показатели. Так, по возрасту роликов в данной случайной выборке можно понять, как быстро растет YouTube: к примеру, в 2023 году на площадке было опубликовано более 4 млрд новых видео. Также было выяснено, что доля роликов с более чем 10.000 просмотров (а только такие попадают в рекомендации) составляет лишь 4% от общего объема, но при этом они генерируют львиную долю от общего количества просмотров. При этом "средний" ролик имеет лишь 39 просмотров.
Исследователи намерены и дальше продолжать работу с YouTube, чтобы выяснять и обновлять статистические показатели платформы.
Горячие темы