У створенні методики підрахунку ентузіасту допоміг Джейсон Баумгартнер – автор утиліти PushShift для автоматизованого збору даних із порталу Reddit. Програміст запропонував визначити кількість роликів за кількістю доступних на них посилань.
Статистика, яку вдалося дізнатися під час дослідження
Типове посилання на YouTube-відео виглядає так: https://www.youtube.com/watch?v=ioxEuSpUMkQ. При цьому ідентифікатор ролика зашифрований у символах після watch?v=. Ідея полягала в тому, щоб щоразу створювати випадково згенероване посилання і перевіряти, веде воно на існуюче відео чи ні. Автоматизувати роботу ентузіастам допомогла утиліта для доступу до API платформи InnerTube.
За результатами експерименту з'ясувалося, що ідентифікатор може набути 18,4 квінтильйона значень. Дослідники послідовно припускали можливу кількість роликів і перевіряли її за допомогою випадкової вибірки. Наприклад, якби на платформі було розміщено 1 мільярд роликів, то один справжній з'являвся б на кожні 18,4 млрд спроб. За допомогою цього методу ентузіастам вдалося вирахувати, що зараз на YouTube знаходяться приблизно 13,325 мільярда відео.
Найпопулярніші категорії відео
За даними дослідження, у середньому кожен ролик набирає 39 переглядів, а рекомендаційні алгоритми сервісу «звертають увагу» лише на відео з 10 000 та більше переглядами. Також стало відомо, що за поточний рік на платформі з'явилися 4 млрд нових відео. Цю та іншу статистику ентузіасти оприлюднюють на сайті tubestats.org. Ознайомитись з повним описом методики підрахунків (англійською мовою) можна за цим посиланням.