Статистика считается только по данным, доступным простому залогиненому пользователю.
Самые цитируемые люди (50 с начала).
Основано на парсинге всех цитат на форуме. Цитаты часто не меняются при смене ника, поэтому статистика включает в себя некоторые неточности:
Человеки-ОПы (50 с начала).
Количество тредов, которые открыл тот или иной пользователь.
Самый одобряемый контент (50 с начала):
Основанно на репутации конкретного сообщения.
Самый неодобряемый контент (50 с начала)
Аналогично предыдущему.
Самые популярные слова на форуме (200 с начала)
Включает в себя все слова, длиннее одного символа. Все знаки, отличные от букв и цифр, считались за пробел и не учитывались. Также количество упоминаний каждого слова было разделено на среднее упоминание количества слов на миллион слов, чтобы избежать засилья "не", "на", "the", "says" в топе. Некоторые слова, к примеру "бан" и "банить", считались раздельно, так как не являются словарными.
Неизвестные слова (50 с начала):
Те слова, которые анализатор не смог как либо обработать и посчитал неизвестными. Преимущественно аббревиатуры.
Общее количество сообщений (50 с начала)
Показывает количество сообщений у каждого человека, непосредственно доступных обычному залогиненому пользователю. Может разниться в меньшую с количеством сообщений, которое указано форумом, из-за удаления, скрытия или активного общения в закрытых разделах.
Главный хуй.
Умудрился своим сообщением сломать мне парсер после часа работы
Данная статистика была собрана после обработки 4 гигабайт страниц(ебанутый ипборд, хтмл по несколько сотен килобайт) и анализе 232 мегабайт чистых данных.