И как это влияет на релевантность выборки?
Что вообще такое - релевантность выборки?
Давайте использовать классический термин репрезентативность.
"Выборка будет репрезентативной при обследовании большой группы людей, если внутри этой группы есть представители разных подгрупп, только так можно сделать верные выводы."
То есть, если за фильм проголосовало несколько сотен тысяч человек, на сайте, посвященном кино, который при этом не был замечен в скандалах с накрутками (не будем показывать пальцем), и использует е прямое среднее, а статистические формулы с доверительными интервалами, то ваша оценка фильму, который вы не смотрели, не повлияет на оценку. От слова никак.
Потому что а) выборка репрезентативна; б) формула подсчета среднего учитывает аномалии и отклонения и нивелирует их.
Вы мне сейчас напоминаете людей, которые уверены, что если монетка выпала 9 раз подряд решкой, то вероятность того, что на 10 она упадет орлом существенно больше 1/2.
Внутри группы нет представителей людей, не пользующихся интернетом.
Внутри группы преобладает англоязычные пользователи.
Вся выборка состоит из голосов людей, которые добровольно "жмякают кнопку". Их на это что-то побуждает.
Строго говоря - всё это решается весовыми коэффициентами. Они есть? Должны быть, обязаны. Но точно я не знаю. Я не знаю - я не могу утверждать.
Не надо приписывать утверждение, что один голос на что-то значимо влияет.
Флеш-моб людей, не смотревших фильм, возможен? Да. Он может значимо влиять на оценку? Может. От этого есть защита на сайте? Однозначно есть. Она эффективна? Не знаю, интуитивно я вижу странные результаты, утверждать однозначно не могу.
Что такое релевантность выборки, я не знаю, это не я писал.
Изменено: SilverS, 07 Сентябрь 2017 - 10:29