16.08.2010, 22:54 | #24 |
Участник
|
Цитата:
Сообщение от mazzy
ключевой ошибкой Lucky13, на мой взгляд, является то, что он относит все сообщения участника на дату регистрации этого участника. В результате получается непойми что. Например, я зарегистрирован в 2001 году. За 9 лет создал более 15тыс.сообщений. Неужели все эти сообщения относить на 2001 год?
Условие post > k and lastpost > 01\01\2010 нужно для того, чтобы отобрать пользователей "которые писали на форуме в последнее время". Полученное множество пользователей, которые писали на форуме в последнее время делится на кластеры (подмножества) по дате регистрации от 2001 до 2009 год. 2010 год рассматривать некорректно так как он еще не закончен. Какими свойствами обладают эти подмножества? Можно сказать совершенно точно, что из размер не возрастет. Есть вероятность, что с течением времени их размер может уменьшится так как пользователю может стать не интересна тематика форума (смена деятельности) или просто надоесть писать на форуме. Если провести подобный расчет через год, то каждое подмножество не увеличится и добавятся данные за 2010 год. Увеличится ли общее число "пищущих" пользователей? Конечно все возможно, но судя по тенденции (уменьшение, начиная с 2008 года), далеко не факт. Напомню, я считаю не сообщения, а пользователей. Вот такой вот человеко-ориентированный подход Я тоже заметил, что пользователь начинает активно писать на второй год после регистрации, из-за чего возникает подозрение, что спады на графиках вызваны кризисом 2008 года. В качестве гипотезы, как проверить не знаю. Меня заинтересовал вопрос, почему вас беспокоит уменьшение числа участников с малыми числом сообщений - это же практически "просто читатели", на мой взгляд. То что таких стало меньше может следовать из того, что стало больше документации по системе. Я чего-то не понимаю? |
|