sly2m (sly2m) wrote,
sly2m
sly2m

Тысячники? ТОПовые блогеры? Нет - индексники!

Интересная статья сегодня на ленте:

Математики нашли самых влиятельных пользователей социальных сетей


Ученые предложили новый метод определения самых влиятельных пользователей социальных сетей - оказалось, что количество связей конкретного индивидуума слабо сказывается на его способности распространять информацию. В качестве одного из модельных примеров выступала сеть, образованная дружественными аккаунтами в ЖЖ. Статья ученых пока нигде не опубликована, однако ее препринт доступен на сайте arXiv.org.

В рамках исследования сеть изучалась как граф, вершины которого представляют пользователей, а ребра - связи между ними. Традиционно считается, что наибольшим влиянием обладают пользователи, имеющие большое количество связей, - то есть вершины, из которых исходит много ребер. Например, в ЖЖ это пользователи, у которых больше всего друзей.

Оказалось, что это естественное предположение неверно. В случае распространения некоторой информации наибольшее влияние на скорость этого процесса оказывают пользователи, которые расположены "стратегически правильно". Для примера ученые приводят вершину в графе с большим количеством исходящих ребер, все "друзья" которой, за исключением, быть может, одного, не имеют связей с остальной частью графа (своего рода "изгои" с единственным другом). В этом случае подобная вершина оказывает слабое влияние на распространение информации.

Чтобы охарактеризовать местоположение вершины в графе, ученые использовали следующий алгоритм. Сначала удаляются все вершины, из которых исходит не более одного ребра. В оставшемся графе также удаляются все вершины, у которых не более одного ребра. Так делается до тех пор, пока удалять будет нечего. Все удаленные вершины получают индекс 1. Затем процесс повторяется для вершин, из которых исходит не более двух ребер. Такие вершины получают индекс 2. И так далее. Оказывается, чем больше индекс, тем влиятельнее вершина (в предыдущем примере вершина с друзьями-изгоями имела индекс 1). <...>


via lenta.ru


На мой взгляд - хороший алгоритм для составления рейтинга пользователей.

К сожалению мощностей моего сервера для такой задачи явно недостаточно.

Специалисты Яндекса, ау! Вам рассказать, как ребра в графах считать или сами справитесь? ;)

С другой стороны, не Яндексом единым жив рунет. Если есть какие-то заинтересованные организации с хорошими каналами и несколькими простаивающими серверами - чем не идея для релевантного ТОПа? А то "тот самый ТОП" с приходом второй волны шолодемизации совсем читать не интересно стало. А что будет, когда его накроет третьей?

UPD: В комментарии этой записи забрел один из соавторов статьи. Говорит, что готов ответить на вопросы читателей, если таковые имеются. Ну чем не "февральский фуршет"? :)
Tags: жж, интернет
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 35 comments