Как узнать о человеке много нового из его социальных сетей?

Анализ социальных графов давно привлек маркетологов всего мира. Потенциал такого анализа громаден - от вычисления лидеров мнений в определенных сообществах до определения реальности страниц.
Для примера мы возьмем странички юзеров vk, воспользуемся сервисом автоматичеого построения графов
https://www.yasiv.com/vk и посмотрим что мы можем узнать о владельце страницы по графу.

Граф строится очень просто - в центре находится сам пользователь, вершины графа это друзья пользователя, ребра - их связь друг с другом. Чем больше связей вершин с друг-другом тем ребро становится короче. Так образуются облака(сгустки) точек. Если точка попала в облако, то скорее всего она связана с с остальными участками этот облака сильнее всего. Такие облака образуется по социальным группам - работа, институт, школа, кружек вышивания и т.д.

Давайте рассмотри на живом примере. Возьмем пользователя: Даша, 26 лет, и посмотрим граф ее связей в сети Вконтакте:

На графе мы видим 4 плотных облака, нам надо понять чем связаны люди внутри них. Находим "лидеров мнений" в этих облаках - точки с наибольшим числом ребер и смотрим что их объединяет. Большинство пользователей в графе 1 объединяет место работы - назовем его интернет бутик LeStyle. Пользователей под облаком 2 объединяет географическое положение Нижний Новгород. Облако три по большей части состоит из работников банка Капитал. Облако 4 объединят людей местом работы и географическим положением - Нижегородская фирма SocialBrend.

Обратим внимание на облака 2 и 3, которые слабо связаны собой, но имеют одинаковое географическое положение. При том облако 2 намного сильней связана с основным облаком Даши пользователя чем 4. Какое предположение можно сделать из этого? - Даша работала в Нижнем Новгороде и там же нашла друзей не связанных с работой. Если сравнить количество друзей в нижнем Новгороде в сравнении с ее родным городом, работала Даша там недолго.

Есть еще один момент который бросается в глаза - за исключением нижегородских облаков, Дашин граф очень связный, все облака имеют много связей друг с другом. Такие графы свойственны людям проживающих в небольших городах, где правило "двух рук" работает.

Без всякого волшебства, за 10 минут изучения графа мы узнали о Даше что она определённое время жила и работала в нижнем Новгороде, работала в компаниях LeStyle и SocialBrend. Судя по количеству связей Даши с облаками, можно предположить сто она была активным членом этого социума.

А вдруг не фейк?

Пару лет назад к моему другу Мише добавилась в друзья девушка, назовем Настей. Мише она понравилась с первого взгляда, завязался бурный разговор. На следующий день мы только и слушали о том, какая она безупречная и скоро приедет к нему. Да, Настю от Миши, по несчастному стечению обстоятельств, разделяло 5 тысяч километров. Спустя пару недель настал тот день - Настя готова вылетать к Мише, но есть одно но - Насте не хватало 10 тысяч на билет. По скольку Миша нищеброд, и свободные десять тысяч у него могут быть только в первые пять минут после получения зарплаты, Миша прибежал ко мне просить дать ему взаймы. Вот тут-то в мой разум и закралось предположение - Насти на самом деле не существует, а Мишу разводят с фейковой странички. Уговорив Мишу притормозить на на 40 минут, и дать мне изучить ее страничку, я взялся за дело.
В первую очередь проверил, даты заливки фотографий(не в один день ли?), пробил фотографии по поиску vk (Да! В Вк можно искать фотографии внутри вк, расскажу как нибудь), google - ничего. Лайки под постами стоят. Смутило только одно: слишком уж она хороша - таким бы моделями в Милан либо элитными проститутками в Москву , но не никак не в Мухосранск к Мише-слесарю. Вспомнил про сервис отображения графов, и вот что увидел:

Как вы поняли - Миша денег не получит. Граф, с двумя вершинами. На второй вершине(слева) похожий фейк, видать ее же. Нет никаких облаков, связей друзьями Насти. такой граф почти однозначно говорит нам что Настя фейк, и набрала друзей случайным образом. Угадайте, что будет если мы удалим Настю и ее второй фейк из графа:

Правильно, граф разрушился. Настоящий пользователь живет в социуме из разных социальных групп. Этот граф имитирует социум и связи между его членами. Для примера вернемся к Даше (ее граф мы рассматривали в начале) и удалим ее от туда.

Как видим, часть пользователей которые имели связь только с Дашей удалились из графа, но основные облака, которые мы описывали выше остались. Густые облака точек представляют собой социальные группы где участвовала Дарья, и ее удаление не сильно повлияло а них. Друзья и сообщества Даши будут существовать и без нее - такова жизнь.

Понаехали

Социальные графы жителей больших городов отличаются от мелких. Возьмем, для примера Юрца, 29 лет, коренной москвич и посмотрим его граф:

Юра бизнесмен. На графе у него много плотных облак, и много одиночных связей. Его облака это те небольшие бизнесы которые он пытался создать, но не всегда успешно. Компаний больше нет, а связи остались. Со случайными людьми он знакомился на конференциях(или в Tinder), добавлял их в друзья но сообществ они не образовывали. Давайте удалим Юру, и вместе с нем его одиночные связи.

Данный граф отличается от графа Даши, где после ее удаления связей между сформированными сообществами сохранялись сильным. На графе Юры в среднем связь 1-2 ребра. Объясняться это просто - в больших городах связь между членами различных сообществ намного слабее. Людей много, и вероятность что Петя из Блек-Стар Бургер на Цветном знает кого-то из Бургер-Кинга на Авиамотороной крайне мала.

Посмотрим на граф Стаса: москвич, закончил Высшую Школу Экономики, работает на престижной работе в администрации президента. (Так он написал в своем профиле)

Видим три отчетливых сообществ. Первое сверху объединяет участников одним вузом: "Московский Институт Сетей и Связи". Второе - это работа, в неком ООО "Вектор", подрядчики Билайна по телекомуникациям. И особенное внимание третьему облаку, сильно оторванному от двух остальных! Уже догадались? Да - Стас понаехал из деревни "Беломестная Криуша" Тамбовской области. Какие выводы можно сделать: Стас - врунишка, уехать в Москву из деревни у Стасяна получилось, а вот деревня с его графа никуда не делась.

Что дальше

В этой статье мы даже четвертинки верхушки айсберга не затронули. Социальный графы могут применяться в социологии, маркетинге а так же мошенниками различных мастей. С помощью них, например, мы можем узнать общие связи между несколькими пользователями, анализировать сообщества, на предмет сформировавшихся там социальных групп и вычленять из них лидеров. Анализу можно подвергнуть не только отдельных людей, но и города, увивить связи между ними.
Это точно не последняя статья по графам. В следующий раз мы займемся графами сообществ, попробуем искать лидеров мнений и устанавливать связь между сообществами.