Social network analysis

Post on 30-Oct-2014

13 views 0 download

Tags:

description

Přednáška o social network analysis pro posluchače semináře o vizualizaci, Brno, 19.4. 2012

transcript

Social network analysis 19. 4. 2012, Josef Šlerka, Brno, seminář o VizualizaciStudia nových médií, ÚISK, FF UK

Sociální síť

... vzniká jako soubor lidí mezi kterými existují nějaké vztahy, které formalizujeme pomocí matice nebo grafu a dále analyzujem.

Řekni to písní...

Igor má rád Evu, Eva jeho nie

a tak preto Igor stále smutný je.

Eva chce mít Vojta, Vojto Evu nie

a tak preto Eva, stále smutná je.

Soubor

set prvků, které vytvářejí graf

sám může být zajímavý třeba pro průniky

Soubor

Igor

Eva

Vojta

Matrix lásky

Igor Vojta Eva

Igor --- 0 1

Vojta 0 --- 0

Eva 0 1---

Malý graf lásky

Velký graf lásky

Vztahy jsou totiž všude

Twitter: princip followingu

Facebook: kamarádi, členství ve skupině, lajky

Flickr: přátelé, tagy

Diskuse: členství v diskusích, reagování

Politika: společná hlasování

Stavební prvky grafuuzel (nodes, vertices, entities, items etc.)

vazba (ties, connections, relationships etc.)

vazby mohou mít směr případně váhu či jich může být víc

z pohledu sociologie mohou mít i kvality např. silné nebo slabé

Typologie grafů I.

Unimodal (jedna přímá vazba)

Multimodal (vícero přímých vazeb)

Affiliation (vazba prostřenictvím např. akce)

Multiplex Network (kvalitativně různé vazby)

Typologie grafů II.

Full (každý s každý)

Partial (tak nějak všichni)

Egocentric (já jsem centrum dění)

Typologie grafů III.

Centralized

Decentralized

Distributed

Co lze třeba měřitPočet hran (Degree Centrality)

Prostřednictví (Betweenness Centralities)

Blízkost (Closeness Centrality)

Hustota (Density), Dosažitelnost (Reachability)

Eigenvector Centrality

Shluky a komunity

... ale proč????

Degree Centrality

počet přímých vazeb k dalším uzlům

měří aktivitu uzlů v síti.

uzly s vysokou hodnotou Degree Centrality jsou „spojky“ nebo „středy“ v této síti.

Closeness Centralitynejvyšší, jestliže z uzlu lze dosáhnout ke všem dalším uzlům v síti.

nejmenší hodnota součtu vzdáleností k ostatním uzlům

uzly snadno přijímají a přenášejí inovace.

uzel s vysokou mírou blízkosti středu mají velký vliv na to, co se v síti odehrává.

Betweenness - Bridgesnejvyšší pokud cesty mezi libovolnými dvěma uzly sítě vždy procházejí tímto uzlem.

měří, kolik cest mezi dvojicí uzlů prochází daným uzlem.

závora, propojení nebo zprostředkovatel rolí.

kontroluje tok informací v síti a umožňuje dobrou viditelnost všeho, co se děje v síti.

Hustota sítě

koeficient shlukování

okolí bodu či celá síť

počet hran/počet možných hran

čím vyšší číslo, tím vyšší hustota sítě

hustota = n * (n - 1) / 2

Reachibility

počet uzlu dosažitelných z jedno bodu na jeden, dva či tři kroky

Eigenvector centralityLze počítat jen v neorientovaném grafu

Přidává k výsledku nejen počet vazeb uzlu, ale také počet vazeb uzlů, které mají uzly s ním spojené

Odhaluje i nepřímý vliv

Google Page Rank je variant Eigenvector centality

Shlukování a komunity

segmentování podle vlastností

buď sdílené vlasnosti (degree)

nebo možná příslušnost do komunity

Role uzlů v síti

Peripheral – výrazně menší než průměrná centrality

Central connector – výrazně větší než průměrná centralita

Broker – výrazaně větší než průměrná betweenness

Sociální roleKomunikátoři

Spojovatelé / Úzká hrdla

Prodavači

Inovátoři

Maveni

Lidé na okraji

Software pro SNA

Pajek

UCINET

Gephi

NWB

... řada dalších

NodeXL

volně dostupný, GPL licence

funguje i jako template pro Excel

snadno ovladatelný

mnoho formátů (Pajek, UCINET, GraphML)

import z Twitteru, Flickru a daších

NodeXL

http://nodexl.codeplex.com/

SNA pro starší

R - nástroj pro statistickou a další matematickou analýzu

vynikající knihovna igraph

pomalá učící křivka, ale vynikající výsledky

vyžaduje, ale programování

Praktické ukázkyanalýza průniků fanoušků telco operátorů

analýza průniků fanoušků na Twitteru

analýza Twitteru followerů @stunome

analýza hashtagu #lumia800

analýza zmínek o slovenské Tatrabance

analýza hlasování politiků v Praze

Průniky fanoušků

listy fanoušku stránek O2, Vodafone a T-Mobile, kteří od 1.3. do 18.4. alespoň jednou komentovali statusy operátorů

data získána pomoci NodeXL

Aktivní fanoušci

O2 1.240 unikátních komentujících

T-Mobile 455 unikátních komentující

Vodafone 1.362 unikátních komentujících

Průnikyo2 T-Mobile

Vodafone

(1.240) (455)

(1.362)

2765

30

10

1.270

3981.145

10 procent konkurence

konkurenční poměr = počet fans / pouze mých

O2 - 0.92

T-Mobile - 0.87

Vodafone - 0.93

Průniky fanoušků

listy fanoušků Twitter účtů ct24zive, rozanek a zpravyrozhlascz

data získána pomoci Klábosení

Aktivní fanoušci@ct24zive 11.289 followers

@rozanek 1.543 followers

@zpravyrozhlascz 1.033 followers

Prostý součet: 13.865, Unikátní součet: 12.772

Poměr shody: 0.92

Společný průnik: 145

Průniky - první pokus

ct24zive rozanek zpravyrozhlascz

ct24zive x 494 584

rozanek 494 x 210

zpravyrozhlascz 584 210 x

Průniky - druhý pokuspoměry mezi průnikem a

počtemct24zive rozanek zpravyrozhlascz

ct24zive x 0.04 0.05

rozanek 0.32 x 0.13

zpravyrozhlascz 0.57 0.2 x

@stunome

@stunome

Lumia 800

přehled za týdenní komunikaci o hashtagu

zoohlednění lidé, kteří napsal aspoň třikrát

různé možnosti pohledu

generováno v R (igraphu)

běžný orientovaný graf

velikost uzlu je dána jeho betweenness

Neighbor-Joining Tree

Tatra Banka

přehled za týdení komunikaci o Tatra Bance

kdokoli, kdo zmínil během března

různé možnosti pohledu

generováno v R (igraphu)

indegree

betweenness

Pražský magistrát

analýza hlasování za tři volební období

vazba existuje při 75% shodných hlasování

ukazuje skutečné hlasovací jádro

ukazuje vazby napříč stranami

inspirace americkým experimentem

1998 - 2002

2002 - 2006

2006 - 2010

Děkuji za pozornost!

Otázky? Odpovědi?

Email: slerka@ataxo.com,

Twitter: http://www.twitter.com/josefslerka

Blog: http://ttgoogle.blogspot.com