Data, informace, zákony a indexy

Post on 02-Jul-2015

301 views 3 download

description

Pár poznámek datům a jedna případová studie.

transcript

Data, informace, zákony a indexyJosef Šlerka, Studia nových médií, Socialbakers

Obsah

1. DIKW aneb obecný rámec

2. Zákony a paradoxy (a slepé cesty)

3. Social Heatlh Index - případová studie

4. Diskuse

5. Konec

1. DIKWData, Information, Knowledge, Wisdom

2. Zákony a paradoxy(a také slepé cesty)

Zákony a paradoxy

2.1. Medián a průměr

2.2. Zákon velkých čísel

2.3. Benfordův zákon

2.4. Simpsonův paradox

2.5. Matoušův efekt

2.6. Bonus

2.1. Medián a průměr

Malá cesta v čase... To psal rok 2013 a my jsme s Eliškou Hutníkovou prezentovali data o českém Facebooku....

Tisíce fanoušků má přeci každá stránka,

tak proč my ne!

Ověření

analýza informací o FB stránkách přes API

celkem indexujeme něco přes 23.000 stránek

jen něco přes 11.000 bylo za poslední měsíc alespoň jednou aktivních

pro analýzu jsme využili jen stránky aktivní v minulém měsící

Zjištěníprůměrně má česká aktivní stránka 4.169 fanoušků

median je 356, tedy více než 10x méně

skoro 90 procent stránek na českém Facebooku má méně fanoušků než je průměr

jen horních 7 procent jich má více než 10.000

v případě počtu fanoušků Facebook stránek je metrika průměru naprostej bullshit

2.1. Medián a průměr

Medián je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd. (Wikipedie)

2.1. Medián a průměr

Aritmetický průměr je statistická veličina, která v jistém smyslu vyjadřuje typickou hodnotu popisující soubor mnoha hodnot. Aritmetický průměr se obvykle značí vodorovným pruhem nad názvem proměnné, popř. řeckým písmenem µ. Definice aritmetického průměru je (...) součet všech hodnot vydělený jejich počtem. V běžné řeči se obvykle obecným slovem průměr myslí právě aritmetický průměr. (Wikipedie)

2.2. Zákon velkých čísel

Když máte fanoušky, kteří mají hodně followerů, asi jsou kvalitěnější (známější, vlivnější)...

2.2. Zákon velkých čísel

Vezměme čtyři účty:

@O2GuruCZ (cca 1.700)

@o2_cz (cca 6.500)

@tmobile_cze (cca 4.200)

@Vodafone_cz (cca 32.400)

2.2. Zákon velkých čísel

2.2. Zákon velkých čísel

In probability theory, the law of large numbers (LLN) is a theorem that describes the result of performing the same experiment a large number of times. According to the law, the average of the results obtained from a large number of trials should be close to the expected value, and will tend to become closer as more trials are performed. (http://en.wikipedia.org/wiki/Law_of_large_numbers)

2.3. Benfordův zákon

Benfordův zákon je matematický zákon, který říká, že v mnoha souborech přirozených dat (ale ne ve všech) čísla mnohem častěji začínají číslicí 1 než na jiné číslice. Zhruba 30 % čísel začíná jedničkou. Čím vyšší je počáteční číslice, tím méně pravděpodobněji se na začátku čísel objevuje. (http://cs.wikipedia.org/wiki/Benford%C5%AFv_z%C3%A1kon)

2.4. Simpsonův paradox

Kolik letů bylo zpožděných...

KLM AirFrance

Ruzyň 30% 25%

Frankfurt 100% 75%

kdo je lepší průměr 65%? průměr 50%?

2.4. Simpsonův paradox

... no vida?

KLM AirFrance

Ruzyň 2 z 6 1 ze 4

Frankfurt 2 ze 2 12 z 16

kdo je lepší 4 z 8 (50%) 13 z 20 (65%)

2.4. Simpsonův paradoxSimpsonův paradox je statistický paradox při porovnání úspěšností dvou individuí (skupin) během více období, přičemž v jednotlivých obdobích je úspěšnější skupina A, ale celkově je úspěšnější skupina B. Paradox je pojmenovaný podle Edwarda Simpsona, který jej publikoval v roce 1951.[1] Protože jde o matematickou trivialitu, je prakticky jisté, že tento paradox byl pozorovaný možná staletí před ním, ale kvůli nepředstavitelné trivialitě ho nikdo nepublikoval.

(http://cs.wikipedia.org/wiki/Simpson

2.5. Matoušův efekt

In sociology, the Matthew effect (or accumulated advantage) is the phenomenon where "the rich get richer and the poor get poorer". In both its original and typical usage it is meant metaphorically to refer to issues of fame or status but it may also be used literally to refer to cumulative advantage of economic capital. (Wikipedia)

2.5. Matoušův efekt

@tmobile_cze

18%

82%

>1 0 a 1

@o2_cz

17%

83%

>1 0 a 1

2.5. Matoušův efekt

@radeksikorski

(sample)

49% 51%

>1 0 a 1

@Vodafone_cz

(sample)

51% 49%

>1 0 a 1

2.6. Bonus

Social network analysis a profiling vlivných účtů pro @stunome...

3. Social Health IndexSoHI aneb případová studie: Socialbakers a Lenovo

3. Social Health Index

Vstupní požadavky: vytvořit metriku, která bude nakonec redukovatelná na jedno číslo, které zároveň bude mít smysl, zároveň bude umožňovat porovnat výkon kampaní v sociálních sítích s konkurencí, bude transparentní, bude umžňovat porovnání klastrů, půjde rozšířit a bude stabilní proti výkyvům.

Proč? Protože současné obecné metriky (Klout a spol.) řadu těchto požadavků nesplňují

3. Social Health IndexObecně chce většina firem na sítích:

získávat nové klienty a

udržet si stávající a

zapojit je a

udělat z nich obhájce a

měřit svůj výkon proti konkurenci a

počítat finančně svůj výkon

3. Social Health Index

P - participace

A - akvizice

R - retence

S - sdílení

a KPI plus shluky

3. Social Health Index

3. Social Health Index

3. Social Health Index

3. Social Health Index

3. Social Health Index

3. Social Health Index

3. Social Health Index

Vypadá to jednoduše, že?

Ale nakonec to bylo pět měsíců diskusí a vývoje.

Speciální díky patří Elišce Hutníkové!

Král indexů....

4. Diskusetedy pokud to technicky jde...

Děkuji za pozornost! @josefslerka