+ All Categories
Home > Data & Analytics > Data, informace, zákony a indexy

Data, informace, zákony a indexy

Date post: 02-Jul-2015
Category:
Upload: josef-slerka
View: 299 times
Download: 3 times
Share this document with a friend
Description:
Pár poznámek datům a jedna případová studie.
51
Data, informace, zákony a indexy Josef Š lerka, Studia nov ý ch médií, Socialbakers
Transcript
Page 1: Data, informace, zákony a indexy

Data, informace, zákony a indexyJosef Šlerka, Studia nových médií, Socialbakers

Page 2: Data, informace, zákony a indexy
Page 3: Data, informace, zákony a indexy

Obsah

1. DIKW aneb obecný rámec

2. Zákony a paradoxy (a slepé cesty)

3. Social Heatlh Index - případová studie

4. Diskuse

5. Konec

Page 4: Data, informace, zákony a indexy

1. DIKWData, Information, Knowledge, Wisdom

Page 5: Data, informace, zákony a indexy
Page 6: Data, informace, zákony a indexy

2. Zákony a paradoxy(a také slepé cesty)

Page 7: Data, informace, zákony a indexy

Zákony a paradoxy

2.1. Medián a průměr

2.2. Zákon velkých čísel

2.3. Benfordův zákon

2.4. Simpsonův paradox

2.5. Matoušův efekt

2.6. Bonus

Page 8: Data, informace, zákony a indexy

2.1. Medián a průměr

Malá cesta v čase... To psal rok 2013 a my jsme s Eliškou Hutníkovou prezentovali data o českém Facebooku....

Page 9: Data, informace, zákony a indexy

Tisíce fanoušků má přeci každá stránka,

tak proč my ne!

Page 10: Data, informace, zákony a indexy

Ověření

analýza informací o FB stránkách přes API

celkem indexujeme něco přes 23.000 stránek

jen něco přes 11.000 bylo za poslední měsíc alespoň jednou aktivních

pro analýzu jsme využili jen stránky aktivní v minulém měsící

Page 11: Data, informace, zákony a indexy
Page 12: Data, informace, zákony a indexy
Page 13: Data, informace, zákony a indexy

Zjištěníprůměrně má česká aktivní stránka 4.169 fanoušků

median je 356, tedy více než 10x méně

skoro 90 procent stránek na českém Facebooku má méně fanoušků než je průměr

jen horních 7 procent jich má více než 10.000

v případě počtu fanoušků Facebook stránek je metrika průměru naprostej bullshit

Page 14: Data, informace, zákony a indexy

2.1. Medián a průměr

Medián je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd. (Wikipedie)

Page 15: Data, informace, zákony a indexy

2.1. Medián a průměr

Aritmetický průměr je statistická veličina, která v jistém smyslu vyjadřuje typickou hodnotu popisující soubor mnoha hodnot. Aritmetický průměr se obvykle značí vodorovným pruhem nad názvem proměnné, popř. řeckým písmenem µ. Definice aritmetického průměru je (...) součet všech hodnot vydělený jejich počtem. V běžné řeči se obvykle obecným slovem průměr myslí právě aritmetický průměr. (Wikipedie)

Page 16: Data, informace, zákony a indexy

2.2. Zákon velkých čísel

Když máte fanoušky, kteří mají hodně followerů, asi jsou kvalitěnější (známější, vlivnější)...

Page 17: Data, informace, zákony a indexy

2.2. Zákon velkých čísel

Vezměme čtyři účty:

@O2GuruCZ (cca 1.700)

@o2_cz (cca 6.500)

@tmobile_cze (cca 4.200)

@Vodafone_cz (cca 32.400)

Page 18: Data, informace, zákony a indexy

2.2. Zákon velkých čísel

Page 19: Data, informace, zákony a indexy

2.2. Zákon velkých čísel

In probability theory, the law of large numbers (LLN) is a theorem that describes the result of performing the same experiment a large number of times. According to the law, the average of the results obtained from a large number of trials should be close to the expected value, and will tend to become closer as more trials are performed. (http://en.wikipedia.org/wiki/Law_of_large_numbers)

Page 20: Data, informace, zákony a indexy

2.3. Benfordův zákon

Benfordův zákon je matematický zákon, který říká, že v mnoha souborech přirozených dat (ale ne ve všech) čísla mnohem častěji začínají číslicí 1 než na jiné číslice. Zhruba 30 % čísel začíná jedničkou. Čím vyšší je počáteční číslice, tím méně pravděpodobněji se na začátku čísel objevuje. (http://cs.wikipedia.org/wiki/Benford%C5%AFv_z%C3%A1kon)

Page 21: Data, informace, zákony a indexy
Page 22: Data, informace, zákony a indexy
Page 23: Data, informace, zákony a indexy
Page 24: Data, informace, zákony a indexy
Page 25: Data, informace, zákony a indexy
Page 26: Data, informace, zákony a indexy
Page 27: Data, informace, zákony a indexy
Page 28: Data, informace, zákony a indexy
Page 29: Data, informace, zákony a indexy

2.4. Simpsonův paradox

Kolik letů bylo zpožděných...

KLM AirFrance

Ruzyň 30% 25%

Frankfurt 100% 75%

kdo je lepší průměr 65%? průměr 50%?

Page 30: Data, informace, zákony a indexy

2.4. Simpsonův paradox

... no vida?

KLM AirFrance

Ruzyň 2 z 6 1 ze 4

Frankfurt 2 ze 2 12 z 16

kdo je lepší 4 z 8 (50%) 13 z 20 (65%)

Page 31: Data, informace, zákony a indexy

2.4. Simpsonův paradoxSimpsonův paradox je statistický paradox při porovnání úspěšností dvou individuí (skupin) během více období, přičemž v jednotlivých obdobích je úspěšnější skupina A, ale celkově je úspěšnější skupina B. Paradox je pojmenovaný podle Edwarda Simpsona, který jej publikoval v roce 1951.[1] Protože jde o matematickou trivialitu, je prakticky jisté, že tento paradox byl pozorovaný možná staletí před ním, ale kvůli nepředstavitelné trivialitě ho nikdo nepublikoval.

(http://cs.wikipedia.org/wiki/Simpson

Page 32: Data, informace, zákony a indexy

2.5. Matoušův efekt

In sociology, the Matthew effect (or accumulated advantage) is the phenomenon where "the rich get richer and the poor get poorer". In both its original and typical usage it is meant metaphorically to refer to issues of fame or status but it may also be used literally to refer to cumulative advantage of economic capital. (Wikipedia)

Page 33: Data, informace, zákony a indexy

2.5. Matoušův efekt

@tmobile_cze

18%

82%

>1 0 a 1

@o2_cz

17%

83%

>1 0 a 1

Page 34: Data, informace, zákony a indexy

2.5. Matoušův efekt

@radeksikorski

(sample)

49% 51%

>1 0 a 1

@Vodafone_cz

(sample)

51% 49%

>1 0 a 1

Page 35: Data, informace, zákony a indexy

2.6. Bonus

Social network analysis a profiling vlivných účtů pro @stunome...

Page 36: Data, informace, zákony a indexy
Page 37: Data, informace, zákony a indexy

3. Social Health IndexSoHI aneb případová studie: Socialbakers a Lenovo

Page 38: Data, informace, zákony a indexy

3. Social Health Index

Vstupní požadavky: vytvořit metriku, která bude nakonec redukovatelná na jedno číslo, které zároveň bude mít smysl, zároveň bude umožňovat porovnat výkon kampaní v sociálních sítích s konkurencí, bude transparentní, bude umžňovat porovnání klastrů, půjde rozšířit a bude stabilní proti výkyvům.

Proč? Protože současné obecné metriky (Klout a spol.) řadu těchto požadavků nesplňují

Page 39: Data, informace, zákony a indexy

3. Social Health IndexObecně chce většina firem na sítích:

získávat nové klienty a

udržet si stávající a

zapojit je a

udělat z nich obhájce a

měřit svůj výkon proti konkurenci a

počítat finančně svůj výkon

Page 40: Data, informace, zákony a indexy

3. Social Health Index

P - participace

A - akvizice

R - retence

S - sdílení

a KPI plus shluky

Page 41: Data, informace, zákony a indexy

3. Social Health Index

Page 42: Data, informace, zákony a indexy

3. Social Health Index

Page 43: Data, informace, zákony a indexy

3. Social Health Index

Page 44: Data, informace, zákony a indexy

3. Social Health Index

Page 45: Data, informace, zákony a indexy

3. Social Health Index

Page 46: Data, informace, zákony a indexy

3. Social Health Index

Page 47: Data, informace, zákony a indexy
Page 48: Data, informace, zákony a indexy

3. Social Health Index

Vypadá to jednoduše, že?

Ale nakonec to bylo pět měsíců diskusí a vývoje.

Speciální díky patří Elišce Hutníkové!

Page 49: Data, informace, zákony a indexy

Král indexů....

Page 50: Data, informace, zákony a indexy

4. Diskusetedy pokud to technicky jde...

Page 51: Data, informace, zákony a indexy

Děkuji za pozornost! @josefslerka


Recommended