+ All Categories
Home > Education > Big Data

Big Data

Date post: 29-Nov-2014
Category:
Upload: josef-slerka
View: 2,244 times
Download: 2 times
Share this document with a friend
Description:
Slajdy z konference Business & Information Forum 2011: Starosti a radosti českých CIO
35
Big Data Josef Š lerka, Ataxo Interactive, SNM FF UK Business & Information Forum 2011, Praha Tuesday, June 7, 2011
Transcript
Page 1: Big Data

Big DataJosef Šlerka, Ataxo Interactive, SNM FF UKBusiness & Information Forum 2011, Praha

Tuesday, June 7, 2011

Page 2: Big Data

3 000 000 000počet hledání na Googlu denně

Tuesday, June 7, 2011

Page 3: Big Data

30 000 000 000počet zpráv a příspěvků na Facebooku měsíčně

Tuesday, June 7, 2011

Page 4: Big Data

5 000 000 000mobilních telefonů po celém světě

Tuesday, June 7, 2011

Page 5: Big Data

140 000 000průměrný počet zpráv poslaných denně na Twitteru

Tuesday, June 7, 2011

Page 6: Big Data

1 000 000počet denně vygenerovných zpráv na českém Facebooku v otevřených profilech

Tuesday, June 7, 2011

Page 7: Big Data

600 dolarůcena disku na který se vejde veškerá hudba na světě v MP3

Tuesday, June 7, 2011

Page 8: Big Data

100 dolarůcena hodiny provozu klastru 10 počítačů na Amazonu

Tuesday, June 7, 2011

Page 9: Big Data

0 dolarůcena open-source softwarů, jako je Hadoop, Lucene,Cassandra, CouchDB, Elastich Search a dalších

Tuesday, June 7, 2011

Page 10: Big Data

Big (Data (Science))buzzwords, které tu s námi dlouho zůstanou

Tuesday, June 7, 2011

Page 11: Big Data

Co jsou to Big Data?

Big Data is a term applied to data sets whose size is beyond the ability of commonly used software tools to capture, manage, and process the data within a tolerable elapsed time. Big data sizes are a constantly moving target currently ranging from a few dozen terabytes to many petabytes of data in a single data set.

Tuesday, June 7, 2011

Page 12: Big Data

Co je Data Science?

A data application acquires its value from the data itself, and creates more data as a result. It's not just an application with data; it's a data product. Data science enables the creation of data products.

Tuesday, June 7, 2011

Page 13: Big Data

Příklady

Jaccardův index a TOEFL

Google Translate

ZIP klastrování

Tuesday, June 7, 2011

Page 14: Big Data

require 'zlib'require 'pp' files = Dir[ARGV[0] + '/*'] def deflate(*files) z = Zlib::Deflate.new z.deflate(files.collect {|f| open(f).read}.join("\\n"), Zlib::FINISH).sizeend pairwise = files.combination(2).collect do |f1, f2| a, b = deflate(f1), deflate(f2) both = deflate(f1, f2)  {:files => [f1, f2], :score => (a+b)-both}end pp pairwise.sort {|a,b| b[:score] <=> a[:score]}[0,20]

Tuesday, June 7, 2011

Page 15: Big Data

Změna paradigmatu

data-driven vs. knowledge-drive (algorithm-driven)

statistické modely vs. modelování skutečnosti

Peter Norvig vs Noam Chomsky

Tuesday, June 7, 2011

Page 16: Big Data

Potřebné dovednosti

Drew Conway

Tuesday, June 7, 2011

Page 17: Big Data

Big Social Data

deep data vs. surface data

data-driven sociální a humanitní vědy

Lev Manovich: The Promises and the Challenges of Big Social Data

Tuesday, June 7, 2011

Page 18: Big Data

Případové studieprediktivní analýza pomocí velkých dat v praxi

Tuesday, June 7, 2011

Page 19: Big Data

Google a zaměstnanost

Tuesday, June 7, 2011

Page 20: Big Data

Twitter a burza

Tuesday, June 7, 2011

Page 21: Big Data

Mobily a cholera

Tuesday, June 7, 2011

Page 22: Big Data

Facebook a filmy

zmínky o Inception na českém Facebooku 2010 a divácký ohlas

Tuesday, June 7, 2011

Page 23: Big Data

Facebook a filmy

Harry Potter na českém Facebooku 2010 a divácký ohlas

Tuesday, June 7, 2011

Page 24: Big Data

Problémyaneb co nás brzdí u nás(podle mých omezených zkušeností)

Tuesday, June 7, 2011

Page 25: Big Data

Selhání vysokých školInformatika - úzké obzory, staré názory, disky už jsou levnéJava bývá dnes cesta pro lepší ukrajinské dělníky

Tuesday, June 7, 2011

Page 26: Big Data

Potřeba přesahuInterdisciplinarita, spolupráce polytechnik a univerzit je to, co dnes zoufale chybí, bez ní jsme jen lepší montovna.

Tuesday, June 7, 2011

Page 27: Big Data

Strach z experimentůJsme příliš v zajetí sezónních prémií, placení za čas a strachu z IT bezpečnostní politiky. Neúspěch se neodpouští.

Tuesday, June 7, 2011

Page 28: Big Data

Inovace chtějí volnostGrantové projekty z MPO a podobné ve skutečnosti brzdí inovace, protože se orientují na řešení průmyslových problémů. Neřešíme myšlení out of box.

Tuesday, June 7, 2011

Page 29: Big Data

Co za to dostanete?podle analytiků McKinsey & Company a jejichBIG DATA: THE NEXT FRONTIER FOR INNOVATION,

Tuesday, June 7, 2011

Page 30: Big Data

Včasný přehledMaking big data more accessible in a timely manner.

Tuesday, June 7, 2011

Page 31: Big Data

Budeme vědět s kýmSegmenting populations to customize actions.

Tuesday, June 7, 2011

Page 32: Big Data

Přesnější rozhodováníReplacing and supporting human decision-making with automated algorithms.

Tuesday, June 7, 2011

Page 33: Big Data

Produkty, které nejsouInnovating new business models, products, and services.

Tuesday, June 7, 2011

Page 34: Big Data

... a taky dobrý pocit něčeho nového:-)

Tuesday, June 7, 2011


Recommended