Date post: | 29-Nov-2014 |
Category: |
Education |
Upload: | josef-slerka |
View: | 2,244 times |
Download: | 2 times |
Big DataJosef Šlerka, Ataxo Interactive, SNM FF UKBusiness & Information Forum 2011, Praha
Tuesday, June 7, 2011
3 000 000 000počet hledání na Googlu denně
Tuesday, June 7, 2011
30 000 000 000počet zpráv a příspěvků na Facebooku měsíčně
Tuesday, June 7, 2011
5 000 000 000mobilních telefonů po celém světě
Tuesday, June 7, 2011
140 000 000průměrný počet zpráv poslaných denně na Twitteru
Tuesday, June 7, 2011
1 000 000počet denně vygenerovných zpráv na českém Facebooku v otevřených profilech
Tuesday, June 7, 2011
600 dolarůcena disku na který se vejde veškerá hudba na světě v MP3
Tuesday, June 7, 2011
100 dolarůcena hodiny provozu klastru 10 počítačů na Amazonu
Tuesday, June 7, 2011
0 dolarůcena open-source softwarů, jako je Hadoop, Lucene,Cassandra, CouchDB, Elastich Search a dalších
Tuesday, June 7, 2011
Big (Data (Science))buzzwords, které tu s námi dlouho zůstanou
Tuesday, June 7, 2011
Co jsou to Big Data?
Big Data is a term applied to data sets whose size is beyond the ability of commonly used software tools to capture, manage, and process the data within a tolerable elapsed time. Big data sizes are a constantly moving target currently ranging from a few dozen terabytes to many petabytes of data in a single data set.
Tuesday, June 7, 2011
Co je Data Science?
A data application acquires its value from the data itself, and creates more data as a result. It's not just an application with data; it's a data product. Data science enables the creation of data products.
Tuesday, June 7, 2011
Příklady
Jaccardův index a TOEFL
Google Translate
ZIP klastrování
Tuesday, June 7, 2011
require 'zlib'require 'pp' files = Dir[ARGV[0] + '/*'] def deflate(*files) z = Zlib::Deflate.new z.deflate(files.collect {|f| open(f).read}.join("\\n"), Zlib::FINISH).sizeend pairwise = files.combination(2).collect do |f1, f2| a, b = deflate(f1), deflate(f2) both = deflate(f1, f2) {:files => [f1, f2], :score => (a+b)-both}end pp pairwise.sort {|a,b| b[:score] <=> a[:score]}[0,20]
Tuesday, June 7, 2011
Změna paradigmatu
data-driven vs. knowledge-drive (algorithm-driven)
statistické modely vs. modelování skutečnosti
Peter Norvig vs Noam Chomsky
Tuesday, June 7, 2011
Potřebné dovednosti
Drew Conway
Tuesday, June 7, 2011
Big Social Data
deep data vs. surface data
data-driven sociální a humanitní vědy
Lev Manovich: The Promises and the Challenges of Big Social Data
Tuesday, June 7, 2011
Případové studieprediktivní analýza pomocí velkých dat v praxi
Tuesday, June 7, 2011
Google a zaměstnanost
Tuesday, June 7, 2011
Twitter a burza
Tuesday, June 7, 2011
Mobily a cholera
Tuesday, June 7, 2011
Facebook a filmy
zmínky o Inception na českém Facebooku 2010 a divácký ohlas
Tuesday, June 7, 2011
Facebook a filmy
Harry Potter na českém Facebooku 2010 a divácký ohlas
Tuesday, June 7, 2011
Problémyaneb co nás brzdí u nás(podle mých omezených zkušeností)
Tuesday, June 7, 2011
Selhání vysokých školInformatika - úzké obzory, staré názory, disky už jsou levnéJava bývá dnes cesta pro lepší ukrajinské dělníky
Tuesday, June 7, 2011
Potřeba přesahuInterdisciplinarita, spolupráce polytechnik a univerzit je to, co dnes zoufale chybí, bez ní jsme jen lepší montovna.
Tuesday, June 7, 2011
Strach z experimentůJsme příliš v zajetí sezónních prémií, placení za čas a strachu z IT bezpečnostní politiky. Neúspěch se neodpouští.
Tuesday, June 7, 2011
Inovace chtějí volnostGrantové projekty z MPO a podobné ve skutečnosti brzdí inovace, protože se orientují na řešení průmyslových problémů. Neřešíme myšlení out of box.
Tuesday, June 7, 2011
Co za to dostanete?podle analytiků McKinsey & Company a jejichBIG DATA: THE NEXT FRONTIER FOR INNOVATION,
Tuesday, June 7, 2011
Včasný přehledMaking big data more accessible in a timely manner.
Tuesday, June 7, 2011
Budeme vědět s kýmSegmenting populations to customize actions.
Tuesday, June 7, 2011
Přesnější rozhodováníReplacing and supporting human decision-making with automated algorithms.
Tuesday, June 7, 2011
Produkty, které nejsouInnovating new business models, products, and services.
Tuesday, June 7, 2011
... a taky dobrý pocit něčeho nového:-)
Tuesday, June 7, 2011