Robert HavránekMicrosoft
Co přináší práce s velkými daty nejen velkým organizacímJak s nimi pracovat a jaké má řešení Microsoft
Agenda
2
• Příklady využití velkých dat nejen pro velké organizace
• Microsoft řešení
• Známé nástroje Business Intelligence
Příklady využití velkých dat nejen pro velké organizace
Terabytes
Gigabytes
Megabytes
Petabytes
KOMPLEXNOST DAT: OBJEM A RŮZNORODOST
Co jsou velká data?
Příklady využití
1.5 TB/dayInternal IT Traffic at Chevron
50,317nehod v Los
Angeles v roce 2002
$1,600/rok
US průměrné pojištění auta
100 TB/rokdat z nových sensorů TVA
až o 30%vyšší cenu
akceptují Mac uživatelé za cest. Služby od Orbitz
7.8%ztráta tržeb kvůli
opravám v provozu
ANALÝZA SOCIÁLNÍCH MÉDIÍ
Microsoft řešení
S S RS
SQL Server EE
Sensory Zařízení Stream Roboti ERP CRM LOB APPs
Windows AzureHDInsight
Service
Microsoft HDInsight Server
Konektory
Nestrukturovaná a strukturovaná data
Analýza a reporting
Microsoft řešení pro velká data
Hardware + Software zařízení
SQL Server 2012 Parallel Data Warehouse v2
• Předkonfigurovaný Hardware• Předinstalovaný Software• Nastavený Node Failover
Plug & Play Zužitkované zkušenosti
Úspora času
Nová generace škálovatelného
výkonu
Business Intelligence, BIG
DATASkvělý poměr cena/výkon
SQL Server 2012 Parallel Data Warehouse v2
Business Intelligence, BIG
DATA
Big Data s Polybase
Database
HDFS (Hadoop)
SQL Server 2012 PDW Powered by PolyBase
SQL • Jednotné dotazy; strukturovaná a nestrukturovaná data
• Odpadá mezikrok nalití dat z Hadoop do DW
• Standardní SQL jazyk a dovednosti (není potřeba učit se MapReduce)
Business Intelligence, BIG
DATA
Business Intelligence nástroje
Hadoop Data
Strukturovaná Data
• Nativní integrace BI nástrojů
• Rozšířené a známé nástroje
• (ne)strukturovaná data v jednom sešitu
Nová generace škálovatelného
výkonu
Extrémní výkon a škálovatelnost
Customer
Sales
CountrySupplier
Products
Columnstore = extrémní nárůst
výkonu• Massively Parallel
Processing (MPP) architektura
• Až 15x komprese dat
• Zpracování v paměti
• Scale out technologie – od malého řešení s několika TB až do 7 Petabytes (žádný downtime)
0TB 7 PB
AddCapacity
AddCapacity
Skvělý poměr cena/výkon
Skvělý poměr cena/výkon
Appliance s přednastaveným
HW a SW za prémiové ceny
Bez appliance si musíte vybudovat vlastní HW a
nakonfigurovat SW
Nejnižší cena Terabyte na trhu• Výrazně nižší cena než konkurence
• 2.5x nižší cena za Terabyte než předchozí verze
Cena/TB předních vendorů
Optimální hodnota
(Hardware + Software list price ) . (Compression X Performance Disk Capacity)
$/TB =
S S RS
SQL Server EE
Sensory Zařízení Stream Roboti ERP CRM LOB APPs
Windows AzureHDInsight
Service
Microsoft HDInsight Server
Konektory
Nestrukturovaná a strukturovaná data
Analýza a reporting
Microsoft řešení pro velká data
Známé nástroje Business Intelligence pro analýzu velkých dat
http://www.microsoft.com/en-us/bi/GetMicrosoftBI/TryIt.aspx
Microsoft Business Intelligence
Zdroj: Top analytical comp., Magic Quadrant for Business Intelligence Platforms, Gartner
Research, February 6, 2012.
Zdroj: Top analytical comp., Business Intelligence market revenue growth rates
Zdroj: InformationWeek Analytics 2010 BI and Information Management Survey
#1 Business Intelligence poskytovatel