+ All Categories
Home > Data & Analytics > Cz ii tt_tsne_21022017_public

Cz ii tt_tsne_21022017_public

Date post: 12-Apr-2017
Category:
Upload: grzegorz-gwardys
View: 299 times
Download: 0 times
Share this document with a friend
112
Grzegorz Gwardys, Daniel Grzywczak Wizualizacja danych wysoko-wymiarowych, czyli nie tylko trenowaniem sieci człowiek żyje
Transcript
Page 1: Cz ii tt_tsne_21022017_public

Grzegorz Gwardys, Daniel Grzywczak

Wizualizacja danych wysoko-wymiarowych, czyli nie tylko trenowaniem sieci człowiek żyje

Page 2: Cz ii tt_tsne_21022017_public

Dziękujemy za przybycie !2

https://i.ytimg.com/vi/HXZt-IlClhs/maxresdefault.jpg

Page 3: Cz ii tt_tsne_21022017_public

Jak widzimy wykład3

Page 4: Cz ii tt_tsne_21022017_public

▸ Wizualizacja Demo

▸ Cechy wysoko-wymiarowe

▸ T-SNE

Agenda4

Page 5: Cz ii tt_tsne_21022017_public

Cechy wysoko-wymiaroweRóżne podejścia

5

Page 6: Cz ii tt_tsne_21022017_public

3 Etapy

Dane

6

Cechy Wizualizacja

▸ Obrazy▸ Audio

▸ LBP▸ MFCC

▸ PCA▸ T-SNE

Page 7: Cz ii tt_tsne_21022017_public

Ekstrakcja cech

Dane

7

Cechy Wizualizacja

▸ Obrazy▸ Audio▸ Tekst

▸ LBP▸ MFCC▸ Tf-IDF

▸ PCA▸ T-SNE▸

Page 8: Cz ii tt_tsne_21022017_public

8

Po co nam cechy ?

Page 9: Cz ii tt_tsne_21022017_public

Trochę o sztucznej inteligencji 9

https://en.wikipedia.org/wiki/Waymo#/media/File:Google_driverless_car_at_intersection.gk.jpghttps://pl.wikipedia.org/wiki/Deep_Blue#/media/File:Deep_Blue.jpghttp://i.wp.pl/a/f/jpeg/27201/hal-9000-odyseja-kosmiczna-2001-kadr-robot-oko-490.jpeg

▸ 1968 - 2001: Odyseja Kosmiczna ▸ 1997 - Deep Blue ▸ 2015 - Waymo.

Page 10: Cz ii tt_tsne_21022017_public

Trochę o sztucznej inteligencji

Paradoks Moraveca:

10

Page 11: Cz ii tt_tsne_21022017_public

Reprezentacja danych11

http://3.bp.blogspot.com/-VvKAXKyrsNY/U5Ngtv21IAI/AAAAAAAAFoQ/GWrfGfA2r50/s1600/moving+in+right+direction.gif

Page 12: Cz ii tt_tsne_21022017_public

12

Page 13: Cz ii tt_tsne_21022017_public

13

© Urszula Gwardys

Page 14: Cz ii tt_tsne_21022017_public

14

Po co nam cechy ?

Page 15: Cz ii tt_tsne_21022017_public

Po co nam cechy ?15

Page 16: Cz ii tt_tsne_21022017_public

Po co nam cechy ?16

Page 17: Cz ii tt_tsne_21022017_public

Ja człowiek rozpoznaje obrazy ?17

Page 18: Cz ii tt_tsne_21022017_public

Ja człowiek rozpoznaje obrazy ?18

Page 19: Cz ii tt_tsne_21022017_public

Ja człowiek rozpoznaje obrazy ?19

https://lionstalkscience.files.wordpress.com/2015/03/color_differences.jpg

Page 20: Cz ii tt_tsne_21022017_public

Niektóre cechy obrazowe

▸ Dominant Color Descriptor

▸ Local Binary Patterns

▸ Scale-Invariant Feature Transform

20

Page 21: Cz ii tt_tsne_21022017_public

Dominant Color Descriptor

Kolor dominujący▸ wartość (przestrzeń LUV)

▸ procent zajmowanej powierzchni

▸ wariancja

21

https://lionstalkscience.files.wordpress.com/2015/03/color_differences.jpg

Page 22: Cz ii tt_tsne_21022017_public

Dominant Color Descriptor22

https://datasciencelab.wordpress.com/2013/12/12/clustering-with-k-means-in-python/http://sipl.technion.ac.il/Info/Teaching_Projects_1-1-10_e.shtml

Page 23: Cz ii tt_tsne_21022017_public

Local Binary Patterns23

http://bytefish.de/blog/local_binary_patterns/http://www.springer.com/cda/content/document/cda_downloaddocument/9780857297471-c2.pdf?SGWID=0-0-45-1153741-p174122174http://liris.cnrs.fr/Documents/Liris-5004.pdf

Page 24: Cz ii tt_tsne_21022017_public

Local Binary Patterns24

http://docs.opencv.org/2.4/_images/lbp_yale.jpg

Page 25: Cz ii tt_tsne_21022017_public

Scale-Invariant Feature Transform25

Page 26: Cz ii tt_tsne_21022017_public

Scale-Invariant Feature Transform26

Page 27: Cz ii tt_tsne_21022017_public

Scale-Invariant Feature Transform27

Page 28: Cz ii tt_tsne_21022017_public

Niektóre cechy muzyczne

▸ Zero-Crossing Rate

▸ Short-Time Fourier Transform

▸ Mel Frequency Cepstrum Coefficient

28

Page 29: Cz ii tt_tsne_21022017_public

Zero-Crossing Rate29

http://www.ifs.tuwien.ac.at/~schindler/lectures/MIR_Feature_Extraction.html

Page 30: Cz ii tt_tsne_21022017_public

Short-Time Fourier Transform30

http://isites.harvard.edu/fs/docs/icb.topic541812.files/lec12_spr09.pdf

Page 31: Cz ii tt_tsne_21022017_public

Short-Time Fourier Transform31

Page 32: Cz ii tt_tsne_21022017_public

Short-Time Fourier Transform32

http://docs.opencv.org/2.4/_images/lbp_yale.jpg

Page 33: Cz ii tt_tsne_21022017_public

Short-Time Fourier Transform33

http://paulbourke.net/miscellaneous/dft/dft0.gif

Page 34: Cz ii tt_tsne_21022017_public

Short-Time Fourier Transform34

Page 35: Cz ii tt_tsne_21022017_public

Mel Frequency Cepstrum Coefficient

▸ STFT▸ Obliczanie mocy▸ Obliczenie odpowiedzi dla filtrów

zestawu filtrów mel (zwykle 26)▸ Obliczanie DCT dla logarytmu dla

każdego filtru

35

Page 36: Cz ii tt_tsne_21022017_public

Mel-Frequency Cepstrum Coefficient36

http://practicalcryptography.com/media/miscellaneous/files/10_filt_melfb.pnghttps://pl.wikipedia.org/wiki/Mel_(skala)#/media/File:Mel-Hz_plot.svg

Page 37: Cz ii tt_tsne_21022017_public

Mel-Frequency Cepstrum Coefficient37

Page 38: Cz ii tt_tsne_21022017_public

Wszystko ?38

Page 39: Cz ii tt_tsne_21022017_public

Cechy wyuczoneCzyli ty się ucz, a ja idę na piwo

39

Page 40: Cz ii tt_tsne_21022017_public

Cechy szyte na miarę40

Page 41: Cz ii tt_tsne_21022017_public

Sieci Neuronowe

41

Page 42: Cz ii tt_tsne_21022017_public

Sieci neuronowe42

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 43: Cz ii tt_tsne_21022017_public

Sieci neuronowe43

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 44: Cz ii tt_tsne_21022017_public

Sieci neuronowe44

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 45: Cz ii tt_tsne_21022017_public

Sieci neuronowe45

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 46: Cz ii tt_tsne_21022017_public

Sieci neuronowe46

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 47: Cz ii tt_tsne_21022017_public

Sieci neuronowe47

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 48: Cz ii tt_tsne_21022017_public

Sieci neuronowe48

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 49: Cz ii tt_tsne_21022017_public

Sieci neuronowe49

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 50: Cz ii tt_tsne_21022017_public

Sieci neuronowe50

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 51: Cz ii tt_tsne_21022017_public

Sieci neuronowe51

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 52: Cz ii tt_tsne_21022017_public

Sieci neuronowe52

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 53: Cz ii tt_tsne_21022017_public

Sieci neuronowe53

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 54: Cz ii tt_tsne_21022017_public

Sieci neuronowe54

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 55: Cz ii tt_tsne_21022017_public

Sieci neuronowe55

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 56: Cz ii tt_tsne_21022017_public

Sieci neuronowe56

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 57: Cz ii tt_tsne_21022017_public

57

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Sieci neuronowe

Page 58: Cz ii tt_tsne_21022017_public

Sieci neuronowe58

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 59: Cz ii tt_tsne_21022017_public

Sieci neuronowe59

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 60: Cz ii tt_tsne_21022017_public

Sieci neuronowe60

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 61: Cz ii tt_tsne_21022017_public

Sieci neuronowe61

http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html

Page 62: Cz ii tt_tsne_21022017_public

Konwolucyjne sieci neuronowe62

http://grzegorzgwardys.ml/

Page 63: Cz ii tt_tsne_21022017_public

Filtry konwolucyjne - splot63

https://community.arm.com/cfs-file/__key/communityserver-blogs-components-weblogfiles/00-00-00-20-66/4786.conv.png

Page 64: Cz ii tt_tsne_21022017_public

Filtry konwolucyjne - splot64

Page 65: Cz ii tt_tsne_21022017_public

Filtry konwolucyjne - splot65

Page 66: Cz ii tt_tsne_21022017_public

Konwolucyjne sieci neuronowe66

https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/

Page 67: Cz ii tt_tsne_21022017_public

Konwolucyjne sieci neuronowe67

https://image.slidesharecdn.com/bdm-aprimerondeeplearning-160919151642/95/big-data-malaysia-a-primer-on-deep-learning-23-638.jpg

Page 68: Cz ii tt_tsne_21022017_public

Cechy na miarę - słabe strony68

Czy możemy nauczonych cech użyć dla innych

danych ?

https://imgflip.com/s/meme/Question-Rage-Face.jpg

Page 69: Cz ii tt_tsne_21022017_public

AlexNet69

Page 70: Cz ii tt_tsne_21022017_public

Wyszukiwanie obrazów dla na innych danych70

Page 71: Cz ii tt_tsne_21022017_public

Rozpoznawanie gatunku muzyki71

Page 72: Cz ii tt_tsne_21022017_public

Word2vec72

https://blog.acolyer.org/2016/04/21/the-amazing-power-of-word-vectors/http://arxiv.org/pdf/1411.2738v3.pdf

Page 73: Cz ii tt_tsne_21022017_public

Word2vec73

https://www.tensorflow.org/tutorials/word2vec

Page 74: Cz ii tt_tsne_21022017_public

Cechy ukryte w systemach rekomendacyjnych74

5 5 4 1 1

4 4 5 00 ?

0 ? 2 5 5

Page 75: Cz ii tt_tsne_21022017_public

Cechy ukryte w systemach rekomendacyjnych75

użyt

kow

nicy

(m)

przedmioty (n)

R macierz ocen =

użyt

kow

nicy

(m)

cechy (r)

VT macierz cech przedmiotówce

chy

(r)

przedmioty(n)

U macierz cech użytkownika

k

k

Page 76: Cz ii tt_tsne_21022017_public

Cechy Grzegorza i Star Wars76

~

.9

.9

.4

.5

.7

.9

.8

.7

.7

.9

5 5 4 1 1 .7 .8 .3 .8 .6 .7 .7 .9 .5 .6

Page 77: Cz ii tt_tsne_21022017_public

T-SNEOd intuicji do szczegółów

Page 78: Cz ii tt_tsne_21022017_public

Metoda Gradientu Prostego78

https://alykhantejani.github.io/images/gradient_descent_line_graph.gif

Page 79: Cz ii tt_tsne_21022017_public

Dla regresji liniowej79

Page 80: Cz ii tt_tsne_21022017_public

Dygresja80

Page 81: Cz ii tt_tsne_21022017_public

81

https://cdn.meme.am/cache/instances/folder304/500x/63137304.jpg

Page 82: Cz ii tt_tsne_21022017_public

PCA82

http://weigend.com/files/teaching/stanford/2008/stanford2008.wikispaces.com/file/view/pca_example.gif

Page 83: Cz ii tt_tsne_21022017_public

Czy PCA odpowiada na właściwe pytanie ?83

https://skybluetrades.net/blog/posts/2011/10/30/machine-learning/test-swiss-roll.png

Page 84: Cz ii tt_tsne_21022017_public

Stochastic Neighbour Embedding84

yiyjxi

xj

Page 85: Cz ii tt_tsne_21022017_public

Tak chcę !

85

Page 86: Cz ii tt_tsne_21022017_public

Dywergencja Kullbacka-Leiblera

▸ Duże pij modelowane przez małe qij

▸ Małe pij modelowane przez duże qij

86

Page 87: Cz ii tt_tsne_21022017_public

▸ Duże pij modelowane przez małe qij

▸ Małe pij modelowane przez duże qij

87

Dywergencja Kullbacka-Leiblera

Page 88: Cz ii tt_tsne_21022017_public

SNE - wizualizacja mnist88

http://www.uta.fi/sis/mtt/mtts1-dimensionality_reduction/drv_lecture10.pdf

Page 89: Cz ii tt_tsne_21022017_public

SNE - wizualizacja mnist89

http://www.uta.fi/sis/mtt/mtts1-dimensionality_reduction/drv_lecture10.pdf

Page 90: Cz ii tt_tsne_21022017_public

A chcielibyśmy ...90

https://indico.io/blog/wp-content/uploads/2015/08/mnist.jpg

Page 91: Cz ii tt_tsne_21022017_public

Problem Tłumu91

http://www.todayifoundout.com/wp-content/uploads/2014/11/crowd.jpg

Page 92: Cz ii tt_tsne_21022017_public

Problem Tłumu92

Skoro chcemy zachować odległość między bliższymi punktami z wyższej przestrzeni ...

Page 93: Cz ii tt_tsne_21022017_public

Problem Tłumu93

Skoro chcemy zachować odległość między bliższymi punktami z wyższej przestrzeni ...

To mniej “podobne punkty”, w niższej przestrzeni będą od siebie bardzo daleko.

Page 94: Cz ii tt_tsne_21022017_public

William Sealy Gosset94

http://vignette3.wikia.nocookie.net/beer/images/9/92/Guinness.jpg/revision/latest?cb=20130322204725 https://en.wikipedia.org

Page 95: Cz ii tt_tsne_21022017_public

t-SNE95

Wysoki wymiar: Niski wymiar:

Page 96: Cz ii tt_tsne_21022017_public

Interpretacja gradientu96

D

GF

E H

B

A

C sprężynka

Page 97: Cz ii tt_tsne_21022017_public

Interpretacja gradientu97

D

GF

E H

B

A

C sprężynka

ściskanie/rozciąganie

http://www.artandsciencegraphics.com/wp-content/uploads/Compressing-Spring.gif

Page 98: Cz ii tt_tsne_21022017_public

Interpretacja gradientu98

D

GF

E H

B

A

C sprężynka

ściskanie/rozciąganie

Suma po wszystkim ...

Page 99: Cz ii tt_tsne_21022017_public

A gdy dane są duże ?99

3x

D

GF

E H

B

A

C▸ Dlatego algorytm Barnes-Hut

▹ 1986 w Nature▹ O(n log n)▹ NASA/STI Keywords:

Computational Astrophysics ...

Page 100: Cz ii tt_tsne_21022017_public

A gdy dane są duże ?100

3x

D

GF

E H

B

A

C

A C DB E F G H

● Wystarczająco mały kawałek przestrzeni ?● Wystarczająco odległy od punktu ?

Page 101: Cz ii tt_tsne_21022017_public

t-sne - największy problem101

http://distill.pub/2016/misread-tsne/

Page 102: Cz ii tt_tsne_21022017_public

102

https://indico.io/blog/wp-content/uploads/2015/08/mnist.jpg

Przykłady wizualizacji

Page 103: Cz ii tt_tsne_21022017_public

Przykłady wizualizacji103

https://image.slidesharecdn.com/talkdatasciencemeetup-130125042944-phpapp01/95/talk-data-sciencemeetup-13-638.jpg

Page 104: Cz ii tt_tsne_21022017_public

Przykłady wizualizacji104

https://deeplearning4j.org/img/faces_tsne.jpg

Page 105: Cz ii tt_tsne_21022017_public

Przykłady wizualizacji105

http://www.frontiersin.org/files/Articles/181674/fninf-10-00009-HTML/image_m/fninf-10-00009-g008.jpg

Page 106: Cz ii tt_tsne_21022017_public

Przykłady wizualizacji106

http://nlp.yvespeirsman.be/images/glove-word-embeddings-crime-and-punishment.png

Page 107: Cz ii tt_tsne_21022017_public

Przykłady wizualizacji107

http://opensource.datacratic.com/mtlpy50/my_redditmap.png

Page 108: Cz ii tt_tsne_21022017_public

Kodzik t-sne108

https://www.youtube.com/watch?v=yQsOFWqpjkE

Page 109: Cz ii tt_tsne_21022017_public

Kodzik t-sne109

https://www.youtube.com/watch?v=yQsOFWqpjkE

Page 110: Cz ii tt_tsne_21022017_public

O czym sobie nie powiedzieliśmy110

https://image.slidesharecdn.com/dimensionalityreduction-140129163722-phpapp02/95/visualization-using-tsne-2-638.jpg


Recommended