Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5...

30
Ανάκτηση πολυμεσικού περιεχομένου Ανάκτηση πολυμεσικού περιεχομένου Τμήμα Επιστήμης Υπολογιστών ΗΥ-474 Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση φωνής / μουσικής

Upload: others

Post on 04-Oct-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

Ανάκτηση πολυμεσικού περιεχομένουΑνάκτηση πολυμεσικού περιεχομένου

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ανίχνευση / αναγνώριση προσώπωνΑνίχνευση / ανάγνωση κειμένουΑνίχνευση αντικειμένωνΟπτικές λέξειςΔεικτοδότησηΣχέσεις ομοιότητας

Κατηγοριοποίηση ειδών μουσικήςΔιάκριση φωνής / μουσικής

Page 2: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

2

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Page 3: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

3

Ανάκτηση περιεχομένου στον πραγματικό κόσμοΑνάκτηση περιεχομένου στον πραγματικό κόσμο

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Πρόθεση χρήσης : περιήγηση, κατηγορία, τεκμήριο

Πεδίο δεδομένων : προσωπική συλλογή, ειδικού αντικειμένου,αρχεία, Παγκόσμιος Ιστός

Τρόπος ερώτησης : λέξεις-κλειδιά, κείμενο, λόγος, εικόνα, σκίτσο

W. Zhou, H. Li and Q. Tian, Recent Advance in Content-based Image Retrieval: A Literature Survey, Arxiv, Sept.2017

Page 4: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

4

Σχήματα αναζήτησης περιεχομένου : χρήστηςΣχήματα αναζήτησης περιεχομένου : χρήστης

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Page 5: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

5

Σχήματα αναζήτησης περιεχομένου : χρήστηςΣχήματα αναζήτησης περιεχομένου : χρήστης

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

W. Zhou, H. Li and Q. Tian, Recent Advance in Content-based Image Retrieval: A Literature Survey, Arxiv, Sept.2017

Page 6: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

6

Μέτρα ομοιότητας / μάθησηΜέτρα ομοιότητας / μάθηση

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Συμφωνία με τη σημασιολογίαΑντοχή στο θόρυβοΥπολογιστική επίδοσηΚλίμακα αντικειμένουΙδιότητες απόστασης

Ομαδοποίηση (ιεραρχική, συσσωρεύσεις, μίξεις)

Ταξινόμηση

Page 7: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

7

Ανίχνευση προσώπων : χρώμαΑνίχνευση προσώπων : χρώμα

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ανίχνευση χρώματος δέρματος

Page 8: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

8

Ανίχνευση προσώπων : υφήΑνίχνευση προσώπων : υφή

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ανάλυση σεζώνες συχνοτήτων

Page 9: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

9

Ανίχνευση προσώπων Ανίχνευση προσώπων Τμήμα Επιστήμης Υπολογιστών

ΗΥ-474

Page 10: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

10

Ανίχνευση προσώπων : μάθησηΑνίχνευση προσώπων : μάθηση

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Άνοιξη 2016 10

Εξαγωγήχαρακτηριστικών

με μάθηση

Συνελικτικόνευρωνικό δίκτυο

Page 11: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

11

Αναγνώριση προσώπωνΑναγνώριση προσώπων

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ανάλυση σε ζώνες συχνοτήτων (διακριτός κυματιδιακός μετασχηματισμός)

Εντοπισμός χαρακτηριστικών Ευθυγράμμιση

Ιδιοπρόσωπα

Page 12: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

12

Αναγνώριση προσώπωνΑναγνώριση προσώπων

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Page 13: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

13

Εντοπισμός και αναγνώριση κειμένουΕντοπισμός και αναγνώριση κειμένου

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

εξαγωγή από το φόντο

ανάλυση περιοδικότητας

ανίχνευση ακμών

αποτέλεσμα

αρχική εικόνα

ομαδοποίηση

Page 14: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

14

Εντοπισμός και αναγνώριση κειμένουΕντοπισμός και αναγνώριση κειμένου

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Page 15: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

15

Ανίχνευση αντικειμένωνΑνίχνευση αντικειμένων

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ανάλυση / Στατιστική μοντελοποίηση / Εκπαίδευση

Page 16: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

16

Περιγραφείς περιεχομένουΠεριγραφείς περιεχομένου

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Χαμηλού επιπέδου (χρώμα, υφή, σχήμα) MPEG-7

Τοπικά χαρακτηριστικά αναλλοίωτασε γεωμετρικούς μετασχηματισμούς

Page 17: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

17

Τοπικά χαρακτηριστικά (πολλαπλές κλίμακες)Τοπικά χαρακτηριστικά (πολλαπλές κλίμακες)

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

D. Lowe, Distinctive image features from scale-invariant keypoints, Int. Journal on Computer Vision, 2004

√2 σ

2√ 2σ

σ

4 σ

s√2

s+3φίλτρα

2σκλίμακα

Τοπικά μέγιστα / ελάχιστα (γωνίες)

Ανίχνευση σημείων-κλειδιάΚατεύθυνση κλίσης

Κατασκευή πυραμίδαςπολλαπλής ανάλυσης Gauss

Page 18: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

18

Τοπικά χαρακτηριστικά (πολλαπλές κλίμακες)Τοπικά χαρακτηριστικά (πολλαπλές κλίμακες)

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Διαλογή

Page 19: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

19

Περιγραφή χαρακτηριστικών σημείωνΠεριγραφή χαρακτηριστικών σημείων

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ιστόγραμμα κλίσης

Μπλοκ 16x16 γύρω από κάθε χαρακτηριστικό σημείοΥποδιαίρεση σε 16 υπο-μπλοκ μεγέθους 4x4Για κάθε υπο-μπλοκ υπολογίζεται το ιστόγραμμα κατευθύνσεων της κλίσηςΣχηματίζεται διάνυσμα 8x4x4=128 τιμών που συνιστά την περιγραφή

D. Lowe, Distinctive image features from scale-invariant keypoints, Int. Journal on Computer Vision, 2004

Page 20: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

20

Κινητές συσκευέςΚινητές συσκευές

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

B. Girod et al., Mobile visual search, IEEE Signal Processing Magazine, 2011

Page 21: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

21

Κινητές συσκευές : συμπιεσμένο ιστόγραμμα κλίσηςΚινητές συσκευές : συμπιεσμένο ιστόγραμμα κλίσης

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Υπολογισμός της κλίσης σε σημεία-κλειδιά

B. Girod et al., Mobile visual search, IEEE Signal Processing Magazine, 2011

Page 22: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

22

Χαρτοφύλακας οπτικών λέξεωνΧαρτοφύλακας οπτικών λέξεων

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Βασισμένος σε χαρακτηριστικά SIFT (α) για αντικείμενο ή (β) για πλαίσιο από βίντεοΟμαδοποίηση χαρακτηριστικών SIFT για σχηματισμό οπτικών λέξεων περιγραφής αντικειμένου ή πλαισίουΔιανυσματικός κβαντισμός για τη δημιουργία κωδικών λέξεων (βιβλίο)Η ομαδοποίηση και η αντιστοίχιση ενός μεγάλου αριθμού περιγραφέων SIFT συνιστά υπολογιστική πρόκλησηΟι οπτικές λέξεις είναι πλούσιες σε ενθυλάκωση βασικών οπτικών χαρακτηριστικών, παρά την αναπόφευκτη αβεβαιότηταΈνα μικρό σε μέγεθος βιβλίο κωδικών λέξεων μπορεί να έχει περιορισμένη διακριτική ισχύ για μεγάλες βάσεις εικόνων και βίντεο.Ένα μεγάλο σε μέγεθος βιβλίο κωδικών λέξεων έχει επίσης προβλήματα, επειδή όμοια χαρακτηριστικά μπορεί να κβαντιστούν σε διαφορετικές κωδικές λέξεις.

Page 23: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

23

Ανάκτηση εικόνων : μάθησηΑνάκτηση εικόνων : μάθηση

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Νευρωνικό δίκτυο

Μάθηση μετά από εκπαίδευση αναπαράσταση περιεχομένου κριτήριο ομοιότητας (κατηγορίες)

Γεφύρωση του σημασιολογικού κενού

Προκαταρκτική εκπαίδευση δικτύου σε μεγάλη βάση δεδομένων

Προσαρμογή του δικτύου σε ορισμένες κατηγορίες

Page 24: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

24

Δεικτοδότηση Δεικτοδότηση

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Αραιός πίνακας : οι γραμμές αντιστοιχούν σε εικόνες και οι στήλες υποδηλώνουν οπτικές λέξειςΣε μια ανάκτηση, ελέγχονται μόνο εκείνες οι εικόνεςπου έχουν κοινές οπτικές λέξεις με την εικόνα του ερωτήματος

Κατακερματισμός του χώρου των χαρακτηριστικών, ώστε να βρίσκονται σε κοντινές περιοχές του χώρου όμοιες εικόνεςΤα μεγάλης διάστασης χαρακτηριστικά κωδικοποιούνται σεχαμηλής διάστασης δυαδικούς κώδικες γιααποτελεσματική αναζήτηση ομοιότηταςΣημασιολογικά παρόμοια δεδομένα πρέπει να έχουν κοντινούς δυαδικούς κώδικες

Page 25: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

25

Δεικτοδότηση / αναζήτησηΔεικτοδότηση / αναζήτηση

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ιεραρχικό δένδρο λεξιλογίουΨηφοφορία για το ευρετήριο

B. Girod et al., Mobile visual search, IEEE Signal Processing Magazine, 2011

Page 26: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

26

Γεωμετρική επαλήθευσηΓεωμετρική επαλήθευση

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Αντιστοίχιση συμβατή με μοντέλο (στερεού) γεωμετρικού μετασχηματισμού

B. Girod et al., Mobile visual search, IEEE Signal Processing Magazine, 2011

Page 27: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

27

Απόσταση χαρακτηριστικώνΑπόσταση χαρακτηριστικών

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ομοιότητα εικόνων

Συχνότητα χαρακτηριστικού (Term frequency)

Ανεστραμμένη συχνότητα αρχείου(Inverse document frequency)

log ( Nnt

)

Βαρύτητα οπτικών λέξεων

Page 28: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

28

Ταξινόμηση μουσικής σε είδηΤαξινόμηση μουσικής σε είδη

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Αναζήτηση βασισμένη σε : κείμενο, σύνοψη, παράδειγμα, μουσικό κομμάτιΔιερεύνηση σε μουσικά αρχεία

H. Blume et al., Huge music archives on mobile devices, IEEE Signal Processing Magazine, 2011.

Page 29: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

29

Εξαγωγή χαρακτηριστικών μουσικήςΕξαγωγή χαρακτηριστικών μουσικής

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474

Ρυθμός αλλαγής προσήμου

Συντελεστές συχνότητας

Θεμελιώδης συχνότητα

Page 30: Ανάκτηση πολυμεσικού περιεχομένουhy474/lectures/retrieval.pdf · 5 Σχήματα αναζήτησης περιεχομένου : χρήστης Τμήμα

30

Διάκριση φωνής / μουσικήςΔιάκριση φωνής / μουσικής

Τμήμα Επιστήμης ΥπολογιστώνΗΥ-474