abstract algorithms

15
IONIO ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΤΕΧΝΩΝ ΗΧΟΥ & ΕΙΚΟΝΑΣ Εργασία Μαθήματος: Τεχνικές Σύνθεσης Ήχου Αφηρημένοι Αλγόριθμοι & Μέθοδοι Καταγραφής Τρυφωνίδης Ευγένιος Α.Μ ΤΧ 200670 Κέρκυρα 2011

Upload: eugene-trifonides

Post on 06-Mar-2015

58 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Abstract Algorithms

IONIO ΠΑΝΕΠΙΣΤΗΜΙΟΤΜΗΜΑ ΤΕΧΝΩΝ ΗΧΟΥ & ΕΙΚΟΝΑΣ

Εργασία Μαθήματος: Τεχνικές Σύνθεσης Ήχου

Αφηρημένοι Αλγόριθμοι&

Μέθοδοι Καταγραφής

Τρυφωνίδης Ευγένιος Α.Μ ΤΧ 200670

Κέρκυρα 2011

Page 2: Abstract Algorithms

Περιεχόμενα

Πρόλογος 3

Περίληψη 3

Εισαγωγή 3

Ανάλυση 4

Σύνθεση FM 4

Waveshaping Σύνθεση 6Αλγόριθμοι Karplus-Strong 7Δειγματοληπτική Σύνθεση 9

Κοκκώδη (Granular) Σύνθεση 11

Ασύγχρονη Κοκκώδη Σύνθεση 12Επίλογος

Σύγχρονη Κοκκώδη Σύνθεση Τονικού ύψους 13

Επίλογος 14

Βιβλιογραφία 15

Page 3: Abstract Algorithms

Πρόλογος

Σαν προγόνους της μουσικής με Η/Υ μπορούν να θεωρηθούν οι πειραματισμοί του Milhaud, Hindemith και του Toch, με φωνογράφους που έπαιζαν σε διαφορετικές ταχύτητες σε εκδήλωση πίσω στην δεκαετία του 1920. Το 1950 ο Pierre Schaeffer ίδρυσε το στούντιο συγκεκριμένης μουσικής στο Παρίσι (Studio de Musique Concrete). Σε αυτό το στούντιο ο συνθέτης εργαζόταν με στοιχεία ήχου από εγγραφές ή άλλους πραγματικούς ήχους. Η ανάλυση συγκεκριμένων διαδικασιών για την παραγωγή μουσικών θεμάτων βοηθάει να καταλάβουμε πως και η μουσική είναι μια από τις επιστήμες που εμπεριέχει και όλες τις άλλες όπως φυσική,μαθηματικά ακόμη και φιλοσοφία. Οι Η/Υ θεωρούνται πια κυρίαρχο μέσο για την παραγωγή μουσικής και ήχων. Από τα πολλά λογισμικά που υπάρχουν εμπορικά και μη και που τα περισσότερα δεν εφαρμόζουν μόνο ένα τρόπο σύνθεσης μουσικής αλλά μπορεί και όλους. Εξαρτάτε τότε από το χρήστη πιο από αυτά θα χρησιμοποιήσει.

Περίληψη

Σε αυτήν την εργασία λοιπόν θα επικεντρωθώ στους αφηρημένους αλγορίθμους και συγκεκριμένα στην σύνθεση FM, στην σύνθεση κυματομορφών και τον αλγόριθμο Karplus-Strong, σύνθεση με δείγματα ήχων (Sample Synthesis) και τέλος την Granular. Τα κύρια στοιχεία μας είναι οι γεννήτριες ήχου ή άλλα σήματα εισόδου όπως φυσική και επεξεργασμένοι ήχοι, οι οποιεσδήποτε επεξεργασίες ήχου που μπορεί να υποστεί ένα σήμα ή ένας ήχος μετά από την είσοδο του, π.χ φίλτα,envelopes,time-stretching,pitch-shifting και πάρα πολλά άλλα. Μαθηματικές μετατροπές όπως ο κατά Fourier μετασχηματισμός είναι χρησιμότατες διαδικασίες.

Εισαγωγή

Η ψηφιακή σύνθεση και οι μέθοδοι που αναπτύσσονται στην ανάλυση αυτής της εργασίας είναι αλγόριθμοι (βήμα προς βήμα διαδικασίες υπολογισμού) που στοχεύουν στην παραγωγή ρεαλιστικών ήχων σε πραγματικό χρόνο. Στον μουσικό προγραμματισμό έχουμε σήματα εισόδου που επεξεργάζονται και ελέγχονται από το χρήση. Στη παρούσα εργασία προσπαθώ να αναλύσω την κάθε μέθοδο που παραθέτω. Σαν στόχο επίσης έχω ο αναγνώστης να κατανοήσει και να διαλέξει την μέθοδο που χρησιμοποιήσει στη πράξη για κάποια σύνθεση του.

Οι μέθοδοι που αναλύονται οι αφαιρετικών αλγορίθμων, ή Fm σύνθεση, η wavetable σύνθεση και ο αλγόριθμος Karplus-Strong. Και στην συνέχεια οι μέθοδοι εγγραφής sampling και κοκκώδης σύνθεση.

3

Page 4: Abstract Algorithms

Ανάλυση

FM Σύνθεση με διαμόρφωση Συχνότητας (Frequency modulation)

Είναι μια θεμελιώδης σύνθεση ψηφιακού ήχου μη γραμμικής συμπεριφοράς από γεννήτριες ήχου. Σαν θεωρία η διαμόρφωση Συχνότητας καθιερώθηκε από της μέσα του 1920 για να μεταφέρει τα ράδιο σήματα FM. Αυτός ήταν και ο λόγος που δεν μελετήθηκε παραπάνω.(Tero Tolonen 1998,3) Το 1967 ο John Chowning στο Πανεπιστήμιο του Stanford αφού μελέτησε πολύ πάνω στη διαμόρφωση συχνότητας ανακάλυψε τον αλγόριθμο αυτής της διαμόρφωσης. Στη διαμόρφωση συχνότητας το πλάτος του σήματος παραμένει σταθερό ενώ η συχνότητα διαμορφώνετε από το εύρος του σήματος διαμόρφωσης, δηλαδή από ένα άλλο σήμα. Στο σχήμα παρακάτω βλέπουμε ένα απλό μουσικό όργανο που θα αναλύσουμε μαθηματικά. Η έξοδος μας y(n) εκφράζετε λοιπόν μαθηματικάαπό την εξίσωση

y(n) = A(n)sin[2pfcn+I sin(2πfmn)]

όπου: Α(n) το πλάτος fc η φέρουσα συχνότητα, Ι (σταθερά) δείκτης διαμόρφωσης και fm η συχνότητα με την οποία θα μεταβάλουμε το σήμα (συχνότητα διαμόρφωσης. Το Ι αντιπροσωπεύει τον λόγο του μεγίστου σημείου της κυματομορφής κατά την διαμό-ρφωση Όταν το Ι = 0 τότε η έξοδος είναι το η-μιτονοειδές σήμα y(n) = A(n) sin (2πfcn) που αντιστοιχεί σε μηδέν διαμόρφωση. Αναλύοντας περισσότερο το σήμα σύμφωνα με τον (Chowning 1973, De Poli 1983) παίρνουμε τηνεξίσωση.

Όπου Jk η διαφορική εξίσωση του Bessel με δείκτη Κ γνωστή και ως κυλινδρική αρμονική καθώς εμφανίζετε στην λύση των εξισώσεων Laplace. Εξετάζοντας την εξίσωση βλέπουμε πως η συχνότητα του σήματος μας στην έξοδο y(n) εξαρτάτε από την μέγιστη συχνότητα του σήματος μας μέσα στην κυματομορφή Fc καθώς και τις επιμέρους ακρότατες συχνότητες.

Όπου fn η παραμετρικές συχνότητες που είναι ένα μέρος της ενέργειας της φέρουσας συχνότητας Fc. Σε σχηματική απόδοση στη διάσταση όχι του χρόνου μα της συχνότητας εφαρμόζοντας την παραπάνω εξίσωση βλέπουμε πόσο από το σήμα υπάρχει στην κάθε συχνότητα. Και έτσι το αρμονικό φάσμα δημιουργείται από το λόγος της φέρουσας συχνότητας προς το συχνότητα διαμόρφωσης. (Tero Tolonen 1998,4-5)

Page 5: Abstract Algorithms

Στην απλή διαμόρφωση συχνότητας ο λόγος του πλάτος των αρμονικών της κύριας συχνότητας δεν είναι σταθερός όταν η σταθερά Ι μεταβάλετε. Για την λύση και την εξομάλυνση του σήματος χρησιμοποιούμε ανατροφοδότηση του σήματος εξόδου στην είσοδο δεύτερης διαμόρφωσης και μετά με σύγκρισή παίρνουμε το τελικό διαμορφωμένο σήμα. Αυτή η μέθοδος σύνθεσης υπήρξε κυρίαρχη για χρόνια, με γνωστά εμπορικά synthesizers το DX7 και το Korg Ds-8 αλλά και σε εικονικά syths modules χειριζόμενα από midi keyboards και πληκτρολόγια, όπως το Octapus,Fm7 Toxic. H βασική αρχή είναι αυτή που βλέπουμε στην διπλανή εικόνα όπου μία γεννήτρια ήχου με συχνότητα 329.6Hz στέλνει το σήμα της σε μια δεύτερη με λόγο 1:1 και τρεις οκτάβες κάτω και έχουμε το σήμα διαμορφωμένο στην έξοδο. Σε επίπεδο προγραμματισμού τώρα στην εποχή μας και μέσα από το SuperColliderFm synthesis. Αναλύοντας το παράδειγμα από τα βοηθήματα του προγράμματος έχουμε:(SynthDef("fmeGe", { arg bus = 0, freq = 440, carPartial = 1, modPartial = 1, index = 3, mul = 0.05; // φτιάχνουμε ένα SynthDef και το ονομάζουμε όπως θέλουμε και του δίνουμε // παραμέτρους το Ι η σταθερά παίρνει συνήθως τιμές από 0 μέχρι 24 // carPartial :: modPartial => λόγος του φέροντος προς το σήμα με το οποίο θα //διαμορφώσουμε.

var mod; var car;// δήλωση μεταβλητών mod και car mod = SinOsc.ar(freq * modPartial, 0, freq *index*LFNoise1.kr(5.reciprocal).abs);

Page 6: Abstract Algorithms

// το σήμα διαμόρφωσης είναι ένα μια γεννήτρια ημιτονοειδές που η συχνότητα //της μεταβάλετε από την παράμετρο modPartial που στο παράδειγμα μας είναι // 1 ενώ η έτναση της είναι η συχνότητα 440 επί το Ι * ένα Low Frequency //Noise control σημα.car = SinOsc.ar((freq * carPartial) + mod, 0, mul);// ενώ το φέρον σήμα είναι πάλι μια ημιτονοειδές γεννήτρια ήχου με //συχνότητα την 440 * την παράμετρο του φέροντος σήματος + την παραπάνω //μεταβλητή modOut.ar(bus,car)}).load(s);)// κάνουμε compile το κόκκινο μέρος (μέχρι εδώ δηλαδή) και φορτώνουμε το //SynthDef στον local server. (Synth("fmeGe", [\bus, 0, \freq, 440, \carPartial, 1, \modPartial, 2.4]);Synth("fmeGe", [\bus, 1, \freq, 446, \carPartial, 1, \modPartial, 3.401]);)// και εδώ καθώς κάνουμε compile τις μπλε γραμμές ακούμε τους δύο ήχους με //διαφορά φάσης 6 herz καθώς η 446 είναι η εντονότερη συχνότητα σε ένταση //3.401

Waveshaping Synthesis

Είναι γνωστή και ως μη γραμμική παραμόρφωση, που αποτελείτε από μια ομάδα τεχνικής σύνθεσης ήχων που διαμορφώνει υπάρχοντες ήχους σε πιο πολύπλοκες μορφές ήχων με την χρήση μη γραμμικών ηλεκτρονικών κυκλωμάτων ή μαθηματικά. Αυτός ο τύπος σύνθεσης μπορεί να παράγει ήχουνς με πλουσιότερο φάσμα συχνοτήτων από την προηγούμενη FM. Ο τρόπος με τον οποίο επιτυγχάνουμε αυτό το είδος σύνθεσης είναι με το waveshaper , που στην πιο απλή του μορφή είναι ένα σήμα εισόδου x(t) που περνάει μέσα από ένα κουτί που περιέχει μια waveshaping εξίσωση ή εξίσωση μεταφοράς, ονομαζόμενη waveshaper w(x). H συνάρτηση μεταφοράς τις περισσότερες φορές δεν είναι γραμμική και αλλάζει το σχήμα τις εισόδου για να παράγει την έξοδο y(t). (Tero Tolonen 1998, 6) Σε επίπεδο προγραμματισμού εγώ θα τον ονόμαζα προγραμματισμό δομών,ή αρχιτεκτονική δομή ήχων. Αυτό που κάνουμε με προγράμματα όπως το Max MSP ή το reaktor και πολλά άλλα είναι να δομούμε το w(x). Χαρακτηριστικό του τη κάνει waveshaper φαίνεται στο διπλανό σχήμα

Η επιτυχία ενός μουσικού οργάνου με αυτόν το τρόπο σύνθεσης εξαρτάτε από την επιλογή της κατάλληλης συνάρτησης μεταφοράς. Με τον σχεδιασμό της συνάρτησης μεταφοράς είναι ένας τρόπος για πειραματισμό με την σύνθεση waveshaping αλλά δύσκολα μπορείς να προβλέψεις αποτελέσματα συστηματικά.

Page 7: Abstract Algorithms

Υπάρχουν βέβαια διάφορα εργαλεία για να φτιαχτούν κυματομορφές μέσα από μαθηματικές πράξεις που επιτρέπουν μέχρι ένα σημείο να προβλέψουμε τα αποτελέσματα παράδειγμα πολυώνυμα και τριγωνομετρικές πράξεις.

Τα πολυώνυμα Chebyshev που είναι πολυώνυμα τάξης ν και είναι σημαντικά για την θεωρεία της σχετικότητας καθώς η ρίζα αυτών των πολυωνύμων χρησιμοποιείτε ως κόμβος στα πολυώνυμα Interpolation. Αυτά τα πολυώνυμα έχουν χρησιμοποιηθεί ευρέος στην σύνθεση αυτή που αναλύουμε. Αυτό γιατί το κάθε πολυώνυμο παράγει μια διαφορετική αρμονική του σήματος εισόδου, έτσι ένα φάσμα από πολλαπλές αρμονικές μπορεί να παραχθεί από την πρόσθεση πολλών Chebyshev πολυωνύμων ένα για κάθε αρμονική.

Αυτή η τεχνική είναι είναι γνωστή και ως ταίριασμα φασματικών συχνοτήτων (Spectral matching) γιατί χρησιμοποιήθηκε για να μιμηθεί τα ακουστικά μουσικά όργανα. Οι αρμονικές κάθε θεμελιώδους συχνότητας μπορεί να αναπαρασταθεί μέσω πολυωνύμου, έχοντας λοιπόν ένα συν ημιτονοειδές σήμα το Chabychev πολυώνυμο του θα είναι:

όπου Τ το αρμονικό στοιχείο. Το κ αντιπροσωπεύει την αρμονική με κ=1 την θεμελιώδη κ=2 την οκτάβα. Για να λειτουργήσει το παραπάνω πρέπει το χ να είναι συνημίτονο. Με την χρήση αυτών είναι εφικτό να προσθέσουμε αρμονικές σε ένα συνημίτονο δίνοντας μόνο την αρχική συχνότητα δίχως να έχουμε επιπλέον γεννήτριες ήχου. Παράδειγμα:

x = cos(θ)

Tk(x)= cos (k*θ)

Τθ(x) = cos (0*θ)=1

Τ1(x) = cos (1*θ) = cos (θ) = x

T2(x) = cos (2*θ) = 2* x2 -1

Τ3(x) = 4 * x 3 - 3 *x

Αλλαγές στο πλάτος του σήματος εισόδου μπορούμε να δημιουργήσουμε πολλές διαφορετικές κυματομορφές. Για το λόγο αυτό το αυτός ο τρόπος σύνθεσης είναι πολύ βολικός για να συνθέσουμε ήχους, έχοντας τόσες πολλές επιλογές με εργαλεία στο επίπεδο του χρόνου. (Park 2011,88-90)

Αλγόριθμος Karplus-Strong Το 1983 ο Alexander Strong βρήκε τον αλγόριθμο ενώ Kevin Karplus έκανε πρώτος ανάλυση το πως λειτουργεί, αυτός ο αλγόριθμος που παράγει υψηλής ποιότητας σήματος εγχόρδων και κρουστών ήχων. Ο KS είναι μια επέκταση της κυματικής σύνθεσης (wavetable) όπου το ηχητικό σήμα περιοδικά διαβάζετε από τις μνήμες ενός Η/Υ.(Tero Tolonen 1998,7) Κάνει βρόχο όχι μόνο κατά την διάρκεια sustain (το σημείο όπου ο ήχος φθίνει) αλλά διαμορφώνει το σήμα και πρίν την έξοδο. Αυτό επιτυγχάνετε με φίλτρα χαμηλών βαθμίδας. Με ένα φίλτρο που αφήνει της χαμηλές συχνότητες, υψηλής πιστότητας ήχοι εγχόρδων και κρουστών μπορούν να παραχθούν.(Trautmann et al 2003,13)

7

Page 8: Abstract Algorithms

Καθώς οι τιμές της εξόδου περνάνε μέσα από ένα είδος τροποποίησης, τα αποτελέσματα επανατοποθετούνται στην αριστερή μεριά όπως φαίνεται στο διπλανό σχήμα. Η απλούστερη τροποποίηση ένα μέρος του αρχικούσήματος στο με ένα προηγούμενο, με κεντρική λειτουργία ένα φίλτρο χαμηλών συχνοτήτων. Το αρχικό μαςσήματα είναι αυτό από μια γεννήτρια θορύβου.( Roads 1996,293-294)Δίχως την αλλαγή του σήματος(decay part) το φίλτρο χαμηλών συχνοτήτων δηλαδή η κυματομορφή μας (στη θεωρία) θα έχει ίσο αρμονικό περιεχόμενο με το μισό του συχνοτήκου δείγματος που πήραμε εξ αρχής, και το τέμπο θα είναι σαν από αυλό (Karplus and Strong 1983). Σαν εξάσκηση θα μπορούσαμε να φορτώνουμε το σετ μας με νέες διαφορετικές τιμές για κάθε νότα, αυτό θα δώσει μια διαφορετική αρμονική δομή. Για να φτιάξουμε ήχους που έχουν δομή κρουστών χρησιμοποιούμε πιο περίπλοκα κυκλώματα στην ανατροφοδότηση του σήματος εισόδου. Το τέμπο ελέγχετε από μια τιμή πιθανοτήτων μια παράμετρο δηλαδή που την συμβολίζουμε με το γράμμα b και ονομάζετε (blend factor) και πέρνει τιμές από 0 έως 1. Έτσι ο αλγόριθμος παίρνει την μορφή του παρακάτω σχήματος (Roads 1998, 294-195).

και η σχέσεις που την διέπουν:

όπου t είναι ο δείκτης του τρέχοντος σήματος μας και p το μέγεθος του wavetable.

8

Page 9: Abstract Algorithms

Δειγματοληπτική Σύνθεση (Sampling Synthesis)

Στη μέθοδο αυτή χρησιμοποιούνται δήγματα ήχου κομμάτια από 50 msec όπου και το ανθρώπινο αυτί αντιλαμβάνεται τον ήχο, μέχρι όσο θέλουμε. Τα ψηφιακά μουσικά όργανα επίσης ονομάζονται samplers, και τυπικά χρησιμοποιούνται για να κάνουν pitch shifting, looping ή άλλες τροποποιήσεις του αρχικού ηχητικού σήματος (Borin et al., 1997b). Η ιστορία αυτού του τρόπου σύνθεσης ξεκινά βέβαια πίσω στο 1920 καταρχήν για να εξυπηρετήσει σκοπούς της τηλεφωνίας και μετέπειτα με τις μαγνητικές ταινίες ηχογράφησης που επέτρεπαν μοντάζ. Το 1950 ο Pierre Schaeffer (Roads,1995). Ο τρόπος σύνθεσης αυτός χωρίζετε σε δύο τρόπους αφαιρετική σύνθεση η προσθετική: Αφαιρετική Σύνθεση

Η πλειοψηφία των αναλογικών synthesizers χρησιμοποιούν αυτό τον τρόπο σύνθεσης. Βασίζετε στην αρχή πως κάθε πραγματικό όργανο μπορεί να χωριστεί σε τρία διαφορετικά κομμάτια : την πηγή του ήχου τον διαμορφωτή και κάποιους ενδιάμεσους ελέγχους (controls) όπως φαίνεται στο παρακάτω σχήμα.

Η πηγή του ήχου που βασίζετε σε μαθηματικά που υπάρχουν και εδώ δύο τύπου:κυματομορφές και τυχαία επιλογή ήχου. Οι κυματομορφές αναφέρονται σύμφωνα με τον τύπο τους σε: Πριονωτού (Sawtooth), Τετραγωνικού (square), Παλμικού (Pulse), Ημιτονοειδές (Sine), Τριγωνικού (triangle), αυτές είναι και οι πιο κοινές. Οι τυχαίες κυματομορφές παράγουν θόρυβο, που περιέχει περιοδικά και εναλλασσόμενα συχνότητες από όλο το φάσμα. Γεννήτριες ήχου που για την παραγωγή σημάτων με αφηρημένη σύνθεση κανονικά παράγουν μερικές επαναλαμβανόμενες κυματομορφές, ενώ η συχνότητα τους χρειάζεται να ελέγχετε από την τάση και όχι από το ρεύμα. Γεννήτριες που ελέγχουν την τάση βλέπε VCO όπως επίσης φίλτρα και envelopes. (Russ 2008,106-107) Στον μουσικό προγραμματισμό με το SuperCollider μπορούμε πραγματικά να κάνουμε άπειρα πράγματα. Παράδειγμα.{RPLF.ar(PinkNoise.ar,351,0,0.1)}.play; όπου για να κόψουμε κάποιες συχνότητες χρησιμοποιούμε φίλτρα όπως το RPLF που είναι ένα φίλτρο χαμηλών συχνοτήτων που κόβει όλες τις συχνότητες που είναι μεγαλύτερες από 351Hz σε πηγή ενός Ροζ θορύβου. Ενώ στο παρακάτω παράδειγμα χρησιμοποιούμε μια άλλη τακτική όπου ενισχύουμε κάποιες συχνότητες από κάποιες άλλες χωρίς να κόβουμε τίποτα, με

Page 10: Abstract Algorithms

την χρήση και πάλι μιας γεννήτριας Ροζ θορύβου. { Klank.ar(`[[220, 657, 893, 1211], nil, [1, 1, 1, 1]],PinkNoise.ar(0.01))}.play;

Προσθετική Σύνθεση (additive)

Θεωρείτε από της πιο εύκολες μορφές σύνθεσης καθώς είναι το αντίθετο της Fourier ανάλυσης ενός σήματος, καθώς για να συνθέσουμε περιοδικά κύματα, εφαρμόζουμε τον κατά Fourier μετασχηματισμό στο σωστό πλάτος και τα ενώνουμε.(Benson 2007, 269) Μπορεί να πραγματοποιηθεί με κυματομορφές λιγότερο στοιχειώδης από ένα ημιτονοειδές σήμα, για παράδειγμα, ομάδες από ημιτονοειδής στοιχεία δηλαδή κομμάτια από πολλά ημιτονοειδές κυματομορφές (Kleczkowski, 1989). Τα κρουστά συχνά περιέχουν κύματα δόνησης, είναι πάντως ευκολότερο να προσομοιώσεις το επιθυμητό σου σήμα σαν θορυβοηδές (noiselike) σήμα παρά να χρησιμοποιήσεις πολλά ημιτονοειδές (Risset, 1969).

10

Page 11: Abstract Algorithms

Στο μουσικό προγραμματισμό και συγκεκριμένα στο SuperCollider ένας απλός τρόπος για να καταλάβουμε την προσθετική σύνθεση είναι αυτός της σύνδεσης δύο ημιτονοειδών σημάτων. { SinOsc.ar(341,0,0.2) + (SinOsc.ar(353,0,0.1)}.scope.play;Αλλά και με τον πιο εύκολο τρόπο. {SinOsc.ar([341,353],0,0.2)}.scope.play;Ενώ ένα πιο σύνθετο παράδειγμα που στην αρχή κάνει την πρόσθεση δέκα τόνων μιας αρμονικής σειράς που ξεκινά με την συχνότητα 348Ηz.({var fundamental;fundamental = 348;

Mix.new(Array.fill(10, {arg counter;SinOsc.ar(freq: fundamental * (counter + 1),mul: 1/(counter + 2))}))}.play)Κοκκώδη Σύνθεση (Granular)

Είναι μια ασυνήθιστη μορφή σύνθεσης στην οποία ο συνολικός ήχος δομείται από μυριάδες μικρά σωματίδια ήχου τα λεγόμενα κόκκους. Ένας κόκκος ήχου στην πιο απλή του δομή είναι ένα μέρος μιας κυματομορφής με ελάχιστη διάρκεια, περίπου 5 με 50 milliseconds. Από μόνος του ένας κόκκος ήχου ακούγετε σαν ένα “ποπ”, αλλά με πυκνότητα χιλιάδων κόκκων το δευτερόλεπτο, ένα κοκκώδες “σύννεφο” μπορεί να ακουστεί σαν μια χιονοστιβάδα από ήχους. (Hosken, 2010,227)

11

Page 12: Abstract Algorithms

Στο παραπάνω σχήμα βλέπουμε την βασική ανατομία ενός κόκκου με κυματομορφή και συχνότητα που εσωκλείονται σε έναν envelope. Ενώ στο βήτα μέρος βλέπουμε ένα πιθανό κοκκώδες σύννεφο όπου πολύ κόκκοι παραθέτονται σε κλίμακα pitch ( ύψος ) και χρόνου. Οι διαφορετικές αποχρώσεις του γρι αναπαριστούν διαφορετικές κυματομορφές κόκκων. Σε επίπεδο προγραμματισμού υπάρχουν πάρα πολλά προγράμματα που μπορούμε να κάνουμε κοκκώδη σύνθεση. Μια σειρά από τα πιο δημοφιλή είναι:Το Csound,SuperCollider,Reaktor,Max/Msp,Pure Data,ChucK,Real-time Cmix. Ιστορικά αυτή η σύνθεση προέρχεται από τις σπουδές του Gabor στις αρχές της δεκαετίας του '40. Αυτός ο τρόπος σύνθεσης μπορεί να κατηγοριοποιηθεί σύμφωνα με το πως οι κόκκοι αποκτήθηκαν. Έτσι έχουμε τις παρακάτω κατηγορίες (Cavaliere and Piccialli, 1997; Roads, 1995).

Παραδείγματα κοκκώδης σύνθεσης σε επίπεδο προγραμματισμού με το Supercollider:

12

Page 13: Abstract Algorithms

Ασύγχρονη κοκκώδης Σύνθεση (AGS)

Ένας από τους πιο δημοφιλής τρόπους σύνθεσης είναι η ασύγχρονη κοκκώδης σύνθεση. Το κύριο χαρακτηριστικό αυτής είναι πως οι κόκκοι δεν σχετίζονται με τον άξονα του χρόνου τότε μπορούν να τοποθετηθούν τυχαία. Δεν ακολουθούν κανόνες περιοδικότητας και προτύπων, παρόλο που στο σύνολο τους ανά δευτερόλεπτο αυτοί οι κανόνες διατηρούνται. (Park, 2010, 79)Στο παρακάτω παράδειγμα βλέπουμε ένα δευτερόλεπτο από ένα ήχο ενός πιάνου που αποτελείτε από 500 δείγματα με διάρκεια (11.34ms). Από το δείγμα αυτό στο δεύτερο σχήμα βλέπουμε τα πρώτα 2000 δείγματα με δειγματοληψία 44.1kHz.

Σύγχρονη Κοκκώδη Σύνθεση Τονικού ύψους (PSGS)

Η μέθοδος αυτή αναπτύχθηκε από τον De Poli και τον Piccialli (1991). Αυτή προκύπτει από τον μετασχηματισμό Fourier σε διακριτό-χρόνο (STFT). Το αρχικό σήμα υποτίθεται πως είναι σχεδόν περιοδικό και το πρώτο που γίνετε είναι η να βρεθεί η θεμελιώδης συχνότητα του. Η περιοδικότητα του σήματος θα χρησιμοποιηθεί για το πλάτος του τετραγωνικού παραθύρου που θα κάνει τον μετασχηματισμό Fourier σε διακριτό-χρόνο. (Tolonen et al.,1998,14)

13

Page 14: Abstract Algorithms

Μετά το μετασχηματισμό έχουμε ένα σετ κόκκων με τέτοιον τρόπο που κάθε κόκκος αντιπροσωπεύει κάποια συγκεκριμένη περίοδο του αρχικού σήματος. Έχουμε δηλαδή παλμούς που προέρχονται από το πεδίο συχνοτήτων. (Cavaliere and Piccialli,1997) Στο στάδιο της ανασύνθεσης του ήχου, παλμοί ακολουθίας χρησιμοποιούνται για να οδηγηθούν από φίλτρα FIR (φίλτρο πεπερασμένης κρουστικής απόκρισης)με x[n] το σήμα εισόδουy[n] σήμα εξόδου και bi συντελεστής του φίλτρου γνωστό και ως tap wights που συνθέτει την κρουστική απόκριση. Και Ν την τάξη του φίλτρου, καθυστέρηση εισόδου.

Επίλογος

Μετά από αυτήν την εργασία αφού ερεύνησα πολλά βιβλία για παραδείγματα, ιστορικά γεγονότα και πρωτοπορίες, με έκανε να μπορώ να διαχωρίζω πιο τρόπο να διαλέγω για να επεξεργάζομαι και να συνθέτω ήχους. Επίσης μπορώ πια να πολυπλέκω διάφορους τρόπους σύνθεσης γνωρίζοντας. Μετά από αυτή την εργασία θα προσηλωθώ σε συγκεκριμένους αλγόριθμους και θα προσπαθήσω να τους εφαρμόσω στη μουσική. Για μένα πραγματικά ο κόσμος των μαθηματικών και τα συγκεκριμένα αποτελέσματα που επιφέρουν στον ήχο είναι είναι ένας κόσμος που θέλω να ανακαλύψω όλο και περισσότερο. Τα εργαλεία που μας βοηθούν στη σύνθεση στο κάθε συνθέτη είναι διαφορετικά αρκεί να τα χειρίζεται ευχάριστα για να αποδίδει το αποτέλεσμα που πραγματικά θέλει.

14

Page 15: Abstract Algorithms

Βιβλιογραφία

1. An introduction to FM https://ccrma.stanford.edu/software/snd/snd/fm.html2. William F. Egan, Advanced Frequency Synthesis (John Wiley and Sons, 2011)3. Computer Music Terms http://www.computermusicresource.com/terms.html4. Andrea Pejrolo and Rich DeRosa, Acoustic and MIDI Orchestration for the Contemporary Composer (Elsevier, 2007). 5. Eduardo Reck Miranda, Computer sound design: synthesis techniques and programming (Focal Press, 2002).6. Tae Hong Park, Introduction to digital signal processing: computer musically speaking (World Scientific, 2010). 7. Lutz Trautmann and Rudolf Rabenstein, Digital sound synthesis by physical modeling using the functional transformation method (Springer, 2003)8. Curtis Roads, The computer music tutorial (MIT Press, 1996).9. Martin Russ, Sound Synthesis and Sampling (Focal Press, 2008).10. Dan Hosken, An Introduction to Music Technology (Taylor & Francis, 2010).

Διαδίκτυο

1. Interview with John Chowning http://en.wikipedia.org/wiki/File:JohnChowning041306_part1.ogg2. Bessel Function http://en.wikipedia.org/wiki/Bessel_function

15