het experimenteel bepalen van optimale condities

6
Statistica Neerlandica 12 (1958), 143-148 I43 Het experimenteel bepalen van optimale condities * door G. 1. Leppink ** Summary Experimental determination of optimum conditions. This article deals with the problem of determining by experiment conditions giving an optimum result. The following is an exposition of a method discussed by B ox. I. Probleemstelling Zij de stochastische variabele y - (in het vervolg genoemd de responsie) af- hankelijk van CCn of meer variabelen (ook we1 genoemd factoren) xl, x2, , . , xk, of in formule uitgedrukt: r_ = f (x1, xz, * - * Xk) + 5. Gevraagd wordt, die combinatie van xl, . . . xk te vinden, die een maximale waarde van de functie f(x,, x2, . . . xk) oplevert. A priori behoeft over deze functie niets bekend te zijn. Verondersteld wordt slechts - cen voor prac- tische doeleinden niet rigoureuze aanname - dat zij inderdaad een maximum heeft en enigszins ,,glad” verloopt, zodat zij in een beperkt gebied in een T a y 1 o r-reeks ontwikkelbaar is. Men denke hier b.v. aan een geval, waar- in een stof A gemaakt moet worden; hiervoor zijn nodig de stoffen B, C, enz., die gedurende een zekere tijd, bij een bepaalde temperatuur en een bepaalde pH op elkaar moeten inwerken. De vraag is nu: in welke concen- traties moeten de stoffen B, C, . . . worden toegevoegd, gedurende welke tijd en bij welke temperatuur en pH moet men de reactie laten plaats vinden om een maximale opbrengst van stof A te verkrijgen. 2. Wijze van experimenteren Het is meestal practisch onuitvoerbaar het gehele gebied, waarin de k variabelen xi zich bewegen, experimenteel te onderzoeken, omdat dit een zeer groot aantal proeven zou vereisen. Dit is echter ook niet nodig, als het mogelijk is om de proeven sequent uit te voeren. De ,,klassieke” methode is om eerst een experiment te verrichten, waarin alleen de factor x1 wordt gevarieerd en de andere k - I factoren constant *) Voordracht, gehouden op de Statistische Dag 1958. ++) Statisticus bij de Afdeling Bewerking Waamemingsuitkomsten T.N.O., ‘s-Gavenhage.

Upload: g-j-leppink

Post on 01-Oct-2016

227 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Het experimenteel bepalen van optimale condities

Statistica Neerlandica 12 (1958), 143-148

I43

Het experimenteel bepalen van optimale condities * door G. 1. Leppink **

S u m m a r y Experimental determination of optimum conditions.

This article deals with the problem of determining by experiment conditions giving an optimum result. The following is an exposition of a method discussed by B o x .

I . Probleemstelling Zij de stochastische variabele y - (in het vervolg genoemd de responsie) af-

hankelijk van CCn of meer variabelen (ook we1 genoemd factoren) xl , x2, , . , xk, of in formule uitgedrukt:

r_ = f (x1, xz, * - * X k ) + 5.

Gevraagd wordt, die combinatie van xl , . . . xk te vinden, die een maximale waarde van de functie f ( x , , x2, . . . x k ) oplevert. A priori behoeft over deze functie niets bekend te zijn. Verondersteld wordt slechts - cen voor prac- tische doeleinden niet rigoureuze aanname - dat zij inderdaad een maximum heeft en enigszins ,,glad” verloopt, zodat zij in een beperkt gebied in een T a y 1 o r-reeks ontwikkelbaar is. Men denke hier b.v. aan een geval, waar- in een stof A gemaakt moet worden; hiervoor zijn nodig de stoffen B, C, enz., die gedurende een zekere tijd, bij een bepaalde temperatuur en een bepaalde pH op elkaar moeten inwerken. De vraag is nu: in welke concen- traties moeten de stoffen B , C, . . . worden toegevoegd, gedurende welke tijd en bij welke temperatuur en pH moet men de reactie laten plaats vinden om een maximale opbrengst van stof A te verkrijgen.

2. Wijze van experimenteren Het is meestal practisch onuitvoerbaar het gehele gebied, waarin de k

variabelen xi zich bewegen, experimenteel te onderzoeken, omdat dit een zeer groot aantal proeven zou vereisen. Dit is echter ook niet nodig, als het mogelijk is om de proeven sequent uit te voeren.

De ,,klassieke” methode is om eerst een experiment te verrichten, waarin alleen de factor x1 wordt gevarieerd en de andere k - I factoren constant

*) Voordracht, gehouden op de Statistische Dag 1958. ++) Statisticus bij de Afdeling Bewerking Waamemingsuitkomsten T.N.O., ‘s-Gavenhage.

Page 2: Het experimenteel bepalen van optimale condities

worden gehouden. Uit deze proeven kan dan de waarde van x1 worden ge- vonden, die de responsie y maximaliseert. Vervolgens wordt een experiment uitgevoerd, waarin alleen de factor x2 wordt gevarieerd, en waarin x1 genomen wordt op het in de vorige proeven gevonden niveau, enz.

Een dergelijke wijze van experimenteren zou zonder meer goed zijn, als de variabelen xl, . . . xk geen interacties vertonen. Zelfs indien er we1 inter- acties aanwezig zijn, zal in de meeste gevallen op den duur de optimale com- binatie van xl, . . . xk we1 gevonden worden, indien men, nadat alle factoren 66nmaal gevarieerd zijn, weer opnieuw begint met xl, vervolgens met x2, enz. Voor twee variabelen zou dit dus als volgt gaan (figuur I ) :

I

* 2

1 1 1 1 1 1 1

P' 2

Het eerste experiment omvat de punten, gemerkt met een I . Hierbij is dus de factor x2 constant gehouden. Stel, dat punt P de hoogste responsie oplevert. In het tweede experiment (punten gemerkt met een 2) wordt de factor x1 constant gehouden en we1 gelijk aan de xl-waarde van punt P, en wordt x2 gevarieerd. Zo wordt het punt Q gevonden. In het derde ex- periment (punten gemerkt met een 3) heeft x2 een niveau, gelijk aan de x,-waarde van Q. Door x1 te varieren wordt het punt R bereikt, enz.

De nieuwe methode, ontwikkeld door B o x , gaat van de volgende ge- dachten uit. Stel dat de responsie op de in figuur 2 geschetste wijze van de factoren x1 en x2 afhangt. De in deze figuur getrokken lijnen van gelijke responsie zijn op te vatten als hoogtelijnen van een berglandschap waarvan de top het punt van maximale responsie weergeeft. Deze top wordt het snelst bereikt door langs de steilste weg naar boven te gaan. Deze steilste weg

Page 3: Het experimenteel bepalen van optimale condities

kan worden berekend door een aantal proeven te doen, waarbij zowel x1 als x, tegelijkertijd veranderd worden.

De proeven zijn zodanig opgezet, dat de mogelijkheid bzstaat om door de punten een plat vlak aan te passen (de punten gemerkt met I) .

x2

I I

X l Fig. 2.

Dit vlak kan in de omgeving van deze punten als een benadering van het oppervlak worden beschouwd. In dit platte vlak wordt de steilste weg berekend (zie pijl I), vervolgens worden langs deze weg een aantal proeven uitgevoerd en in de omgeving van dat punt, dat op die weg de hoogste res- ponsie geeft, wordt een nieuw experiment (de punten gemerkt met 2) ver- richt, teneinde opnieuw een steilste weg te kunnen berekenen, enz. Het is duidelijk, dat men, op deze wijze experimenterend, met een veel geringer aantal proeven de omgeving van het punt van maximale responsie zal vinden. Indien blijkt, dat het oppervlak niet goed door een plat vlak te benaderen is, dan wordt het experiment zodanig uitgebreid, dat een hogere graads opper- vlak kan worden aangepast.

3. Overwegingen bij de opzet van het eerste experiment Om het eerste experiment (aanpassing van een plat vlak) op te kunnen

zetten, is enige voorkennis vereist: a. Wat is het gebied, waarin de variabelen werkzaam zijn? Een dergelijke

informatie moet bij elk onderzoek aanwezig zijn, om met vrucht statis- tische methoden toe te kunnen passen.

Page 4: Het experimenteel bepalen van optimale condities

b.

c.

d.

e.

Is a1 iets bekend over het verband tussen de variabelen (interacties)? Indien dat zo is, dan kan de proef zodanig worden opgezet, dat het mo- gelijk is schattingen van deze interacties te krijgen. In welke schaal moeten de variabelen worden gekozen? De niveaux van een bepaalde variabele moeten juist zover van elkaar liggen, dat verwacht mag worden, dat - aangenomen dat die variabele in deze omgeving inder- daad een rol speelt - een verschil in responsie kan worden aangetoond. Als de niveaux ,,te dicht” bij elkaar liggen, dan kan geen verschil worden opgemerkt, en als ze ,,te ver” van elkaar verwijderd zijn, dan loopt men gevaar over de berg heen te stappen. Toch is dit gevaar niet zo groot, want als geen invloed van een bepaalde factor wordt gevonden, dan zal men altijd nog een aantal proeven op andere niveaux uitvoeren, om zeker- heid te krijgen. Invloed van de tijd. Voor deze experimenteer-techniek geldt, in misschien nog sterkere mate dan anders, dat alleen dan resultaten venvacht mogen worden, als de proefuitkomsten goed reproduceerbaar zijn. Eventueel kan we1 voor een algehele niveau-verschuiving van de responsie in de tijd gecorrigeerd worden. Deze methode kan slechts worden toegepast, indien het mogelijk is, om sequent te werken.

De vraag, welke statistische proefopzet gekozen kan worden voor het aanpassen van een vlak, wordt hier niet behandeld. Verwezen wordt naar de literatuur. Een overzicht van deze proefschema’s wordt gegeven in dit tijd- schrift in het artikel: ,,Roteerbare proefopzetten” van ir. A. R. B 1 o e m e n a.

4. Interpretatie van het eerste experiment Uit de resultaten van het eerste experiment kan een plat vlak worden be-

rekend, dat zo goed mogelijk in het door de proef bestreken gebied het ver- band tussen de responsie y en de variabele xi weergeeft:

y = b, + blx l+ . . * + b ~ ? c , - De steilste weg wordt gegeven door de vector’)

1 (bi , b,, * * b d . Door voor 1 verschillende waarden > o te kiezen, worden de combinaties

van de factoren gevonden, die nodig zijn voor het verrichten van proeven langs deze steilste weg. Experimenteel kan dan bepaald worden welke 1, of wat hetzelfde is, welke combinatie van x i s een maximale responsie langs

1) Evenals in het vervolg, is hier aangenornen dat zd = o en var ( x J = constant. Dit is natuurlijk geen beperking.

Page 5: Het experimenteel bepalen van optimale condities

deze weg oplevert. Deze combinatie van factoren wordt als centrum van een nieuw experiment gekozen.

De regressiecoefficienten b, geven nog meer informatie. Als n.1. een b, niet significant van nu1 verschilt, dan kan dit betekenen:

a. de responsie is ten aanzien van de variabele xi maximaal, b . de variabele xi speelt geen rol, c. de keuze van de schaal van de variabele x, was verkeerd.

Ten einde te kunnen nagaan welke van de gevallen hier optreedt, worden in het volgende experiment, dat is dus nadat het maximum langs de steilste weg bepaald is, de niveaux van de variabele x i verder uit elkaar genomen of worden een aantal extra proeven met x i gedaan.

5. Het aanpassen van een kwadratisch oppervlak A1 experimenterend kan men het moment bereiken, dat de helling van het

platte vlak zo zwak (niet significant van nu1 verschillend) wordt, dat het niet meer mogelijk is een redelijke schatting van de steilste weg te geven. Een andere mogelijkheid is, dat zal blijken, dat het responsieoppervlak niet goed meer door een plat vlak benaderd kan worden. In deze gevallen zal men de proeven zodanig uitbreiden, dat een tweede graads oppervlak kan worden bepaald:

y - = b, + b i x 1 + . * b g x , $- b 1 , x : . - . -k b k k X 2 b , , x 1 ~ 2 . . f b k - l , X x k - l x k + E*

In deze gedaante is het niet gemakkelijk te zien hoe de vorm van het oppervlak is. Door een orthogonale transformatie kan het oppervlak op zijn hoofdassen worden gebracht:

y - = A, ( X l - al)2 + . . . + 1, ( x k - aJ2 + c + 5. Hierin zijn de Xi lineaire combinaties van de x1 t /m x k , de A i l s de eigen- waarden van de matrix van het zuiver-tweedegraadsdeel van het oppervlak en zijn c en q, . . . ak constant.

Schematisch kunnen nu de volgende gevallen onderscheiden worden: ( a ) Alle A, < 0. Het oppervlak bezit dan inderdaad een maximum, De

plaats van dit maximum wordt (in X-coordinaten) gegeven door (a,, . , . a k ) . Het geval (a) kan nog onderverdeeld worden in: ( a ~ ) Het maximum bevindt zich binnen het gebied, dat door waar-

(a2 ) Het maximum ligt buiten het gebied, dat door waarnemingen nemingen bestreken wordt.

bestreken wordt,

Page 6: Het experimenteel bepalen van optimale condities

(b) Er zijn 66n of meer 2, > 0. Het oppervlak bezit geen maximum (dit impliceert uiteraard niet, dat de werkelijke responsiefunctie geen maxi- mum vertoont).

Alleen in geval ( a ~ ) heeft het maximum practische betekenis. In het geval (a) ligt het maximum buiten de proef en is dus een extrapolatie te gewaagd. We1 kan nu, evenals voor geval (b), een maximale waarde van de responsie berekend worden voor punten, die op een zekere afstand r van het centrum van het experiment liggen door:

y = 2, (&-aac,)* + * e * + 2, (X , -ak )a + c

te maximaliseren onder de bijvoorwaarde ZX: = ra; r wordt dan zodanig gekozen, dat de ,,bol" .EX: = ra nog binnen de proef ligt.

De multiplicatorenmethode van L a g r a n g e volgende, en dus maxima- liserend:

vindt men: F = C2, + c + ,LA {ZX:-ra}

2, (X i -4 + PX, = 0 ( i = I , . . . k) zx: = 9.

b i

4 + cc Hieruit volgt: X, = - (i = I , . . . k) De parameter ,u moet dus voldoen aan de vergelijking:

A:,: c = ra. ( A + ,u)a

Als ,u eenmaal bekend is, dan kunnen de X,-waarden worden berekend. Meestal kan men zonder uitvoerig rekenwerk aan de vorm ZAi (X, - ai)*

zien, welke combinatie van X i s in de buurt van het maximum ligt. Met een paar iteraties kunnen dan de juiste waarden van de X i s berekend

worden. In het algemeen, zal, gezien de statistische fluctuaties, de nauwkeurig-

heid van de schatting van de optimale combinatie der factoren niet groot zijn, Het is verder van belang om na te gaan hoe sterk de responsie terugloopt in de omgeving van het berekende maximum. De Ails geven hierover de nodige informatie.

6. Literatuur B o x and H u n t e r, Ann. Math. Statistics 1957, vol. 28, p. 195. B o x, Biometrics 1954, vol. 10, p. 16. D a v i e s, Industrial Experimentation. C o c h r a n, W. G . and M. G. C o x , Ex1,erimental Designs, 1957.