gaussian processes: from the basics to the...

Gaussian Processes:From the Basics to the State-of-the-Art

Dr. Richard E. Turner (ret26@cam.ac.uk)Computational and Biological Learning Lab, Department of

Engineering, University of Cambridge

with Thang Bui, Yingzhen Li, Jose Miguel Hernandez Lobato,Daniel Hernandez Lobato, Josiah Jan, Alex Navarro,

Felipe Tobar, and Maneesh Sahani

1 / 335

Motivation: non-linear regression

1 5 10 15 20x

−2.0

−1.5

−1.0

−0.5

2 / 335

1 5 10 15 20x

−2.0

−1.5

−1.0

−0.5

3 / 335

1 5 10 15 20x

−2.0

−1.5

−1.0

−0.5

4 / 335

1 5 10 15 20x

−2.0

−1.5

−1.0

−0.5

5 / 335

1 5 10 15 20x

−2.0

−1.5

−1.0

−0.5

Can we do this with a plain old Gaussian? 6 / 335

Gaussian distribution

p(y|Σ) ∝ exp(−1

2yTΣ−1y)

1 .7.7 1

−3 −2 −1 0 1 2 3−3

7 / 335

2yTΣ−1y)

1 .7.7 1

−3 −2 −1 0 1 2 3−3

8 / 335

2yTΣ−1y)

1 .6.6 1

−3 −2 −1 0 1 2 3−3

9 / 335

2yTΣ−1y)

1 .4.4 1

−3 −2 −1 0 1 2 3−3

10 / 335

2yTΣ−1y)

1 .1.1 1

−3 −2 −1 0 1 2 3−3

11 / 335

2yTΣ−1y)

1 .0.0 1

−3 −2 −1 0 1 2 3−3

12 / 335

2yTΣ−1y)

1 .7.7 1

−3 −2 −1 0 1 2 3−3

13 / 335

2yTΣ−1y)

1 .7.7 1

−3 −2 −1 0 1 2 3−3

14 / 335

p(y2|y1,Σ) ∝ exp(−1

2(y2 − µ∗)Σ∗−1(y2 − µ∗)) [ 1

−3 −2 −1 0 1 2 3−3

15 / 335

p(y2|y1,Σ) ∝ exp(−1

2(y2 − µ∗)Σ∗−1(y2 − µ∗)) [ 1

−3 −2 −1 0 1 2 3−3

16 / 335

p(y2|y1,Σ) ∝ exp(−1

2(y2 − µ∗)Σ∗−1(y2 − µ∗)) [ 1

−3 −2 −1 0 1 2 3−3

17 / 335

p(y2|y1,Σ) ∝ exp(−1

2(y2 − µ∗)Σ∗−1(y2 − µ∗)) [ 1

−3 −2 −1 0 1 2 3−3

18 / 335

p(y2|y1,Σ) ∝ exp(−1

2(y2 − µ∗)Σ∗−1(y2 − µ∗)) [ 1

−3 −2 −1 0 1 2 3−3

19 / 335

p(y2|y1,Σ) ∝ exp(−1

2(y2 − µ∗)Σ∗−1(y2 − µ∗)) [ 1

−3 −2 −1 0 1 2 3−3

20 / 335

p(y2|y1,Σ) ∝ exp(−1

2(y2 − µ∗)Σ∗−1(y2 − µ∗)) [ 1

−3 −2 −1 0 1 2 3−3

21 / 335

New visualisation

−2 0 2−3

1 .9.9 1

22 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

23 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

24 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

25 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

26 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

27 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

28 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

29 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

30 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

31 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

32 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

33 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

34 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

35 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

36 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

37 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

38 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

39 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

40 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

41 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

42 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

43 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

44 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

45 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

46 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

47 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

48 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

49 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

50 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

51 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

52 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

53 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

54 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

55 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

56 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

57 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

58 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

59 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

60 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

61 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

62 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

63 / 335

New visualisation

−2 0 2−3

1 2−3

variable index

1 .9.9 1

64 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

65 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

66 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

67 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

68 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

69 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

70 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

71 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

72 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

73 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

74 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

75 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

76 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

77 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

78 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

79 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

80 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

81 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

82 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

83 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

84 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

85 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

86 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

87 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

88 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

89 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

90 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

91 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

92 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

93 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

94 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

95 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

96 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

97 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

98 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

99 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

100 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

101 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

102 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

103 / 335

New visualisation

−2 0 2−3

1 2 3 4 5−3

variable index

1 .9 .8 .6 .4.9 1 .9 .8 .6.8 .9 1 .9 .8.6 .8 .9 1 .9.4 .6 .8 .9 1

104 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

105 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

106 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

107 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

108 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

109 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

110 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

111 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

112 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

113 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

114 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

115 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

116 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

117 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

118 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

119 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

120 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

121 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

122 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

123 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

124 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

125 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

126 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

127 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

128 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

129 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

130 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

131 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

132 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

133 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

134 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

135 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

136 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

137 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

138 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

139 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

140 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

141 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

142 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

143 / 335

New visualisation

−2 0 2−3

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

144 / 335

Regression using Gaussians

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

145 / 335

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

146 / 335

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

1 10 20

147 / 335

1 2 3 4 5 6 7 8 9 1011121314151617181920−3

variable index

Σ(x1, x2) = K(x1, x2) + Iσ2y

K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

148 / 335

Regression: probabilistic inference in function space

Σ(x1, x2) = K(x1, x2) + Iσ2y

K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

149 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Non-parametric (∞-parametric)

K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)

150 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ) function estimatewith uncertainty

K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)

151 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)

152 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

horizontal-scale

K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)

153 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Non-parametric (∞-parametric) Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

horizontal-scalevertical-scale

154 / 335

Mathematical Foundations: Definition

Gaussian process = generalisation of multivariate Gaussian distribution toinfinitely many variables.

Definition: a Gaussian process is a collection of random variables, anyfinite number of which have (consistent) Gaussian distributions.

A Gaussian distribution is fully specified by a mean vector, µ, andcovariance matrix Σ:

f = (f1, . . . , fn) ∼ N (µ,Σ), indices i = 1, . . . ,n

A Gaussian process is fully specified by a mean function m(x) andcovariance function K(x, x′):

f (x) ∼ GP(m(x),K(x, x′)

), indices x

155 / 335

Mathematical Foundations: Regression

Q1. What's the formal justification for how we were using GPs for regression?

156 / 335

generative model (like non-linear regression)

156 / 335

place GP prior over the non-linear function

(smoothly wiggling functions expected)

156 / 335

place GP prior over the non-linear function

sum of Gaussian variables = Gaussian: induces a GP over

(smoothly wiggling functions expected)

156 / 335

Mathematical Foundations: Marginalisation

Q2. A GP is "like" a Gaussian distribution with an infinitely long mean vector and an "infinite by infinite" covariance matrix, so how do we represent it on a computer?

157 / 335

We are saved by the marginalisation property:

157 / 335

Only need to represent finite dimensional projections of GPs on computer.

157 / 335

Mathematical Foundations: Prediction

Q3. How do we make predictions?

158 / 335

predictive mean

158 / 335

linear in the data

predictive mean

158 / 335

prior uncertainty

predictive uncertainty

reduction inuncertainty

linear in the data

predictive mean predictive covariance

predictions more confident than prior

158 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

1 10 20

horizontal-scalevertical-scale

159 / 335

What effect do the hyper-parameters have?

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

160 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

161 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

162 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

163 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

164 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

165 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

166 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

167 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

168 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

169 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

170 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

171 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

172 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

173 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

174 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

175 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

176 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

177 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

178 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

179 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

180 / 335

short horizontal length-scale

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

181 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

182 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

183 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

184 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

185 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

186 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

187 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

188 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

189 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

190 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Non-parametric (∞-parametric)short horizontal length-scale

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

191 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

192 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

193 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

194 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

195 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

196 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

197 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

198 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

199 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

200 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

Parametric model

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

201 / 335

long horizontal length-scale

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

202 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

203 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

204 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

205 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

206 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

207 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

208 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

209 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

210 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

211 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

212 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

213 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

214 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

215 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

216 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

217 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

218 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

219 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

220 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

221 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

222 / 335

K(x1, x2) = σ2 exp(− 1

2l2 (x1 − x2)2)

Hyper-parameters have a strong effectI l controls the horizontal length-scaleI σ2 controls the vertical scale of the data

=⇒ need automatic learning of hyper-parameters from data e.g.

arg maxl,σ2

log p(y |θ)

l = short l = longl = medium

223 / 335

K(x1, x2) = σ2 exp(− 1

2l2 (x1 − x2)2)

Hyper-parameters have a strong effectI l controls the horizontal length-scaleI σ2 controls the vertical scale of the data

=⇒ need automatic learning of hyper-parameters from data e.g.

arg maxl,σ2

log p(y |θ)

l = short l = longl = medium

224 / 335

Higher dimensional input spaces

225 / 335

226 / 335

227 / 335

228 / 335

229 / 335

230 / 335

231 / 335

232 / 335

233 / 335

234 / 335

235 / 335

236 / 335

237 / 335

238 / 335

239 / 335

Σ(x1, x2) = K(x1, x2) + Iσ2y

p(y|θ) = N (0,Σ)

y(x) = f (x; θ) + σyε

ε ∼ N (0, 1)K(x1, x2) = σ2e−1

2l2(x1−x2)2

240 / 335

What effect does the form of the covariance function have?

Laplacian covariance function

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

241 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

242 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

243 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

244 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

245 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

246 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

247 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

248 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

249 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

250 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

251 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

252 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

253 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

254 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

255 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

256 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

257 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

258 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

259 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

260 / 335

Browninan motion

Ornstein-Uhlenbeck

K(x1, x2) = σ2 exp(− 1

2l2 |x1 − x2|)

261 / 335

Rational Quadratic

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

262 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

263 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

264 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

265 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

266 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

267 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

268 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

269 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

270 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

271 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

272 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

273 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

274 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

275 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

276 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

277 / 335

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

Rational Quadratic

278 / 335

Rational Quadratic

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

279 / 335

Rational Quadratic

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

280 / 335

Rational Quadratic

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

281 / 335

Rational Quadratic

K(x1, x2) = σ2(1 + 1

2αl2 |x1 − x2|)−α

282 / 335

Periodic

sinusoid × squared exponential