ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

94
Li cm ơn Em xin bày tlòng biết ơn sâu sc ti GS.TS. Hà Quang Thy, thày đã hướng dn, chdy tn tình để em hoàn thành lun văn này. Em xin chân thành cm ơn các thày, cô giáo khoa Công nghthông tin - Trường Đại hc công ngh- Đại hc Quc gia Hà ni đã truyn thkiến thc cho em trong sut quá trình hc tp va qua. Tôi cũng xin cm ơn cơ quan, bn bè đồng nghip, gia đình và nhng người thân đã cùng chia s, giúp đỡ, động viên, to mi điu kin thun li để tôi hoàn thành nhim vhc tp và cun lun văn này. Hà ni, ngày 09 tháng 11 năm 2007 Hc viên Phm ThHoàng Nhung

Upload: nguyenminh

Post on 01-Feb-2017

224 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

LLờờii ccảảmm ơơnn Em xin bày tỏ lòng biết ơn sâu sắc tới GS.TS. Hà Quang Thụy, thày đã hướng

dẫn, chỉ dạy tận tình để em hoàn thành luận văn này. Em xin chân thành cảm ơn các thày, cô giáo khoa Công nghệ thông tin - Trường Đại học công nghệ - Đại học Quốc gia Hà nội đã truyền thụ kiến thức cho em trong suốt quá trình học tập vừa qua.

Tôi cũng xin cảm ơn cơ quan, bạn bè đồng nghiệp, gia đình và những người thân đã cùng chia sẻ, giúp đỡ, động viên, tạo mọi điều kiện thuận lợi để tôi hoàn thành nhiệm vụ học tập và cuốn luận văn này.

Hà nội, ngày 09 tháng 11 năm 2007

Học viên

Phạm Thị Hoàng Nhung

Page 2: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

4

MMụụcc llụụcc Lời cảm ơn............................................................................................................... i

Mục lục .............................................................................................................. 4

Danh sách hình vẽ.................................................................................................. 7

Danh sách bảng biểu ............................................................................................. 9

MỞ ĐẦU ............................................................................................................ 10

CHƯƠNG 1 - MẠNG NƠ-RON NHÂN TẠO TRUYỀN THẲNG NHIỀU LỚP.................................................................................................... 13

1.1 Giới thiệu về mạng nơ-ron nhân tạo.......................................................... 13

1.1.1 Khái niệm cơ bản................................................................................ 13

1.1.2 Mô hình mạng nơ-ron nhân tạo.......................................................... 15

1.1.3 Khả năng ứng dụng của mạng nơ-ron nhân tạo ................................. 18

1.2 Mạng nơ-ron lan truyền thẳng nhiều lớp................................................... 19

1.2.1 Mạng perceptron một lớp ................................................................... 19

1.2.2 Mạng perceptron nhiều lớp ................................................................ 22

1.2.3 Một số vấn đề cần chú ý khi sử dụng mạng MLP.............................. 30

Kết luận chương .............................................................................................. 33

CHƯƠNG 2 - KẾT HỢP GIẢI THUẬT DI TRUYỀN VỚI GIẢI THUẬT LAN TRUYỀN NGƯỢC SAI SỐ ĐỂ TỐI ƯU HOÁ TRỌNG SỐ MẠNG NƠ-RON NHÂN TẠO ....................................................... 34

2.1 Giới thiệu giải thuật di truyền ................................................................... 34

2.1.1 Giới thiệu............................................................................................ 34

2.1.2 Tư tưởng chính của giải thuật di truyền ............................................. 35

2.1.3 Giải thuật di truyền đơn giản.............................................................. 37

2.1 Ứng dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số của mạng nơ-ron nhân tạo ......................................................................................... 41

2.2.1 Xây dựng hàm giá .............................................................................. 42

2.2.2 Mã hoá nhiễm sắc thể ......................................................................... 42

2.2.3 Lai ghép .............................................................................................. 43

Page 3: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

5

2.2.4 Đột biến .............................................................................................. 44

2.2.5 Thử nghiệm ........................................................................................ 45

2.2.6 Giải thuật đề xuất ............................................................................... 49

2.3 Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu hoá trọng số mạng nơ-ron nhân tạo .......................................................... 51

2.3.1 Đặt vấn đề........................................................................................... 51

2.3.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số..... 53

Kết luận chương .............................................................................................. 55

CHƯƠNG 3 - ỨNG DỤNG MẠNG NƠ RON NHÂN TẠO VÀO VIỆC DỰ BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒ HOÀ BÌNH ...................... 57

3.1 Điều kiện địa lý, tự nhiên, khí tượng thuỷ văn lưu vực sông Đà .............. 57

3.1.1 Vị trí địa lý.......................................................................................... 57

3.1.2 Địa hình .............................................................................................. 58

3.1.3 Điều kiện địa chất............................................................................... 58

3.1.4 Điều kiện thổ nhưỡng......................................................................... 58

3.1.5 Đặc điểm khí hậu................................................................................ 58

3.1.6 Đặc điểm chế độ thuỷ văn .................................................................. 59

3.1.7 Thống kê dữ liệu thu thập được.......................................................... 63

3.2 Các phương pháp dự báo........................................................................... 64

3.2.1 Dựa trên mô hình vật lý...................................................................... 64

3.2.2 Dựa trên mô hình toán........................................................................ 66

3.2.3 Hướng tiếp cận mới ............................................................................ 67

3.3 Một số chỉ tiêu đánh giá kết quả dự báo.................................................... 67

3.4 Dự báo lưu lượng đến hồ Hoà Bình trước 10 ngày................................... 68

3.4.1 Phần mềm xây dựng ........................................................................... 68

3.4.2 Số liệu sử dụng ................................................................................... 69

3.4.3 Các tham số ........................................................................................ 70

3.4.4 Các phương án dự báo........................................................................ 70

Kết luận chương .............................................................................................. 75

KẾT LUẬN .......................................................................................................... 76

Page 4: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

6

TÀI LIỆU THAM KHẢO .................................................................................. 78

PHỤ LỤC 80

Phụ lục A - Giới thiệu về phần mềm dự báo................................................... 80

Phụ lục B - Mẫu học thử nghiệm so sánh các phương pháp lai ghép và đột biến............................................................................................................ 85

Phụ lục C - Số liệu học và kiểm tra trong bài toán dự báo lưu lượng nước đến hồ Hoà Bình .............................................................................................. 86

Page 5: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

7

DDaannhh ssáácchh hhììnnhh vvẽẽ Hình 1.1 Cấu tạo của tế bào nơ-ron sinh học............................................................. 14

Hình 1.2 Mô hình nơ-ron nhân tạo............................................................................. 14

Hình 1.3 Mạng nơ-ron nhân tạo chỉ có một nút và có sự phản hồi............................ 16

Hình 1.4 Mạng nơ-ron truyền thẳng một lớp............................................................. 16

Hình 1.5 Mạng nơ-ron truyền thẳng nhiều lớp .......................................................... 17

Hình 1.6 Mạng nơ-ron hồi quy một lớp.................................................................... 17

Hình 1.7 Sự khác nhau giữa hồi quy tuyến tính và mạng nơ-ron ............................. 19

Hình 1.8 Mạng perceptron một lớp............................................................................ 20

Hình 1.9 Thực hiện hàm XOR bằng mạng MLP ....................................................... 22

Hình 1.10 Lan truyền tín hiệu trong quá trình học theo phương pháp lan truyền ngược sai số........................................................................................................ 23

Hình 1.11 Sai số E được xét là hàm của trọng số W ................................................. 25

Hình 1.12 Minh họa về ý nghĩa của quán tính trong thực tế..................................... 30

Hình 1.13 Hàm sigmoid g(x) = 1/(1+e-x) .................................................................. 30

Hình 1.14 Nội suy hàm y = sin(x/3) + v, 0≤ x ≤ 20 sử dụng MLP............................ 32

Hình 2.1 Sự sinh sản đơn giản phân bố các chuỗi con cháu nhờ sử dụng bánh xe roulette với các khe hở tỷ lệ với độ thích nghi................................................... 38

Hình 2.2 Lưu đồ thuật toán của giải thuật di truyền đơn giản ................................... 41

Hình 2.3 Mã hoá nhị phân trọng số theo phương pháp GENITOR ........................... 43

Hình 2.4 Ví dụ về phương pháp mã hoá trọng số bằng số thực................................. 43

Hình 2.5 Lai ghép nút (crossover-nodes)................................................................... 44

Hình 2.6 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số ............. 54

Hình 3.1: Bản đồ phân bố các trạm trên sông Đà ...................................................... 61

Hình 3.2 Mô hình dự báo dựa trên công nghệ học máy............................................. 67

Hình 3.3 Giao diện chính của phần mềm thử nghiệm ............................................... 69

Hình 3.3 Kết quả dự báo với dữ liệu kiểm tra theo phương án 1 .............................. 71

Hình 3.4 Kết quả dự báo với dữ liệu kiểm tra theo phương án 1 trên đồ thị scatter.. 72

Hình 3.5 Kết quả dự báo với dữ liệu kiểm tra theo phương án 2 .............................. 73

Page 6: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

8

Hình 3.6 Kết quả dự báo với dữ liệu kiểm tra theo phương án 2 trên đồ thị scatter.. 73

Hình 3.7 Kết quả dự báo với dữ liệu kiểm tra theo phương án 3 .............................. 74

Hình 3.8 Kết quả dự báo với dữ liệu kiểm tra theo phương án 3 trên đồ thị scatter.. 74

Page 7: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

9

DDaannhh ssáácchh bbảảnngg bbiiểểuu Bảng 2.1 Các chuỗi của bài toán mẫu và các giá trị thích nghi.....................................38

Bảng 2.2 So sánh các phương pháp đột biến.................................................................45

Bảng 2.3 So sánh các phương pháp lai ghép.................................................................46

Bảng 2.4 Kết quả thử nghiệm so sánh GA và BP với ngưỡng sai số 0.0005................48

Bảng 2.5 Kết quả thử nghiệm với giải thuật đề xuất .....................................................50

Bảng 2.6 Kết quả thử nghiệm so sánh GA’ và BP với ngưỡng sai số 0.0005 ..............52

Bảng 2.7 So sánh khả năng hội tụ của mạng khi sử dụng hai phương pháp học GA’ và BP với sai số dừng lặp khác nhau..........................................................................53

Bảng 2.8 Kết quả thử nghiệm giải thuật kết hợp GA’ và BP với ngưỡng sai sô 0.0005...............................................................................................................................54

Bảng 3.1 Thống kê số liệu mưa thu thập được..............................................................63

Bảng 3.2 Thống kê số liệu lưu lượng thu thập được .....................................................64

Page 8: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

10

MMỞỞ ĐĐẦẦUU Dự báo thuỷ văn là công việc dự báo trước một cách có khoa học về trạng thái

biến đổi các yếu tố thuỷ văn trong tương lai. Đây là một ngành khoa học có nhiệm vụ báo trước sự xuất hiện các yếu tố thủy văn trên cơ sở nghiên cứu các quy luật của chúng. Hiện nay có rất nhiều bài toán dự báo thuỷ văn được đặt ra như dự báo dòng chảy, dự báo mực nước, dự báo lưu lượng nước trên sông, dự báo lũ, và dự báo các hiện tượng khác trên sông ngòi và hồ... [3].

Tùy vào quan điểm phân chia mà tồn tại một số phân loại dự báo thủy văn. Chẳng hạn, theo yêu cầu phục vụ thì có các loại dự báo như dự báo cho nông nghiệp, dự báo cho giao thông, dự báo cho chống lũ lụt; còn theo đối tượng dự báo thì có các loại dự báo mực nước, dự báo lưu lượng, dự báo bùn cát… Tuy nhiên, phân loại dự báo theo thời gian là một phân loại điển hình với các loại dự báo là ngắn hạn, trung hạn, dài hạn và siêu dài hạn. Dự báo ngắn hạn với khoảng thời gian dự báo từ một đến ba ngày. Dự báo trung hạn với khoảng thời gian dự báo dài hơn dự báo ngắn hạn nhưng tối đa không quá mười ngày. Dự báo dài hạn có khoảng thời gian dự báo từ hơn mười ngày đến một năm. Khi thời gian dự báo lớn hơn một năm đó là dự báo siêu dài hạn.

Thuỷ văn là một quá trình tự nhiên phức tạp, chịu tác động của rất nhiều yếu tố. Tính biến động của các yếu tố này phụ thuộc vào cả không gian và thời gian nên gây khó khăn rất lớn cho quá trình dự báo, tìm ra được mối liên quan giữa các yếu tố. Thêm vào đó, do thiếu các trạm quan trắc cần thiết và thiếu sự kết hợp giữa các ngành liên quan cho nên dữ liệu quan trắc thực tế thường là không đầy đủ, không mang tính chất đại diện.

Yêu cầu chung mà tất cả các bài toán dự bảo thủy văn cần phải giải quyết là làm cách nào để có thể phân tích và sử dụng chuỗi dữ liệu có trong quá khứ để dự đoán được giá trị tương lai. Hiện nay, có rất nhiều phương pháp dự báo đã được đưa ra dựa trên mô hình vật lý và mô hình toán học. Trong nhiều trường hợp, kết quả nghiên cứu dự báo thủy văn theo các mô hình nói trên đã đạt được một số thành công đáng ghi nhận [1]. Tuy nhiên, vấn đề tìm kiếm phương pháp đủ tốt, đáp ứng các yêu cầu thực tế giải quyết bài toán dự báo thuỷ văn vẫn là nội dung nghiên cứu thời sự hiện nay. Ở trong nước, tại Viện Khí tượng Thủy văn có hàng chục công trình nghiên cứu liên quan tới dự báo thủy văn, đặc biệt có tới 4 đề tài cấp Nhà nước [3]. Trên thế giới, việc áp dụng các phương pháp của khai phá dữ liệu (đặc biệt là các phương pháp học máy mạng neuron và kết hợp với thuật toán gene) vào dự báo thủy văn đã trở thành nội dung nghiên cứu dự báo thủy văn thời sự trong thời gian gần đây [5-7,12-14, 19].

Khai phá dữ liệu là một trong những lĩnh vực nghiên cứu của khoa học máy tính hiện nay đang được phát triển rất mạnh mẽ. Nó kết hợp giữa học máy, công nghệ cơ sở

Page 9: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

11

dữ liệu và một số chuyên ngành khác để tìm ra những tri thức, bao gồm cả các thông tin dự báo, từ những cơ sở dữ liệu lớn.

Luận văn này tập trung khảo sát một số phương pháp học máy tiên tiến, thực hiện việc kết hợp giữa phương pháp học máy mạng neuron [5-7,9-20] với thuật toán gene [4,8,21] và ứng dụng vào bài toán dự báo lưu lượng nước đến hồ Hòa Bình. Luận văn tập trung khảo sát một số công trình nghiên cứu liên quan trên thế giới [5-7, 12-14, 19]. Demetris F. Lekkas [12] cung cấp một khung nhìn phương pháp luận về các phương pháp dự báo dòng chảy. Ibrahim Can cùng các đồng tác giả [5] và Cristiane Medina Finzi Quintao cùng các đồng tác giả [19] công bố một số kết quả nghiên cứu cập nhật về dự báo dòng chảy của một số dòng sông tại Thổ Nhĩ Kỳ và Brazin. Đặc biệt, các công trình này đã cung cấp cách thức đánh giá kết quả thực nghiệm các phương pháp dự báo thủy văn được đề cập. Các công trình nghiên cứu khác về phương pháp mạng nơron, thuật toán gene và kết hợp chúng được luận văn sử dụng để làm nền tảng khoa học cho các nghiên cứu phát triển. Luận văn đã hoàn thành phần mềm thử nghiệm và tiến hành thực nghiệm trên bộ dữ liệu được thu thập tin cậy thông qua hệ thống đo đạc thủy văn dọc sông Đà, nguồn nước chính chảy vào hồ Hòa Bình. Đóng góp khoa học của luận văn là một báo cáo khoa học đã được trình bày tại Hội thảo khoa học quốc gia Một số vấn đề chọn lọc về Công nghệ thông tin và Truyền thông lần thứ X được tổ chức tại Đại Lải vào tháng 9/2007 với kết quả thực hiện cho dự báo nước trước 10 ngày có chỉ số R2 khá cao, lên tới 0.8737 [2]. Cải tiến do luận văn đề xuất kết hợp đột biến BIASED với đột biến UNBIASED trong đó đột biến BIASED sẽ đóng vai trò chủ đạo nhằm vượt ra khỏi cực trị địa phương (D. Montana and L. Davis [16]) là có ý nghĩa. Các kết quả thực nghiệm cải tiến trên cho thấy mọi tiêu chí đánh giá đều tốt lên, chỉ số R2 nâng lên 0.8742 (so với 0.8737 [2]), sai số quân phương là 72.28 m3/s (so với 76.10 m3/s [2]).

Nội dung chính của luận văn được tổ chức thành 3 chương có nội dung được mô tả như dưới đây.

Chương I. Mạng nơ-ron nhân tạo truyền thẳng nhiều lớp. Chương này trình bày những lý thuyết cơ bản về mạng nơ-ron nhân tạo, tập trung nghiên cứu mạng truyền thẳng nhiều lớp. Chương này cung cấp một cách nhìn tổng quát nhất, và những vấn đề về quá trình huấn luyện mạng và thuật toán học của mạng mà tập trung chủ yếu vào thuật toán lan truyền ngược sai số.

Chương II. Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu hoá trọng số mạng nơ-ron nhân tạo. Chương này trình bày về lý thuyết của giải thuật di truyền và khả năng ứng dụng của giải thuật này kết hợp với thuật toán lan truyền ngược sai số nhằm đạt tới một kết quả tốt hơn đối với bài toán tối ưu trọng số mạng nơ-ron nhân tạo.

Page 10: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

12

Chương III. Ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước đến hồ Hoà Bình. Chương này giới thiệu sơ lược về bộ dữ liệu sử dụng, các phương pháp đánh giá kết quả dự báo và tập trung vào thử nghiệm các phương pháp để dự báo lưu lượng nước đến hồ Hoà Bình trước mười ngày, từ đó đánh giá được khả năng ứng dụng các phương pháp học máy đã trình bày trong dự báo chuỗi thời gian, cụ thể là dự báo lưu lượng.

Phần kết luận tổng kết những kết quả đã đạt được của luận văn và hướng phát triển nghiên cứu tiếp theo. Phần phụ lục giới thiệu về phần mềm dự báo và hướng dẫn cách thức cơ bản sử dụng phần mềm.

Page 11: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

13

CCHHƯƯƠƠNNGG 11 -- MMẠẠNNGG NNƠƠ--RROONN NNHHÂÂNN TTẠẠOO TTRRUUYYỀỀNN TTHHẲẲNNGG NNHHIIỀỀUU LLỚỚPP

Mạng nơ-ron nhân tạo được coi là một công cụ mạnh để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt trong các trường hợp mà mối quan hệ giữa các quá trình không dễ thiết lập một cách tường minh. Có nhiều loại mạng nơ-ron khác nhau trong đó mạng nơ-ron truyền thẳng nhiều lớp là một trong những mạng nơ-ron thông dụng nhất. Đã có nhiều nghiên cứu sử dụng mạng nơ-ron truyền thẳng nhiều lớp trong bài toán dự báo [5][7], [10], [14] và đã chứng tỏ đây là hướng tiếp cận rất hiệu quả. Trong chương này chúng ta sẽ tìm hiểu những kiến thức về mạng nơ-ron nhân tạo, mạng nơ-ron truyền thẳng nhiều lớp và khả năng ứng dụng của chúng trong bài toán dự báo.

1.1 Giới thiệu về mạng nơ-ron nhân tạo

1.1.1 Khái niệm cơ bản

Theo các nhà nghiên cứu sinh học về bộ não, hệ thống thần kinh của con người bao gồm khoảng 100 tỷ tế bào thần kinh, thường gọi là các nơ-ron. Mỗi tế bào nơ-ron gồm ba phần:

• Thân nơ-ron với nhân bên trong (gọi là soma), là nơi tiếp nhận hay phát ra các xung động thần kinh.

• Một hệ thống dạng cây các dây thần kinh vào (gọi là dendrite) để đưa tín hiệu tới nhân nơ-ron. Các dây thần kinh vào tạo thành một lưới dày đặc xung quanh thân nơ-ron, chiếm diện tích khoảng 0,25 mm2

• Đầu dây thần kinh ra (gọi là sợi trục axon) phân nhánh dạng hình cây, có thể dài từ một cm đến hàng mét. Chúng nối với các dây thần kinh vào hoặc trực tiếp với nhân tế bào của các nơ-ron khác thông qua các khớp nối (gọi là synapse). Thông thường mỗi nơ-ron có thể có từ vài chục cho tới hàng trăm ngàn khớp nối để nối với các nơ-ron khác. Có hai loại khớp nối, khớp nối kích thích (excitatory) sẽ cho tín hiệu qua nó để tới nơ-ron còn khớp nối ức chế (inhibitory) có tác dụng làm cản tín hiệu tới nơ-ron. Người ta ước tính mỗi nơ-ron trong bộ não của con người có khoảng 104 khớp nối (hình 1.1)

Chức năng cơ bản của các tế bào nơ-ron là liên kết với nhau để tạo nên hệ thống thần kinh điều khiển hoạt động của cơ thể sống. Các tế bào nơ-ron truyền tín hiệu cho nhau thông qua các dây thần kinh vào và ra, các tín hiệu đó có dạng xung điện và được tạo ra từ các quá trình phản ứng hoá học phức tạp. Tại nhân tế bào, khi điện

Page 12: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

14

thế của tín hiệu vào đạt tới một ngưỡng nào đó thì nó sẽ tạo ra một xung điện dẫn tới trục dây thần kinh ra. Xung này truyền theo trục ra tới các nhánh rẽ và tiếp tục truyền tới các nơ-ron khác.

Hình 1.1 Cấu tạo của tế bào nơ-ron sinh học

Với mục đích tạo ra một mô hình tính toán phỏng theo cách làm việc của nơ-ron trong bộ não con người, vào năm 1943, các tác giả McCulloch và Pitts [15] đã đề xuất một mô hình toán cho một nơ-ron như sau:

Hình 1.2 Mô hình nơ-ron nhân tạo

Trong mô hình này, một nơ-ron thứ i sẽ nhận các tín hiệu vào xj với các trọng số

tương ứng là wij , tổng các thông tin vào có trọng số là 1

m

ij jj

w x=∑

Thông tin đầu ra ở thời điểm t+1 được tính từ các thông tin đầu vào như sau:

( 1) ( )ij j i

out t g tw x θ⎛ ⎞+ = −⎜ ⎟

⎝ ⎠∑ (1.1)

Trong đó g là hàm kích hoạt (còn gọi là hàm chuyển) có dạng là hàm bước nhảy, nó đóng vai trò biến đổi từ thông tin đầu vào thành tín hiệu đầu ra

w1

wm

Nếu f > 0 Nếu f ≤ 0 ⎩

⎨⎧

=01

)( fg (1.2)

Page 13: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

15

Như vậy, out = 1 (ứng với việc nơ-ron tạo tín đầu ra) khi tổng các tín hiệu vào lớn hơn ngưỡng θi , còn out = 0 (nơ-ron không tạo tín hiệu ở đầu ra) khi tổng các tín hiệu vào nhỏ hơn ngưỡng θi.

Trong mô hình nơ-ron của McCulloch và Pitts, các trọng số wij thể hiện ảnh hưởng của khớp nối trong liên kết giữa nơ-ron j (nơ-ron gửi tín hiệu) và nơ-ron i (nơ-ron nhận tín hiệu). Trọng số wij dương ứng với khớp nối kích thích, trọng số âm ứng với khớp nối ức chế còn wij bằng 0 khi không có liên kết giữa hai nơ-ron. Hàm chuyển g ngoài dạng hàm bước nhảy còn có thể chọn nhiều dạng khác nhau và sẽ được đề cập ở các phần sau.

Thông qua cách mô hình hoá đơn giản một nơ-ron sinh học như trên, McCulloch và Pitts đã đưa ra một mô hình nơ-ron nhân tạo có tiềm năng tính toán quan trọng. Nó có thể thực hiện các phép toán lô-gíc cơ bản như AND, OR và NOT khi các trọng số và ngưỡng được chọn phù hợp. Sự liên kết giữa các nơ-ron nhân tạo với các cách thức khác nhau sẽ tạo nên các loại mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) với những tính chất và khả năng làm việc khác nhau.

1.1.2 Mô hình mạng nơ-ron nhân tạo

Như đã được giới thiệu, mạng nơ-ron nhân tạo là một hệ thống xử lý thông tin được xây dựng trên cơ sở tổng quát hoá mô hình toán học của nơ-ron sinh học và phỏng theo cơ chế làm việc của bộ não con người. Mạng nơ-ron nhân tạo được thể hiện thông qua ba thành phần cơ bản: mô hình của nơ-ron, cấu trúc và sự liên kết giữa các nơ-ron, phương pháp học được áp dụng cho mạng nơ-ron.

a. Các phần tử xử lý

Việc xử lý thông tin tại mỗi nơ-ron có thể xem là gồm hai phần: xử lý tín hiệu vào (input) và đưa tín hiệu ra (output). Tương ứng với phần vào của mỗi nơ-ron là một hàm tương tác (interaction) f, hàm này kết hợp các thông tin truyền tới nơ-ron và tạo thành thông tin đầu vào tổng hợp (gọi là net input) của nơ-ron đó .

Một nơ-ron thứ i trong mạng thường có hàm fi ở dạng tuyến tính như sau :

1

m

i i ij j ij

f net w x θ=

∆ = −∑ (1.3)

Thao tác thứ hai trong mỗi nơ-ron là tính giá trị đầu ra tương ứng với giá trị đầu vào f thông qua hàm kích hoạt hay còn gọi là hàm chuyển g(f) (hàm kích hoạt). Một số hàm chuyển thường được sử dụng:

Page 14: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

16

• Hàm bước nhảy

⎪⎩

⎪⎨

<

≥=

00

01)(

fkhi

fkhifg

(1.4)

• Hàm dấu

⎪⎩

⎪⎨

<−

≥==

01

01)sgn()(

fkhi

fkhiffg

(1.5)

• Hàm sigmoid

fefg λ−+

=1

1)( hoặc

11

2)( −+

= − fefg λ (1.6)

b. Liên kết trong mạng nơ-ron nhân tạo

Mạng nơ-ron nhân tạo gồm các nơ-ron và liên kết có trọng số giữa chúng. ANN tạo nên một hệ thống xử lý thông tin làm việc trên cơ sở phỏng theo cách làm việc của hệ thống các nơ-ron trong bộ não con người. Tuy nhiên, trong bộ não của con người, các tế bào nơ-ron liên kết với nhau chằng chịt và tạo nên một mạng lưới vô cùng phức tạp.

Các loại mạng nơ-ron nhân tạo được xác định bởi cách liên kết giữa các nơ-ron , trọng số của các liên kết đó và hàm chuyển tại mỗi nơ-ron. Các hình vẽ dưới đây thể hiện các cách kết nối khác nhau.

Hình 1.3 Mạng nơ-ron nhân tạo chỉ có một nút và có sự phản hồi

Hình 1.4 Mạng nơ-ron truyền thẳng một lớp

Page 15: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

17

(Single-layer feedforward network)

Mạng nơ-ron truyền thẳng một lớp là loại mạng chỉ có lớp nơ-ron đầu vào và một lớp nơ-ron đầu ra (thực chất lớp nơ-ron đầu vào không có vai trò xử lý, do đó ta nói mạng chỉ có một lớp). Loại mạng này còn được gọi là mạng perceptron một lớp. Mỗi nơ-ron đầu ra có thể nhận tín hiệu từ các đầu vào x1, x2, …, xm để tạo ra tín hiệu đầu ra tương ứng.

Hình 1.5 Mạng nơ-ron truyền thẳng nhiều lớp

(Multil-layer feedforward network).

Trong mạng nơ-ron truyền thẳng nhiều lớp, lớp nhận tín hiệu vào của mạng gọi là lớp vào (input layer), nó thường không thực hiện việc chuyển đổi thông tin mà chỉ làm chức năng nhận tín hiệu. Tín hiệu ra của mạng được đưa ra từ lớp ra (output layer). Các lớp ở giữa lớp vào và lớp ra gọi là các lớp ẩn. Trong mạng truyền thẳng (feedforward network) không có nút nào mà đầu ra của nó là đầu vào của một nút khác trên cùng lớp với nó hoặc lớp trước.

Mạng có phản hồi (feedback network) là mạng mà đầu ra của một nơ-ron có thể trở thành đầu vào của nơ-ron trên cùng một lớp hoặc của lớp trước đó. Mạng feedback có chu trình khép khín gọi là mạng quy hồi (recurrent network)

Hình 1.6 Mạng nơ-ron hồi quy một lớp

Lớp vào Các lớp ẩn Lớp ra

Page 16: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

18

c. Các luật học của mạng nơ-ron nhân tạo

Như đã được đề cập ở phần đầu luật học là một trong ba yếu tố quan trọng tạo nên một mạng nơ-ron nhân tạo. Có hai vấn đề cần học đối với mỗi mạng nơ-ron nhân tạo đó là học tham số (parameter learning) và học cấu trúc (structure learning).

Học tham số là việc thay đổi trọng số của các liên kết giữa các nơ-ron trong một mạng, còn học cấu trúc là việc điều chỉnh cấu trúc của mạng bao gồm thay đổi số lớp nơ-ron, số nơ-ron của mỗi lớp và cách liên kết giữa chúng. Hai vấn đề này có thể được thực hiện đồng thời hoặc tách biệt.

Về mặt phương pháp học, có thể chia ra làm ba loại: học có giám sát hay còn gọi là học có thầy (supervised learning), học tăng cường (reinforcement learning) và học không có giám sát hay còn gọi là học không có thầy ( unsupperviced learning).

1.1.3 Khả năng ứng dụng của mạng nơ-ron nhân tạo

Đặc trưng của mạng nơ-ron nhân tạo là khả năng học và xử lý song song. Nó có thể gần đúng mối quan hệ tương quan phức tạp giữa các yếu tố đầu vào và đầu ra của các quá trình cần nghiên cứu và khi đã học được thì việc kiểm tra độc lập thường cho kết quả tốt. Sau khi đã học xong, mạng nơ-ron nhân tạo có thể tính toán kết quả đầu ra tương ứng với bộ số liệu đầu vào mới.

Về mặt cấu trúc, mạng nơ-ron nhân tạo là một hệ thống gồm nhiều phần tử xử lý đơn giản cùng hoạt động song song. Tính năng này của ANN cho phép nó có thể được áp dụng để giải các bài toán lớn.

Về khía cạnh toán học, theo định lý Kolmogorov, một hàm liên tục bất kỳ f( x1, x2,.. , xn ) xác định trên khoảng In ( với I =[0,1]) có thể được biểu diễn dưới dạng:

2 1

1 1

( ) ( ( ))n n

j ij ij i

f x xχ ψ+

= =

= ∑ ∑ (1.7)

trong đó : χj , Ψij là các hàm liên tục một biến. Ψij là hàm đơn điệu, không phụ thuộc vào hàm f. Mặt khác, mô hình mạng nơ-ron nhân tạo cho phép liên kết có trọng số các phần tử phi tuyến (các nơ-ron đơn lẻ) tạo nên dạng hàm tổng hợp từ các hàm thành phần. Do vậy, sau một quá trình điều chỉnh sự liên kết cho phù hợp (quá trình học), các phần tử phi tuyến đó sẽ tạo nên một hàm phi tuyến phức tạp có khả năng xấp xỉ hàm biểu diễn quá trình cần nghiên cứu. Kết quả là đầu ra của nó sẽ tương tự với kết quả đầu ra của tập dữ liệu dùng để luyện mạng. Khi đó ta nói mạng nơ-ron nhân tạo đã học được mối quan hệ tương quan đầu vào - đầu ra của quá trình và lưu lại mối quan hệ tương quan này thông qua bộ trọng số liên kết giữa các nơ-ron. Do đó, mạng nơ-ron nhân tạo có thể tính toán trên bộ số liệu đầu vào mới để đưa ra kết quả đầu ra tương ứng.

Page 17: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

19

Hồi qui tuyến tính Xấp xỉ bằng mạng nơron

Y = a1X + a2 Y=f(X, a1, …. , an)

Hình 1.7 Sự khác nhau giữa hồi quy tuyến tính và mạng nơ-ron

Với những đặc điểm đó, mạng nơron nhân tạo đã được sử dụng để giải quyết nhiều bài toán thuộc nhiều lĩnh vực của các ngành khác nhau. Các nhóm ứng dụng mà mạng nơ-ron nhân tạo đã được áp dụng rất có hiệu quả là:

• Bài toán phân lớp: Loại bài toán này đòi hỏi giải quyết vấn đề phân loại các đối tượng quan sát được thành các nhóm dựa trên các đặc điểm của các nhóm đối tượng đó. Đây là dạng bài toán cơ sở của rất nhiều bài toán trong thực tế: nhận dạng chữ viết, tiếng nói, phân loại gen, phân loại chất lượng sản phẩm,…

• Bài toán dự báo: Mạng nơ-ron nhân tạo đã được ứng dụng thành công trong việc xây dựng các mô hình dự báo sử dụng tập dữ liệu trong quá khứ để dự đoán số liệu trong tương lai. Đây là nhóm bài toán khó và rất quan trọng trong nhiều ngành khoa học.

• Bài toán điều khiển và tối ưu hoá: Nhờ khả năng học và xấp xỉ hàm mà mạng nơ-ron nhân tạo đã được sử dụng trong nhiều hệ thống điều khiển tự động cũng như góp phần giải quyết những bài toán tối ưu trong thực tế.

Tóm lại, mạng nơ-ron nhân tạo được xem như là một cách tiếp cận đầy tiềm năng để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt là trong tình huống mối quan hệ bản chất vật lý của quá trình cần nghiên cứu không dễ thiết lập tường minh.

1.2 Mạng nơ-ron lan truyền thẳng nhiều lớp

1.2.1 Mạng perceptron một lớp

Mạng perceptron một lớp do F.Rosenblatt đề xuất năm 1960 [15] là mạng truyền thẳng chỉ một lớp vào và một lớp ra không có lớp ẩn. Trên mỗi lớp này có thể có

Page 18: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

20

một hoặc nhiều nơ-ron. Mô hình mạng nơ-ron của Rosenblatt sử dụng hàm ngưỡng đóng vai trò là hàm chuyển. Do đó, tổng của các tín hiệu vào lớn hơn giá trị ngưỡng thì giá trị đầu ra của nơ-ron sẽ là 1, còn trái lại sẽ là 0.

Ngay từ khi mạng Perceptron một lớp được đề xuất nó đã được sử dụng để giải

quyết bài toán phân lớp. Một đối tượng sẽ được nơ-ron i phân vào lớp A nếu

Tổng thông tin đầu vào : ij j iw x θ>∑

Trong đó wij là trọng số liên kết từ nơ-ron j tới nơ-ron i , xj là đầu vào từ nơ-ron j, và θ là ngưỡng của nơ-ron i. Trong trường hợp trái lại đối tượng sẽ được phân vào lớp B.

Việc huấn luyện mạng dựa trên phương pháp học có giám sát với tập mẫu học là {(x(k), d(k))}, k= 1,2, …, p .Trong đó d(k) = [d1

(k), d2(k), …, dn

(k)]T là đầu ra quan sát được tương ứng với đầu vào x(k) = [x1

(k), x2(k), …, xm

(k)]T (với m là số đầu vào, n là số đầu ra và p là cặp mẫu đầu vào - đầu ra dùng cho việc học). Như vậy chúng ta mong rằng sau quá trình học, đầu ra tính toán được y(k) = [y1

(k), y2(k), …, yn

(k)]T sẽ bằng với đầu ra của mẫu học d(k)

( ) ( ) ( ) ( )

1

( ) ( )m

k T k k ki i ij j i

j

y g w x g w x d=

= = =∑ với i=1, 2, …, n ; k = 1,2 , …, p (1.8)

`

Hình 1.8 Mạng perceptron một lớp

.

.

x1

x2

xm =-1

y1

y2

yn

w11

w12

w1m wn1

wn2

wnm

ed

Đầu ra tính toán Đầu ra mong muốn

d2 e2

.

.

ed

(w1m = θ1 , w2m = θ2 , wnm = θn )

Outi = 1 nếu neti ≥ θ

0 nếu neti < θ

với neti = ∑wijxj là tổng thông tin đầu vào của nơ-ron i

Page 19: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

21

Để bắt đầu quá trình luyện mạng, các trọng số được gán giá trị ngẫu nhiên trong khoảng [-3, 3]. Sau đó hiệu chỉnh các trọng số cho phù hợp với mẫu học để làm giảm sai số giữa y(k) và d(k)

Các bước tiến hành :

• Xác định ngẫu nhiên bộ trọng số.

• Với mỗi mẫu học (x(k), d(k)) , k=1,2, …, p thực hiện các bước:

o Tính giá trị y(k) theo công thức

o Xác định sai số δi tại nơ-ron i: δi = di – yi , trong đó di là giá trị đầu ra quan sát được và yi là giá trị đầu ra tính toán tại nơ-ron thứ i

o Tính ∆wij là số gia của trọng số wij (trọng số liên kết giữa đầu vào j tới nơ-ron i) theo công thức: ∆wij =ηδixj trong đó η là tốc độ học (0<η<1)

o Hiệu chỉnh wij(t+1) = wij

(t) + ∆wij =wij(t) +ηδi

(t)xj(t)

trong đó wij(t+1) là

trọng số sau khi điều chỉnh ở lần học tại thời điểm t

Rosenblatt đã chứng minh rằng quá trình học của mạng Perceptron sẽ hội tụ tới bộ trọng số W, biểu diễn đúng các mẫu học với điều kiện là các mẫu này biểu thị các điểm rời rạc của một hàm khả tách tuyến tính nào đó (f: Rn → R được gọi là khả tách tuyến tính nếu các tập {F-1(xk)}, với xk thuộc miền trị của f, có thể tách được với nhau bởi các siêu phẳng trong không gian Rn ).

Năm 1969, Minsky và Papert đã chứng minh một cách chặt chẽ rằng lớp hàm thể hiện sự phụ thuộc giữa đầu vào và đầu ra có thể học bởi mạng Perceptron một lớp là lớp hàm khả tách tuyến tính. Khả tách tuyến tính là trường hợp tồn tại một mặt siêu phẳng để phân cách tất cả các đối tượng của một lớp này với một lớp khác, ví dụ một mặt phẳng sẽ phân chia không gian ba chiều thành hai vùng riêng biệt. Mở rộng ra,

nếu có n đầu vào , n>2 thì công thức 1

n

ij j ii

w x θ=

=∑ tạo nên một siêu phẳng có n-1

chiều trong không gian n chiều, nó chia không gian đó thành hai nửa. Trong nhiều bài toán thực tế đòi hỏi chia các vùng của các điểm trong một siêu không gian thành các lớp riêng biệt. Loại bài toán này gọi là bài toán phân lớp. Bài toán phân lớp có thể giải quyết bằng cách tìm các tham số thích hợp cho một siêu phẳng để nó có thể chia không gian n chiều thành các vùng riêng biệt.

Với tính chất của như đã nêu trên, mạng perceptron một lớp có thể mô tả các hàm logic như AND, OR và NOT. Tuy nhiên nó không thể hiện được hàm XOR. Như vậy chứng tỏ mô hình perceptron một lớp không thể giải quyết bài toán này. Vấn đề này sẽ được giải quyết bằng mô hình mạng nơ-ron perceptron nhiều lớp (Multilayer Perceptron - MLP).

Page 20: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

22

1.2.2 Mạng perceptron nhiều lớp

Mạng perceptron nhiều lớp (Multilayer Perceptron –MLP) còn được gọi là mạng truyền thẳng nhiều lớp là sự mở rộng của mô hình mạng perceptron với sự bổ sung thêm những lớp ẩn và các nơ-ron trong các lớp ẩn này có hàm chuyển (hàm kích hoạt) dạng phi tuyến. Mạng MLP có một lớp ẩn là mạng nơ-ron nhân tạo được sử dụng phổ biến nhất, nó có thể xấp xỉ các hàm liên tục được định nghĩa trên một miền có giới hạn cũng như những hàm là tập hợp hữu hạn của các điểm rời rạc.

a. Giải quyết bài toán XOR với mạng MLP

Ta thấy có thể dùng hai đường thẳng để phân tách với trường hợp hàm XOR.

-0,5+x1+x2=0 và -1,5+x1+x2=0

Hay ta giải hệ bất phương trình

Dễ thấy mỗi bất phương trình ở trên có thể được thực hiện bằng một nơ-ron và đầu ra của hai nơ-ron này (2 bất phương trình) là đầu vào của một hàm AND. Do vậy có thể sử dụng mạng MLP sau để thực hiện chức năng của hàm XOR như sau:

Hình 1.9 Thực hiện hàm XOR bằng mạng MLP

b. Thuật toán học theo phương pháp lan truyền ngược sai số

Thuật toán học theo phương pháp lan truyền ngược sai số do Rumelhart và các cộng sự đề xuất [20] là một trong số những kết quả nghiên cứu quan trọng nhất đối

1 1

X1

X2

-0,51,5

-11

-1

1

1

-1,5

1 Y=X1 XOR X2

X

X

-0,5+x1+x2 > 0

-1,5+x1+x2 < 0

-0,5 + x1 + x2 > 0

1,5 - x1 - x2 > 0

Page 21: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

23

với sự phát triển của mạng nơ-ron nhân tạo. Thuật toán này được áp dụng cho mạng truyền thẳng nhiều lớp trong đó các nơ-ron có thể sử dụng các hàm chuyển là các hàm liên tục có các dạng khác nhau.

Thuật toán sử dụng một tập các mẫu gồm các cặp đầu vào - đầu ra để luyện mạng. Với mỗi cặp đầu vào - đầu ra (x(k),d(k)) thuật toán lan truyền ngược sai số thực hiện hai giai đoạn sau:

• Giai đoạn thứ nhất, mẫu đầu vào x(k) được truyền từ lớp vào tới lớp ra, và ta có kết quả đầu ra tính toán được là y(k).

• Giai đoạn tiếp theo, tín hiệu lỗi được tính toán từ sự khác nhau giữa đầu ra quan sát được d(k) với đầu ra tính toán y(k) sẽ được lan truyền ngược lại từ lớp ra đến các lớp trước để điều chỉnh các trọng số của mạng. Để làm ví dụ ta xét mạng truyền thẳng có một lớp ẩn dưới đây, đối với các mạng có kích thước lớn hơn thì thao tác cũng tương tự.

Mạng nơ-ron được xét có m nơ-ron ở lớp vào, l nơ-ron trong lớp ẩn và n nơ-ron ở lớp ra. Đường kẻ liền thể hiện luồng tín hiệu được truyền từ đầu vào tới đầu ra còn các đường kẻ nét đứt thể hiện luồng tín hiệu lỗi được truyền ngược trở lại từ đầu ra.

Hình 1.10 Lan truyền tín hiệu trong quá trình học theo phương pháp lan truyền ngược sai số

Chúng ta xét một cặp đầu vào - đầu ra để luyện mạng (x,d), để đơn giản chúng ta bỏ ký hiệu mũ k thể hiện số thứ tự của cặp mẫu này trong bộ mẫu dùng để luyện mạng. Khi đưa vào đầu vào x, nơ-ron thứ q trong lớp ẩn sẽ nhận tín hiệu vào của mạng là:

Lớp vào Lớp ẩn Lớp ra

wiq

zq (q=1,…, l)

Page 22: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

24

∑=

=m

jjqjq xvnet

1 (1.9)

nơ-ron q ở lớp ẩn sẽ tính toán và tạo kết quả ở đầu ra của nó là:

∑=

==m

jjqjqq xvgnetgz

1)()( (1.10)

Do đó tín hiệu vào của nơ-ron thứ i trên lớp ra sẽ là:

1 1 1

( )l l m

i iq q iq qj jq q j

net w z w g v x= = =

= =∑ ∑ ∑ (1.11)

Và cuối cùng, đầu ra của nơ-ron i trên lớp ra sẽ là:

1 1 1

( ) ( ) ( ( ))l l m

i i iq q iq qj jq q j

y g net g w z g w g v x= = =

= = =∑ ∑ ∑ (1.12)

Công thức trên cho biết quá trình lan truyền tín hiệu từ đầu vào qua lớp ẩn tới đầu ra. Tiếp theo chúng ta xét tín hiệu lỗi được lan truyền ngược lại từ lớp ra. Trước hết, đối với mỗi cặp giá trị vào – ra chúng ta xây dựng một hàm giá như sau:

[ ]2

22

1 1 1 1

1 1 1( ) ( ) ( ) ( )2 2 2

n n n l

i i i i i iq qi i i q

E w d y d g net d g w z= = = =

⎡ ⎤= − = − = −⎢ ⎥

⎣ ⎦∑ ∑ ∑ ∑ (1.13)

Như vậy với một tập gồm p mẫu học, chúng ta lần lượt xây dựng được p hàm giá như vậy. Việc học của mạng hay nhiệm vụ của giải thuật thực chất là tìm kiếm tập trọng số W trong không gian RM (M là số trọng số có trong mạng) để lần lượt tối thiểu hoá các hàm giá như vậy. Điều đáng chú ý là việc tối thiểu hoá được tiến hành liên tiếp nhau và theo chu kỳ đối với các hàm giá.

Để tối thiểu hoá các hàm giá như vậy, giải thuật lan truyền ngược sai số sử dụng phương pháp giảm gradient để điều chỉnh các trọng số liên kết giữa các nơ-ron. Bản chất của phương pháp này là khi sai số E được vẽ như hàm của tham số gây ra sai số sẽ phải có một cực tiểu tại bộ giá trị nào đó của tham số. Khi quan sát độ dốc của đường cong, chúng ta quyết định phải thay đổi tham số thế nào để có thể tiến gần đến cực tiểu cần tìm kiếm hơn. Trong hình vẽ dưới đây, giá trị của trọng số phải giảm nếu đạo hàm dE/dW là dương

Page 23: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

25

Hình 1.11 Sai số E được xét là hàm của trọng số W

Bằng biểu thức, chúng ta có thể biểu diễn phương pháp giảm gradient như sau:

∆w= w(new) – w(old) = -η.∂E/∂w (1.14)

Ở đây η là hằng số dương xác định tốc độ giảm giá trị của w, còn dấu âm chỉ chiều giảm gradient.

Áp dụng phương pháp giảm gradient đối với các trọng số liên kết giữa các nơ-ron trong lớp ẩn tới các nơ-ron của lớp ra ta có:

iq

iq

Eww

η ∂∆ = −

∂ (1.15)

Do hàm sai số E là một hàm phức tạp và là hàm gián tiếp của trọng số wiq (công

thức 1.13). Sử dụng nguyên tắc tính đạo hàm của hàm gián tiếp cho iq

Ew∂∂

ta có:

[ ] [ ]'( )i iiq i i i q oi q

i i iq

y netEw d y g net z zy net w

η η ηδ∆⎡ ⎤⎡ ⎤ ⎡ ⎤∂ ∂∂ ⎡ ⎤∆ = − = − =⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎣ ⎦∂ ∂ ∂⎢ ⎥⎣ ⎦ ⎣ ⎦ ⎣ ⎦

(1.16)

Trong đó δoi là tín hiệu sai số và chỉ số oi có nghĩa là nút thứ i trong trên lớp ra. Tín hiệu sai số được tính như sau:

[ ] [ ]'( )ioi i i i

i i i

yE E d y g netnet y net

δ∆ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤∂∂ ∂=− = − = −⎢ ⎥ ⎢ ⎥ ⎢ ⎥∂ ∂ ∂⎣ ⎦ ⎣ ⎦ ⎣ ⎦

(1.17)

Trong đó neti là tín hiệu vào của nơ-ron thứ i trên lớp ra và g’(neti) = ∂g(neti)/∂net. Kết quả này tương tự luật học delta áp dụng cho mạng perceptron một lớp với đầu vào bây giờ là đầu ra zq của lớp ẩn.

W W

dE/dw

= tan α > tan α

0

E

Page 24: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

26

Để điều chỉnh trọng số của các liên kết giữa lớp vào tới lớp ẩn ta cũng sử dụng phương pháp giảm gradient và lấy đạo hàm theo các biến trung gian như đã áp ở trên. Xét liên kết giữa nơ-ron thứ j ở lớp vào và nơ-ron thứ q trên lớp ra:

q q qqj

qj q qj q q qj

net z netE E Evv net v z net v

η η η⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤∂ ∂ ∂∂ ∂ ∂

∆ = − = − = −⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥∂ ∂ ∂ ∂ ∂ ∂⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦

(1.18)

Từ công thức (1.13) mỗi thành phần lỗi [di-yi] , i=1, 2,…, n, là hàm của zq do vậy công thức trên có thể tiếp tục biến đổi:

( ) ( ) ( )1

' 'n

qj i i i iq q ji

v d y g net w g net xη=

⎡ ⎤∆ = −⎣ ⎦∑ (1.19)

Sử dụng công thức (1.13) chúng ta viết lại biểu thức (1.15) như sau:

( )1

'n

qj oi iq q j hq ji

v d w g net x xη µδ=

⎡ ⎤∆ = =⎣ ⎦∑ (1.20)

Trong đó δhq là tín hiệu lỗi của nơ-ron thứ q trong lớp ẩn và được định nghĩa như sau:

( )1

'n

qhq q oi iq

iq q q

zE E g net wnet z net

δ δ∆

=

⎡ ⎤ ⎡ ⎤ ⎡ ⎤∂∂ ∂=− = − =⎢ ⎥ ⎢ ⎥ ⎢ ⎥

∂ ∂ ∂⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ ⎣ ⎦∑ (1.21)

Với netq là tín hiệu vào của nơ-ron thứ q, như vậy tín hiệu lỗi của nơ-ron trên lớp ẩn khác với tín hiệu lỗi của nơ-ron trên lớp ra (xem công thức 1.17 và 1.21). Vì sự khác nhau này, thủ tục điều chỉnh trọng số được gọi là luật học delta mở rộng. Nhìn lại công thức (1.21) tín hiệu lỗi δhq của nơ-ron thứ q trong lớp ẩn được xác định từ các tín hiệu lỗi δoi, của các nơ-ron trên lớp ra.

Tổng quát đối với lớp bất kỳ, luật lan truyền ngược có dạng:

jinputioutputjiij xxw __ηδηδ ==∆ (1.22)

Trong đó “output_i ” là đầu ra của nơ-ron i và “ input_j ” là đầu vào của nơ-ron j, δi là tín hiệu học được định nghĩa trong công thức (4.10)

Từ các phân tích trên, thuật toán lan truyền ngược sai số được xây dựng như sau:

Xét một mạng nơ-ron truyền thẳng có Q lớp, q = 1, 2, …, Q, và gọi neti và yi là tín hiệu vào và ra của nơ-ron thứ i trong lớp q. Mạng này có m đầu vào và n đầu ra. Đặt qwij là trọng số của liên kết từ nơ-ron thứ j trong lớp q-1 tới nơ-ron thứ i trong lớp q.

Page 25: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

27

Đầu vào : Một tập các cặp mẫu học {(x(k),d(k)) | k= 1, 2, …, p } và véc tơ đầu vào được bổ sung thêm x(k)

m+1 = - 1 .

Bước 0 (khởi tạo)

Chọn một hằng số η > 0 và Emax (dung sai cho phép). Khởi tạo ngẫu nhiên các trọng số trong khoảng giá trị nhỏ. Đặt E =0 và k = 1.

Bước 1 (thực hiện một quá trình lặp cho việc huấn luyện mạng)

Sử dụng mẫu học thứ k :

Tại lớp vào (q =1), với mọi i ta có : qyi = 1yi = x(k)i

Bước 2 (Lan truyền tín hiệu từ lớp vào tới lớp ra)

( ) ⎟⎟

⎞⎜⎜⎝

⎛== ∑ −

ji

qij

qi

qi

q ywgnetgy 1

Bước 3 (Xác định tín hiệu lỗi Qδi tại lớp ra)

( )( ) ( )i

Qi

Qkii

Q

n

ii

Qki

netgyd

EydE

'

,21

)(

2

1

)(

−=

+−= ∑=

δ Bước 4 (Lan truyền ngược sai số)

Lan truyền ngược sai số để điều chỉnh các trọng số và tính toán tín hiệu lỗi q-1δi cho các lớp trước:

iqi

qij

q yw 1−=∆ δη và ijqold

ijqnew

ijq www ∆+=

( )1 1'q q q qi i ji j

j

g net wδ δ− −= ∑ với q = Q, Q-1, …, 2

Bước 5 (Kiểm tra điều kiện lặp)

Kiểm tra:

if ( k < p ) then

Begin

k=k+1;

Goto bước1;

End

Else

Goto bước6;

Page 26: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

28

Bước 6 (Kiểm tra lỗi tổng cộng hiện thời đã chấp nhận được chưa)

If (E < Emax) then

{kết thúc quá trình học và đưa ra bộ trọng số cuối cùng}

Else

Begin

E=0;

K=1;

Goto bước1 {để bắt đầu một lần học tiếp theo };

End;

Mỗi lần toàn bộ tập mẫu học được lan truyền qua mạng được gọi là một epoch. Số epoch phụ thuộc vào từng trường hợp cụ thể và sự khởi tạo ban đầu. Có trường hợp thuật toán phải sau hàng chục nghìn epoch mới hội tụ tới lời giải. Nếu tham số khởi tạo không phù hợp có thể làm cho quá trình học không đạt kết quả mong muốn. Đối với mỗi epoch ta tính sai số trung bình của mạng theo công thức sau:

2

1 1( )

.

p n

i ik i

y dRMS

p n= =

−=∑∑

(1.23)

Trong đó p là số mẫu được dùng để luyện mạng, n là số biến của véc-tơ đầu ra. Sai số RMS thường được dùng để đánh giá kết quả học của mạng nơ-ron.

c. Một số yếu tố ảnh hưởng đến quá trình học theo phương pháp lan truyền ngược sai số

Khởi tạo các trọng số

Các giá trị được khởi tạo ban đầu cho các trọng số trong mạng lan truyền ngược sai số ảnh hưởng rất lớn đến kết quả học cuối cùng của mạng. Các giá trị này thường được khởi tạo ngẫu nhiên trong phạm vi giá trị tương đối nhỏ. Thông thường hàm chuyển sử dụng cho mạng MLP là hàm sigmoid, do vậy nếu ta chọn các giá trị trọng số khởi tạo lớn thì các hàm này có thể bão hoà ngay từ đầu và dẫn tới hệ thống có thể bị tắc ngay tại một cực tiểu địa phương hoặc tại một vùng bằng phẳng nào đó gần điểm xuất phát. Theo nghiên cứu của Wessels và Barnard, năm 1992 [18], thì việc

khởi tạo các trọng số liên kết wij nên trong phạm vi 3 / , 3 /i ik k⎡ ⎤−⎣ ⎦ với ki là số liên

kết của các nơ-ron j tới nơ-ron i .

Hằng số học η

Page 27: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

29

Hằng số học η cũng là một yếu tố quan trọng ảnh hưởng đến hiệu quả và độ hội tụ của giải thuật lan truyền ngược sai số. Không có hằng số η phù hợp cho tất cả các bài toán khác nhau. Hằng số học này thường được chọn bằng thực nghiệm cho mỗi bài toán ứng dụng cụ thể bằng phương pháp thử sai.

Trong nhiều ứng dụng thực tế cho thấy một hằng số học có thể phù hợp ở thời điểm bắt đầu của quá trình học nhưng lại không phù hợp với giai đoạn sau của quá trình học. Do đó, có một phương pháp hiệu quả hơn đó là sử dụng hằng số học thích nghi. Một cách xử lý đơn giản cho vấn đề này đó là kiểm tra xem các trọng số mới có làm giảm hàm giá hay không, nếu không thì có thể các trọng số đã vượt quá xa vùng cực tiểu và như vậy hằng số η cần phải giảm. Trái lại, nếu sau vài vòng lặp hàm giá liên tục giảm thì ta có thể thử tăng hằng số η để đẩy nhanh hơn tốc độ hội tụ đến giá trị cực tiểu. Năm 1991, trong nghiên cứu của mình Hertz và các cộng sự [9] đã đề xuất luật điều chỉnh hằng số học như sau:

trong đó ∆E là thay đổi của hàm giá, a và b là các hằng số dương, việc ∆E luôn nhỏ hơn 0 được đánh giá dựa trên k bước lặp liên tiếp.

Hằng số quán tính

Tốc độ học của giải thuật lan truyền ngược sai số có thể rất chậm nếu hằng số học nhỏ, nhưng nếu hằng số học lớn thì nó lại có thể gây ra sự dao động lớn trong quá trình tìm giá trị cực tiểu theo phương pháp giảm gradient. Để giải quyết vấn đề này người ta thường thêm thành phần quán tính vào các phương trình hiệu chỉnh trọng số như sau:

∆w(t) = -η∇E(t) + α ∆w( t-1) (α là hằng số quán tính, α∈[ 0, 1] )

Nhờ thành phần này, quá trình học có thể vượt qua điểm cực tiểu địa phương để tìm đến điểm cực tiểu toàn cục, đồng thời thành phần quán tính cũng ngăn cản sự thay đổi đột ngột của các trọng số theo hướng khác với hướng mà lời giải đang di chuyển đến.

+a nếu ∆E luôn nhỏ hơn 0 (hàm giá liên tục được giảm)

-bη nếu ∆E >0

0 trong các trường hợp còn lại

Page 28: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

30

Hình 1.12 Minh họa về ý nghĩa của quán tính trong thực tế

Hàm giá:

Trong phần nghiên cứu trên hàm giá được chọn là hàm bình phương sai số

2

1

1( ) ( )2

n

i ii

E w d y=

= −∑ . Tuy nhiên, nó có thể được thay thế bằng một hàm F(yi, di)

bất kỳ có đạo hàm và đạt cực tiểu khi hai đối số di và yi bằng nhau. Thông thường hàm giá được chọn có dạng :

1

1 ( )n

pi i

iE d y

p =

= −∑ với 1≤ p ≤ ∞ (1.24)

Như vậy khi chọn p = 2 ta có hàm giá là hàm bình phương sai số như đã xét ở trên.

1.2.3 Một số vấn đề cần chú ý khi sử dụng mạng MLP

Mạng nơ-ron perceptron nhiều lớp là loại mạng nơ-ron được sử dụng trong nhiều ứng dụng thực tế. Tuy nhiên, để mạng có thể đưa ra kết quả tốt, chúng ta cần quan tâm đến một số vấn đề có ảnh hưởng khá quan trọng đến hiệu quả làm việc của nó bao gồm: vấn đề chuẩn hoá số liệu đầu vào, vấn đề học chưa đủ và học quá của mạng, vấn đề lựa chọn một cấu trúc mạng phù hợp với bài toán.

a. Vấn đề chuẩn hoá số liệu đầu vào

Mạng MLP thường sử dụng hàm chuyển là hàm sigmoid có dạng như sau:

Hình 1.13 Hàm sigmoid g(x) = 1/(1+e-x)

0 x

g(x) = 1/(1+e-x)

1 2 3-3 -2 -1

1

0.5

Page 29: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

31

Với dạng hàm này, giá trị ở đầu ra của mỗi nơ-ron nằm trong phạm vi khoảng (0,1) và nó đạt các giá trị bão hoà ( xấp xỉ 0 hay 1 ) khi ⎢x ⎢ lớn. Do đó, khi đầu vào của mạng có giá trị tuyệt đối lớn thì ta cần chuẩn hoá nó về khoảng có giá trị nhỏ, nếu không thì các nơ-ron tại các lớp ẩn ngay ban đầu đã có thể đạt giá trị bão hoà và quá trình học của mạng không đạt kết quả mong muốn. Với dạng hàm như trên thì giá trị đầu vào của mạng thường được chuẩn hoá về khoảng thuộc đoạn [-3, 3] . Mặt khác, do tín hiệu đầu ra của nơ-ron nằm trong khoảng giá trị (0,1) nên các giá trị đầu ra thực tế trong các mẫu học cũng cần chuẩn hoá về khoảng giá trị này để có thể dùng cho quá trình luyện mạng. Do vậy trong quá trình tính toán, để có các giá trị thực tế ở đầu ra của mạng chúng ta cần phải chuyển các giá trị trong khoảng (0,1) về miền các giá trị thực tế.

b. Vấn đề học chưa đủ và học quá thuộc của mạng

Vấn đề mấu chốt khi xây dựng một mạng nơ-ron nhân tạo là làm thế nào mạng có khả năng tổng quát hoá cao để đưa ra kết quả tốt cả với những trường hợp đầu vào của mạng không nằm trong tập mẫu đã dùng để luyện mạng. Giống như các mô hình hồi quy phi tuyến khác, đối với mạng nơ-ron nhân tạo ta cũng phải giải quyết hai vấn đề là ANN học chưa đủ (underfitting) và học quá (overfitting). Khi mạng có cấu trúc (số nút ẩn và liên kết) cũng như số lần học chưa đủ so với nhu cầu của bài toán thì sẽ dẫn tới tình trạng mạng không đủ khả năng mô tả gần đúng mối quan hệ tương quan giữa đầu vào và đầu ra của quá trình cần dự báo và dẫn tới học chưa đủ. Trái lại, nếu mạng quá phức tạp (quá nhiều nút ẩn và quá nhiều tham số) và được học “quá khít” đối với các mẫu dùng để luyện mạng thì có thể dẫn tới tình trạng mạng học cả thành phần nhiễu lẫn trong các mẫu đó, đây là tình trạng “học quá thuộc” của mạng. Vấn đề nêu trên có thể làm cho nhiều loại mạng nơ-ron, đặc biệt là mạng MLP có thể có những trường hợp cho kết quả dự đoán rất sai lệch với thực tế.

Một số giải pháp cho vấn đề học quá của mạng:

• Sử dụng tập số liệu có tính đại diện tốt để luyện mạng: Đây được xem là một cách khá tốt để tránh hiện tượng overfitting. Khi tập mẫu dùng để luyện mạng thể hiện được nhiều trạng thái có thể xẩy ra của quá trình cần nghiên cứu thì sau khi học mạng sẽ có khả năng tổng quát hoá tương đối tốt từ tập dữ liệu đó và sẽ không chịu ảnh hưởng nhiều của hiện tượng overfitting. Ngoài ra một số biện pháp dưới đây cũng có thể góp phần quan trọng giúp khắc phục hiện tượng overfitting của mạng.

• Lựa chọn cấu trúc mô hình phù hợp: Việc lựa chọn mô hình của mạng (số lớp ẩn, số nơ-ron trên mỗi lớp ẩn) có ảnh hưởng quan trọng đến hiện tượng học chưa đủ (underfitting) và học quá (overfitting) của mạng. Nghiên cứu của Steve Lawrence và C.Lee Giles [11] về bài toán nội suy hàm y = sin(x/3) + v, 0≤ x ≤20.

Page 30: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

32

với v là biến ngẫu nhiên nằm trong khoảng (- 0.25 , 0.25) cho thấy nếu mạng chỉ gồm một nút ẩn thì mạng không thể học được hàm này. Mạng có hai nút ẩn có khả năng tổng quát hoá tốt nhất (tuy không chính xác hoàn toàn với các mẫu nhưng nó tạo nên giáng điệu gần với hàm cần xấp xỉ nhất và nó đã không quá khít với nhiễu của mẫu học). Các mạng có độ phức tạp hơn (10 nút ẩn, 50 nút ẩn) tuy nó có thể học khá chính xác các mẫu được sử dụng nhưng chính điều này lại làm cho nó học quá nhiều cả thành phần nhiễu nên khả năng tổng quát hoá giảm và dẫn tới hiện tượng học quá (overfitting).

Hình 1.14 Nội suy hàm y = sin(x/3) + v, 0≤ x ≤ 20 sử dụng MLP

• Dừng học đúng lúc: Năm 1991, trong một nghiên cứu về vấn đề học quá của mạng, hai tác giả Nelson và Illingworth [17] đã đưa ra giải pháp dừng học đúng lúc để tránh hiện tượng học quá của mạng như sau:

o Tập mẫu được chia làm hai phần: một phần dùng để luyện mạng và phần còn lại để kiểm thử.

o Sử dụng các giá trị khởi tạo nhỏ

o Sử dụng hằng số tốc độ học có giá trị thấp.

o Tính toán sự thay đổi lỗi kiểm thử trong quá trình luyện mạng.

o Dừng học khi thấy lỗi kiểm thử bắt đầu tăng

c. Lựa chọn kích thước mạng

Các công trình dựa trên định lý của Kolmogorov dự kiến rằng toàn bộ các ánh xạ liên tục từ [0,1]p đến [0,1]n đều có thể được xấp xỉ bằng một mạng perceptron ba lớp có lớp vào gồm p nơ-ron, lớp ra gồm n nơ-ron và lớp ẩn gồm (2p+1) nơ-ron.

Tuy nhiên không thể chỉ ra được chính xác số lượng nơ-ron tối ưu trong mạng, tính chất của các nơ-ron, tức là dạng phi tuyến cụ thể thực hiện phép xấp xỉ này.

Page 31: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

33

Một số công trình nghiên cứu về chủ đề này cho rằng số nơ-ron tối ưu ở lớp ẩn thường nhỏ hơn (2p+1).

Ngoài ra cũng cần phải nói cơ sở dữ liệu học phải có kích thước phù hợp với kiến trúc mạng. Theo Vapnik và Chervonenkis, cơ sở dữ liệu học phải có số mẫu thoả mãn:

N ≈ 10.Nw, ở đó Nw là số trọng số của mạng. (1.18)

Gọi số nơ-ron thuộc lớp ẩn là L, số nơ-ron ở lớp vào là p thì trọng số của các kết nối giữa lớp vào và lớp ẩn thứ nhất (kể cả ngưỡng) là:

D=(p+1).L (1.19)

Theo một số kết quả nghiên cứu, số mẫu của cơ sở dữ liệu học cần phải thoả mãn

N ≈ 4.D (1.20)

Khi số lượng mẫu của cơ sở dữ liệu học chưa đạt đến giới hạn cần thiết thì ta nên làm giảm số lượng các kết nối để tránh hiện tượng học thuộc lòng.

Kết luận chương Trong chương này chúng ta đã tìm hiểu các khái niệm, cấu trúc và khả năng ứng

dụng của mạng nơ-ron nhân tạo. Luận văn đã trình bày chi tiết về mạng nơ-ron nhiều lớp truyền thẳng và các thuật toán học đối với loại mạng này. Mạng nơ-ron nhân tạo được coi là một công cụ mạnh, mềm dẻo để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt trong các trường hợp mà mối quan hệ giữa các quá trình không dễ thiết lập một cách tường minh. Do đó, khả năng ứng dụng của nó là rất lớn đặc biệt trong bài toán dự báo. Trong chương tiếp theo, chúng ta sẽ nghiên cứu giải thuật di truyền và ứng dụng giải thuật di truyền vào việc tối ưu hoá trọng số của mạng nơ-ron nhân tạo.

Page 32: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

34

CCHHƯƯƠƠNNGG 22 -- KKẾẾTT HHỢỢPP GGIIẢẢII TTHHUUẬẬTT DDII TTRRUUYYỀỀNN VVỚỚII GGIIẢẢII TTHHUUẬẬTT LLAANN TTRRUUYYỀỀNN NNGGƯƯỢỢCC SSAAII SSỐỐ ĐĐỂỂ TTỐỐII ƯƯUU HHOOÁÁ TTRRỌỌNNGG SSỐỐ MMẠẠNNGG NNƠƠ--RROONN NNHHÂÂNN TTẠẠOO

Trong chương trước chúng ta đã nghiên cứu giải thuật “lan truyền ngược sai số”, đây là một phương pháp học của mạng nơ-ron nhân tạo, nó cho phép điều chỉnh trọng số của mạng để tối thiểu hoá hàm sai số E. Giải thuật này hoạt động dựa trên cơ chế giảm gradient, với những hàm đơn giản có một cực trị thì phương pháp giảm gradient đưa ta đến cực trị toàn cục. Tuy nhiên, chúng ta biết rằng hàm sai số E trong mạng nơ-ron nhiều lớp là một hàm có bề mặt rất phức tạp với rất nhiều cực trị địa phương, do đó phương pháp này không thể đảm bảo cho ta tìm thấy được một cực trị toàn cục trên bề mặt hàm giá này. Chính vì vậy, để cải thiện giải thuật, người ta thường tìm cách thay đổi hằng số học hoặc thêm vào đó thành phần quán tính để cho phép có thể vượt qua những cực trị địa phương trong quá trình tìm kiếm [8,9,10,16,18,20,21]. Việc lựa chọn hằng số học và hằng số quán tính cũng là một vấn đề rất khó khăn, bởi vì nếu chúng quá lớn đôi khi dẫn đến tình trạng không ổn định của quá trình tìm kiếm, còn nếu chọn quá nhỏ thì lại dẫn đến tốc độ học chậm và khả năng vượt qua các cực trị địa phương thấp. Quá trình tìm kiếm trên những hàm giá như thế này đã được chứng minh là một bài toán NP đầy đủ nghĩa là ta không thể sử dụng được một giải pháp tổng quát có độ phức tạp đa thức để đạt đến kết quả.

Giải thuật di truyền (Genetic Algorithms-GA) được biết đến như một giải thuật tìm kiếm dựa trên học thuyết về chọn lọc tự nhiên và nó cho phép ta đạt được tới cực trị toàn cục. Luận văn nghiên cứu việc sử dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số của mạng nơ-ron nhân tạo giúp mạng có thể học được tốt hơn [8].

2.1 Giới thiệu giải thuật di truyền Giải thuật di truyền đã được đề cập trong rất nhiều tài liệu, trong đó có các công

trình của D.E. Goldberg [8] và Thomas Back [4]. Phần này chỉ trình bày các khái niệm căn bản của giải thuật di truyền cũng như khả năng ứng dụng của nó.

2.1.1 Giới thiệu

Từ trước đến nay, trong các nghiên cứu và ứng dụng tin học đã xuất hiện nhiều bài toán chưa tìm ra được phương pháp giải nhanh và hợp lý. Phần lớn đó là các bài toán tối ưu nảy sinh trong các ứng dụng. Để giải các bài toán này người ta thường phải tìm đến một giải thuật hiệu quả mà kết quả thu được chỉ là xấp xỉ tối ưu. Trong

Page 33: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

35

nhiều trường hợp chúng ta có thể sử dụng giải thuật xác suất, tuy không bảo đảm kết quả tối ưu nhưng có thể chọn các giá trị sao cho sai số đạt được sẽ nhỏ như mong muốn.

Theo lời giải xác suất, việc giải bài toán quy về quá trình tìm kiếm trên không gian tập hợp các lời giải có thể. Tìm được lời giải tốt nhất và quá trình được hiểu là tối ưu. Với miền tìm kiếm nhỏ, một số thuật toán cổ điển được sử dụng. Tuy nhiên đối với các miền lớn, phải sử dụng các kỹ thuật trí tuệ nhân tạo đặc biệt, giải thuật di truyền là một trong những công cụ đó. Ý tưởng của GA là mô phỏng những gì mà tự nhiên đã thực hiện. GA hình thành dựa trên quan niệm cho rằng: quá trình tiến hoá tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và tự nó đã mang tính tối ưu.

Giải thuật di truyền áp dụng quá trình tiến hóa tự nhiên để giải các bài toán tối ưu trong thực tế (từ tập các lời giải có thể ban đầu thông qua nhiều bước tiến hóa hình thành các tập hợp mới với lời giải tốt hơn và cuối cùng sẽ tìm được lời giải gần tối ưu) [4].

Những vấn đề căn bản được đặt ra là: Áp dụng di truyền tự nhiên vào giải thuật di truyền như thế nào? Cách biểu diễn tập hợp các lời giải ra sao? Chúng ta sẽ tìm hiểu chi tiết vấn đề này trong phần tiếp theo.

2.1.2 Tư tưởng chính của giải thuật di truyền

Giải thuật di truyền là một loại thuật toán mô phỏng các hiện tượng tự nhiên: kế thừa và đấu tranh sinh tồn để cải tiến lời giải và khảo sát không gian lời giải.

Khái niệm kế thừa và đấu tranh sinh tồn được giải thích qua ví dụ về sự tiến hoá của một quần thể thỏ như sau:

Có một quần thể thỏ. Trong số đó có một số con nhanh nhẹn và thông minh hơn những con khác. Những chú thỏ nhanh nhẹn và thông minh có xác suất bị chồn, cáo ăn thịt nhỏ hơn, do đó chúng tồn tại để làm những gì tốt nhất có thể: tạo thêm nhiều thỏ tốt. Dĩ nhiên, một số thỏ chậm chạp, đần độn cũng sống chỉ vì may mắn. Quần thể những chú thỏ còn sống sót sẽ bắt đầu sinh sản. Việc sinh sản này sẽ tạo ra một hỗn hợp tốt về “nguyên liệu di truyền thỏ”: Một số thỏ chậm chạp có con với những con thỏ nhanh, một số thỏ nhanh với thỏ nhanh, một số thỏ thông minh với thỏ đần độn,… Và trên tất cả, thiên nhiên thỉnh thoảng lại ném vào một con thỏ “hoang dã” bằng cách làm đột biến nguyên liệu di truyền thỏ. Những chú thỏ con, do kết quả này sẽ nhanh hơn và thông minh hơn những con trong quần thể gốc vì có nhiều bố mẹ nhanh nhẹn và thông minh hơn đã thoát chết khỏi chồn, cáo. (Thật hay là những con chồn cáo cũng trải qua những tiến trình tương tự, nếu không những con thỏ sẽ trở nên nhanh chóng và thông minh đến nỗi những con chồn, cáo không thể bắt chúng được).

Page 34: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

36

Khi tìm kiếm lời giải tối ưu, GA cũng thực hiện các bước tương ứng với câu chuyện đấu tranh sinh tồn của loài thỏ. GA cũng sử dụng các thuật ngữ vay mượn của di truyền học. Ta có thể nói về các cá thể (hay kiểu gen, cấu trúc) trong một quần thể, những cá thể này cũng còn được gọi là các nhiễm sắc thể (chromosome). Điều này có thể gây một chút nhầm lẫn: mỗi tế bào của một cơ thể của một chủng loại đã cho mang một số loại nhiễm sắc thể nào đó (ví dụ ở người có 46 nhiễm sắc thể), nhưng trong GA ta chỉ nói về những cá thể có một nhiễm sắc thể. Các nhiễm sắc thể được tạo thành từ các đơn vị - các gen - biểu diễn trong một chuỗi tuyến tính. Mỗi gen kiểm soát một hoặc nhiều đặc trưng. Gen với những đặc trưng nhất định có vị trí nhất định trong nhiễm sắc thể. Bất cứ đặc trưng nào của cá thể cũng có thể tự biểu hiện một cách phân biệt và gen có thể nhận một số giá trị khác nhau. Một nhóm các gen (nhiễm sắc thể) sẽ biểu diễn một lời giải của bài toán đang giải (ý nghĩa, cấu trúc của nhiễm sắc thể được người sử dụng xác định trước). Một tiến trình tiến hoá được thực hiện trên một quần thể các nhiễm sắc thể tương ứng với một quá trình tìm kiếm lời giải trong không gian lời giải.

Thực ra, GA thuộc lớp các thuật toán xác suất, nhưng lại rất khác những thuật toán ngẫu nhiên vì chúng kết hợp các phần tử tìm kiếm trực tiếp và ngẫu nhiên. Khác biệt quan trọng giữa phương pháp tìm kiếm của GA và các phương pháp tìm kiếm khác là GA duy trì và xử lý một tập các lời giải (quần thể) - tất cả các phương pháp khác chỉ xử lý một điểm trong không gian tìm kiếm. Chính vì thế, GA mạnh hơn các phương pháp tìm kiếm hiện có rất nhiều.

Cấu trúc của giải thuật di truyền đơn giản tương tự như cấu trúc của bất kì một chương trình tiến hoá nào. Ở bước lặp t, giải thuật di truyền duy trì một quần thể các lời giải (các nhiễm sắc thể), { }1 2( ) , ,...,t t t

nP t x x x= . Mỗi lời giải tix được lượng giá để

biết được độ “thích nghi” của nó. Sau đó ở lần lặp thứ t+1, một quần thể mới được hình thành bằng cách chọn giữ lại những cá thể thích nghi nhất. Một số cá thể của quần thể này trải qua những biến đổi nhờ lai tạo (phép lai) và đột biến (phép đột biến), hình thành nên những lời giải mới. Phép lai kết hợp các tính chất của hai nhiễm sắc thể ‘cha’ và ‘mẹ’ để tạo ra các nhiễm sắc thể ‘con’ bằng cách hoán vị các đoạn gen tương ứng của cha và mẹ. Ví dụ: nếu cha mẹ được biểu diễn bằng vectơ 5 chiều (a1,b1,c1,d1,e1) và (a2,b2,c2,d2,e2), thì lai tạo, hoán vị tại vị trí thứ 2 sẽ sinh ra các nhiễm sắc thể con (a1,b1,c2,d2,e2) và (a2,b2,c1,d1,e1). Phép lai cho phép trao đổi thông tin giữa các lời giải.

Khác với phép lai, phép đột biến thay đổi một cách ngẫu nhiên một hay nhiều gen của nhiễm sắc thể được chọn, thay đổi này được thực hiện với một xác suất thể hiện tốc độ đột biến. Phép đột biến cho phép đưa thêm các thông tin mới vào quần thể làm cho chất liệu di truyền phong phú thêm.

Page 35: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

37

Sau đây chúng ta sẽ tìm hiểu về một giải thuật di truyền đơn giản.

2.1.3 Giải thuật di truyền đơn giản

a. Cấu trúc của giải thuật di truyền đơn giản

Trong giải thuật di truyền đơn giản, hệ gen của cá thể được biểu diễn thành một chuỗi nhị phân gồm 2 giá trị 0 và 1. Mỗi thành phần trong chuỗi số gọi là allele (gen tương ứng). Giải thuật di truyền đơn giản bao gồm 3 toán tử sau:

- Tái tạo (Reproduction)

- Lai ghép (Crossover)

- Đột biến (Mutation)

Xét ví dụ bài toán hộp đen như sau: Cho một hộp đen với một dãy 5 công tắc ở đầu vào. Một tổ hợp các trạng thái của 5 công tắc ứng với một tín hiệu ra (output) của hàm f, biểu diễn theo toán học là f(s), trong đó s là một tổ hợp các trạng thái cụ thể của 5 công tắc. Mục tiêu của bài toán là phải đặt các công tắc như thế nào để đặt được giá trị tối đa có thể có của hàm f. Với những phương pháp khác của bài toán tối ưu, chúng ta có thể làm việc trực tiếp với bộ các thông số (việc đặt các công tắc) và bật tắt các công tắc từ một trạng thái này sang trạng thái khác bằng cách dùng những quy tắc chuyển đổi theo phương pháp chuyên biệt. Với giải thuật di truyền đơn giản, đầu tiên ta mã hoá dãy các công tắc thành một chuỗi có chiều dài xác định. Cách mã hoá rất tự nhiên: dùng chuỗi dài 5 kí tự gồm các giá trị 0 và 1, với quy ước ‘0’ = tắt, ‘1’ = mở. Ví dụ: chuỗi 11101 nghĩa là công tắc thứ 4 tắt, 4 công tắc còn lại mở. Với giải thuật di truyền đơn giản, ta không cần biết nguyên tắc làm việc của hộp đen.

Giải thuật di truyền đơn giản bắt đầu với một quần thể các chuỗi và sau đó sẽ phát sinh thành công những quần thể chuỗi khác. Với bài toán hộp đen, một sự bắt đầu ngẫu nhiên bằng cách tung đồng tiền (ngửa = ‘1’, sấp= ‘0’) có thể sản sinh quần thể ban đầu có kích thước n=4 như sau:

01101 11000 01000 10011

Tiếp theo, dưới sự tác động của các toán tử di truyền, quần thể trên sẽ tiến hoá để cho ra đời quần thể mới có độ thích nghi cao hơn.

Tái tạo:

Tái tạo là một quá trình trong đó các chuỗi biểu diễn cá thể được sao chép lại tuỳ theo giá trị của hàm mục tiêu f (hàm thích nghi). Toán tử này được xem là quá trình

Page 36: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

38

chọn lọc trong tự nhiên. Hàm mục tiêu f(i) được gán cho mỗi cá thể trong quần thể. Việc sao chép lại các chuỗi tuỳ theo giá trị thích nghi của chúng có nghĩa là: Những chuỗi có giá trị thích nghi cao hơn sẽ có nhiều cơ hội đóng góp các chuỗi con cho thế hệ tiếp theo.

Thao tác sinh sản hay còn gọi là thao tác chọn cha mẹ được điều khiển bằng cách quay bánh xe roulette, trong đó mỗi chuỗi trong quần thể chiếm một khe có kích thước tỉ lệ với độ thích nghi (fitness) của nó trên bánh xe.

Giả sử các chuỗi của quần thể ban đầu đã khởi tạo trong bài toán hộp đen có các giá trị hàm thích nghi như trong bảng sau. Lấy tổng độ thích nghi của 4 chuỗi, chúng ta được 1170. Ta sẽ tính tỉ lệ % độ thích nghi của từng chuỗi trong quần thể:

Bảng 2.1 Các chuỗi của bài toán mẫu và các giá trị thích nghi

STT Chuỗi Độ thích nghi Tỉ lệ (%) 1 01101 169 14.4 2 11000 576 49.2 3 01000 64 5.5 4 10001 361 30.9

Tổng cộng 1170 100.0

Bánh xe rollete được đánh trọng số phù hợp cho sự tái tạo của thế hệ này được thể hiện trên hình sau:

114.4%

249.2%

35.5%

430.9%

Hình 2.1 Sự sinh sản đơn giản phân bố các chuỗi con cháu nhờ sử dụng bánh xe

roulette với các khe hở tỷ lệ với độ thích nghi

Với bài toán hộp đen, để sinh sản chúng ta chỉ cần quay bánh xe roulette 4 lần đối với bài toán này, chuỗi 1 có giá trị thích nghi là 169, đại diện cho 14.4% bánh xe roulette, và cứ mỗi lần quay xác suất chọn chuỗi 1 là 0.144. Tương tự với các chuỗi còn lại. Mỗi khi chúng ta yêu cầu một thế hệ khác, một vòng quay đơn giản của bánh xe đánh trọng số sẽ chọn ra được ứng cử viên để sinh sản. Bằng cách này, những chuỗi thích nghi hơn sẽ có một số lượng con cháu lớn hơn trong thế hệ kế tiếp.

Page 37: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

39

Lai ghép:

Mỗi khi một chuỗi được chọn để sinh sản, một bản sao chính xác của chuỗi đó sẽ được tạo ra. Các bản sao này được đưa vào bể ghép đôi (matingpool). Toán tử lai ghép đơn giản có thể được tiến hành theo hai bước:

Bước 1: Các thành viên của các chuỗi đơn giản mới ở trong bể ghép được ghép đôi với nhau một cách ngẫu nhiên.

Bước 2: Mỗi cặp chuỗi sẽ trải qua việc ghép chéo như sau: Một số nguyên chỉ vị trí k dọc theo chuỗi sẽ được lựa chọn qua giá trị ngẫu nhiên nằm trong khoảng từ 1 đến chiều dài chuỗi L-1 ([1, L-1]). Hai chuỗi mới sẽ được tạo ra bằng cách hoán đổi tương ứng các chuỗi ký tự từ vị trí 1 đến k và từ k+1 đến L của hai chuỗi cha-mẹ cho nhau. Ví dụ: xét 2 chuỗi A1 và A2 từ quần thể ban đầu:

A1 = 0110|1

A2 = 1100|0

Giả sử trong khi chọn một số ngẫu nhiên nằm trong khoảng từ 1 đến 4, chúng ta được k = 4 (như được chỉ ra bằng dấu ngăn cách “|”). Kết quả của việc ghép chéo làm sinh ra hai chuỗi mới A’1 và A’2, trong đó dấu ’ có nghĩa là các chuỗi này là phần tử của thế hệ mới.

A’1 = 01100

A’2 = 11001

Cơ chế sinh sản và ghép chéo đơn giản, bao gồm việc sinh số ngẫu nhiên, sao chép chuỗi và trao đổi các chuỗi thành phần. Tuy nhiên, điểm cần nhấn mạnh là việc sinh sản và trao đổi thông tin có cấu trúc (dù là một cách ngẫu nhiên) của cả quá trình ghép chéo làm cho các giải thuật di truyền tăng thêm sức mạnh.

Đột biến:

Nếu sự sinh sản theo độ thích nghi kết hợp với sự ghép chéo cho giải thuật di truyền có năng lực xử lý tốt hơn, thì sự đột biến đóng một vai trò quyết định thứ hai trong hoạt động của giải thuật di truyền. Sự đột biến là cần thiết bởi vì: cho dù sự sinh sản và ghép chéo đã tìm kiếm hiệu quả và tái kết hợp lại các gen với nhau, nhưng thỉnh thoảng chúng có thể làm mất một vài gen hữu ích nào đó (bít 1 hay bít 0 tại những vị trí đặc biệt nào đó). Trong các hệ thống gen nhân tạo, toán tử đột biến sẽ chống lại sự mất mát không được khôi phục đó. Trong giải thuật di truyền đơn giản, đột biến là sự thay đổi ngẫu nhiên và không thường xuyên (với xác xuất nhỏ) trị số vị trí của một chuỗi. Trong việc mã hóa nhị phân của bài toán hộp đen có nghĩa là chỉ cần đổi 1 thành 0 và ngược lại. Sự đột biến là một hoạt động ngẫu nhiên trong

Page 38: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

40

không gian chuỗi, khi được dùng cùng với sự sinh sản và ghép chéo nó sẽ là một chính sách bảo hiểm chống lại nguy cơ mất mát những gen quan trọng.

Ba toán tử tái tạo, lai ghép, đột biến được áp dụng lặp đi lặp lại để tạo ra nhiễm sắc thể mới. Coi như một thế hệ mới tương ứng với một quá trình sinh sản đã được tạo xong bao gồm một quần thể các chuỗi nhiễm sắc thể, trong giải thuật di truyền có thể sinh ra nhiều thế hệ.

b. Sơ đồ giải thuật di truyền đơn giản

Giải thuật di truyền bao gồm các bước sau:

1. Khởi tạo quần thể ban đầu của các chuỗi nhiễm sắc thể.

2. Xác định giá trị hàm mục tiêu cho mỗi một chuỗi nhiễm sắc thể.

3. Tạo các chuỗi nhiễm sắc thể mới bằng sinh sản từ các chuỗi nhiễm sắc thể hiện tại, có tính đến ghép chéo và đột biến xảy ra (nếu có).

4. Xác định hàm mục tiêu cho các chuỗi nhiễm sắc thể mới và đưa nó vào trong một quần thể mới.

5. Nếu điều kiện dừng đã thỏa mãn thì dừng lại và trả về chuỗi nhiễm sắc thể tốt nhất cùng với giá trị hàm mục tiêu của nó, nếu không thì quay về bước 3.

Lưu đồ thuật toán:

Page 39: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

41

Hình 2.2 Lưu đồ thuật toán của giải thuật di truyền đơn giản

2.1 Ứng dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số của mạng nơ-ron nhân tạo

Như chúng ta đã biết sử dụng giải thuật lan truyền ngược sai số để tối ưu hoá trọng số của mạng nơ-ron nhân tạo đang được sử dụng rộng rãi hiện nay. Tuy nhiên, giải thuật này hoạt động theo cơ chế giảm gradient nên nó khó có thể tìm ra được cực trị toàn cục. Trong nghiên cứu của mình tôi sử dụng giải thuật di truyền để tối ưu hoá trọng số của mạng giúp quá trình học của mạng được tốt hơn.

Để có thể sử dụng được giải thuật di truyền vào việc học của mạng nơ-ron cần phải thực hiện một số bước như sau:

- Xây dựng hàm giá

- Mã hoá nhiễm sắc thể

- Thực hiện giải thuật di truyền

Tạo quần thể ban đầu của các chuỗi nhiễm sắc thể

Xác định giá trị hàm mục tiêu của các chuỗi nhiễm sắc thể

Tạo các chuỗi nhiễm sắc thể bằng cách sinh sản từ các chuỗi nhiễm sắc thể hiện tại. (Có xét đến ghép chéo và đột biến xảy ra)

Tính toán các giá trị mục tiêu của các chuỗi nhiễm sắc thể mới và đưa nó vào một quần thể mới

Kiểm tra xem điều kiện dừng đã thoả mãn chưa?

Kết thúc

Y

N

Page 40: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

42

2.2.1 Xây dựng hàm giá

Hàm giá này sẽ được sử dụng để tạo nên độ phù hợp của các cá thể và của cả quần thể trong GA. Trong nghiên cứu này tôi sử dụng hàm sai số căn quân phương RMSE của tập mẫu học.

( )2

1 1

1 p n

ij iji j

RMSE y dpn = =

= −∑∑ (2.1)

Trong đó:

- yij, dij là đầu ra của mạng và đầu ra mong muốn của đầu ra thứ j tại mẫu học thứ i

- n là số đầu ra của mạng

- p là số mẫu học

Trong quá trình tiến hoá của toàn bộ quần thể, hàm giá này sẽ dần dần đạt tới cực tiểu toàn cục.

2.2.2 Mã hoá nhiễm sắc thể

Mỗi cá thể trong GA sẽ thay mặt cho một bộ trọng số của mạng nơ-ron. Ở đây ta không cần phải phân biệt trọng số nào ở lớp nào mà ta chỉ cần trải tất cả các trọng số lên sơ đồ gen của nhiễm sắc thể.

a. Mã hoá nhị phân

Một phương pháp mã hoá nhiễm sắc thể khá nổi tiếng do Whitley cùng các đồng tác giả [21] đề xuất gọi là GENITOR. Có một số phiên bản của GENITOR, về cơ bản mỗi trọng số của mạng được mã hoá thành một chuỗi bit như trên hình dưới. Index-bit để chỉ ra rằng kết nối có tồn tại hay không (bằng 1 - có kết nối, bằng 0 – không có kết nối). Chuỗi bit nhị phân còn lại sẽ biểu diễn giá trị của trọng số. Whitley sử dụng 8-bit để mã hoá dải giá trị từ -127 đến +127 số 0 được mã hoá 2 lần. Với cách mã hoá này các toán tử đột biến, lai ghép thực hiện khá đơn giản. Tuy nhiên, muốn tăng độ chính xác của việc mã hoá cần phải tăng số bit mã hoá trên một trọng số. Do đó, chiều dài của nhiễm sắc thể sẽ tăng theo dẫn đến việc thực thi thuật toán sẽ chậm.

Page 41: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

43

Hình 2.3 Mã hoá nhị phân trọng số theo phương pháp GENITOR

b. Mã hoá số thực

Montana D. và Davis L. [16] mã hoá trực tiếp các trọng số bằng các số thực là các giá trị của các trọng số. Điều này làm tăng độ chính xác của phép mã hoá cũng như giảm được kích thước của nhiễm sắc thể. Trong nghiên cứu của mình chúng tôi cũng sử dụng phương pháp này để thực hiện việc mã hoá trọng số của mạng. Các gen (trọng số) được khởi tạo ngẫu nhiên trong khoảng (-3, +3). Tuy nhiên với kỹ thuật mã hoá này ta cần thay đổi các toán tử lai ghép, đột biến cho phù hợp.

Hình 2.4 Ví dụ về phương pháp mã hoá trọng số bằng số thực

2.2.3 Lai ghép

Có một số cách tiếp cận trong lai ghép giữa các nhiễm sắc thể [16].

Page 42: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

44

a. Lai ghép trọng số (crossover-weights)

Toán tử lai ghép này sẽ đưa một giá trị vào mỗi vị trí của nhiễm sắc thể con bằng cách lấy ngẫu nhiên một giá trị tại cùng vị trí của nhiễm sắc thể cha hoặc mẹ.

b. Lai ghép nút (crossover-nodes)

Việc lai ghép được thực hiện giữa các nút cùng vị trí của cha và mẹ. Mỗi khi hai nút tại một lớp nào đó được lai ghép các trọng số của tất cả các liên kết đầu vào tới các nút đó sẽ được hoán vị cho nhau (hình 2.5).

Hình 2.5 Lai ghép nút (crossover-nodes)

2.2.4 Đột biến

a. Đột biến trọng số (mutate weights)

Một gen (trọng số) được lựa chọn ngẫu nhiên với một xác suất pmutation để tiến hành đột biến. Có hai phương pháp đột biến trọng số [16] là:

UNBIASED: với mỗi gen được chọn đột biến nó sẽ được thay thế bằng một giá trị ngẫu nhiên xung quanh 0.

BIASED: với mỗi gen được chọn đột biến nó sẽ được cộng thêm một giá trị ngẫu nhiên. Montana [16] đã thử nghiệm hai phương pháp đột biến trọng số này. Kết quả phương pháp BIASED chạy tốt hơn. Điều này có thể được giải thích là do khi chạy bộ giá trị các trọng số có xu hướng tốt hơn. Do đó, việc đột biến thay thế giá trị gốc bằng các giá trị ngẫu nhiên xung quanh giá trị gốc (BIASED) sẽ cho kết quả tốt hơn là thay thế bằng các giá trị ngẫu nhiên xung quanh 0 (UNBIASED).

Page 43: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

45

b. Đột biến nút (mutate nodes)

Toán tử đột biến nút sẽ chọn ra n nút không phải là các nút đầu vào. Tất cả các liên kết tới các nút này sẽ lần lượt được cộng thêm một giá trị ngẫu nhiên.

2.2.5 Thử nghiệm

a. Thử nghiệm giải thuật di truyền với các phương pháp đột biến khác nhau

So sánh hai phương pháp đột biến ‘đột biến trọng số BIASED’ và ‘đột biến nút’, cả hai phương pháp này đều sử dụng phương pháp ‘lai ghép trọng số’. Thử nghiệm với mẫu học dạng hình sin gồm 30 mẫu, chi tiết trong phụ lục B. Các tham số giống nhau với cả hai phương án:

- Số lượng quần thể: 100

- Xác suất lai: 0.3

- Xác suất đột biến: 0.1

- Ngưỡng dừng lặp: 0.05

Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là bảng thống kê các lần chạy và số thế hệ cần thiết để đạt được yêu cầu về sai số.

(1) – phương án ‘đột biến trọng số BIASED’

(2) – phương án ‘đột biến nút’

Bảng 2.2 So sánh các phương pháp đột biến

STT (1) (2) STT (1) (2) STT (1) (2) 1 61 100 36 134 50 71 59 151 2 227 21 37 143 35 72 133 157 3 152 33 38 59 151 73 40 43 4 97 15 39 35 231 74 66 85 5 27 33 40 188 37 75 112 20 6 60 170 41 522 97 76 87 85 7 164 593 42 38 48 77 163 32 8 181 152 43 39 514 78 794 55 9 31 104 44 487 76 79 55 167 10 57 116 45 205 163 80 260 139 11 167 101 46 99 37 81 141 101 12 146 91 47 75 72 82 674 63 13 780 647 48 153 44 83 67 91 14 342 56 49 26 40 84 102 108 15 100 377 50 62 58 85 52 43 16 235 515 51 146 59 86 235 155 17 138 42 52 152 105 87 85 58 18 44 54 53 80 18 88 100 29

Page 44: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

46

19 71 118 54 63 67 89 27 80 20 316 161 55 905 43 90 49 58 21 37 153 56 66 298 91 48 22 22 70 96 57 71 369 92 276 48 23 80 45 58 134 158 93 443 565 24 68 100 59 36 163 94 32 144 25 249 20 60 523 28 95 56 130 26 123 82 61 22 56 96 246 67 27 55 41 62 39 69 97 66 146 28 89 33 63 82 58 98 341 105 29 39 24 64 8 129 99 215 44 30 77 43 65 219 60 100 72 329 31 247 150 66 128 37 32 159 60 67 35 15 33 73 11 68 84 35 34 130 40 69 55 22 35 67 5 70 99 101

Trung bình

152.67

112.65

Nhận xét: Kết quả trung bình sau 112.65 thế hệ phương pháp ‘đột biến nút’ đã đạt yêu cầu, nhỏ hơn nhiều so với phương pháp ‘đột biến trọng số BIASED’ là 152.67 thế hệ.

b. Thử nghiệm giải thuật di truyền với các phương pháp lai ghép khác nhau

So sánh hai phương pháp lai ghép là ‘lai ghép trọng số’ và ‘lai ghép nút’ cả hai phương pháp này đều sử dụng phương pháp ‘đột biến nút’. Các tham số giống nhau với cả hai phương án:

- Số lượng quần thể: 100

- Xác suất lai: 0.3

- Xác suất đột biến: 0.1

- Ngưỡng dừng lặp: 0.05

Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là bảng thống kê số thế hệ cần thiết trong từng lần chạy để đạt được yêu cầu về sai số là 0.05.

(1) – phương án ‘lai ghép nút’

(2) – phương án ‘lai ghép trọng số’

Bảng 2.3 So sánh các phương pháp lai ghép

STT (1) (2) STT (1) (2) STT (1) (2) 1 294 100 36 176 50 71 183 151 2 202 21 37 32 35 72 113 157 3 21 33 38 50 151 73 120 43

Page 45: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

47

4 42 15 39 114 231 74 42 85 5 50 33 40 29 37 75 42 20 6 43 170 41 18 97 76 57 85 7 73 593 42 179 48 77 155 32 8 108 152 43 46 514 78 69 55 9 127 104 44 114 76 79 488 167 10 31 116 45 21 163 80 203 139 11 46 101 46 139 37 81 39 101 12 54 91 47 79 72 82 25 63 13 48 647 48 82 44 83 182 91 14 68 56 49 74 40 84 55 108 15 59 377 50 55 58 85 32 43 16 130 515 51 35 59 86 35 155 17 61 42 52 186 105 87 56 58 18 135 54 53 88 18 88 145 29 19 70 118 54 32 67 89 172 80 20 77 161 55 147 43 90 36 58 21 83 153 56 59 298 91 32 22 22 12 96 57 131 369 92 50 48 23 66 45 58 1268 158 93 277 565 24 44 100 59 122 163 94 23 144 25 24 20 60 65 28 95 44 130 26 150 82 61 211 56 96 20 67 27 187 41 62 25 69 97 56 146 28 60 33 63 26 58 98 25 105 29 30 24 64 50 129 99 184 44 30 67 43 65 66 60 100 26 329 31 28 150 66 124 37 32 47 60 67 10 15 33 178 11 68 44 35 34 39 40 69 8 22 35 159 5 70 109 101

Trung bình

99.13

112.65

Nhận xét: Kết quả trung bình sau 99.13 thế hệ phương pháp ‘lai ghép nút’ đã đạt yêu cầu thấp hơn một chút so với phương pháp ‘lai ghép trọng số’ là 112.65 thế hệ.

c. Thử nghiệm so sánh giải thuật di truyền và giải thuật lan truyền ngược sai số

Thử nghiệm hai phương pháp với bài toán nổi tiếng XOR. Có 4 mẫu học như sau:

X1 X2 Y 0 0 0 0 1 1 1 0 1 1 1 0

Tham số chung cho cả hai phương pháp:

Page 46: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

48

- Mạng nơ-ron sử dụng là mạng có một lớp ẩn

- Số nơ-ron trong lớp ẩn: 2

- Ngưỡng sai số dừng lặp: 0.05 hoặc quá 10000 vòng lặp

Tham số của giải thuật lan truyền ngược sai số:

- Hằng số học: 0.3

Tham số của giải thuật di truyền:

- Số lượng quần thể: 100

- Xác suất lai: 0.3

- Xác suất đột biến: 0.1

- Sử dụng phương pháp lai ghép nút và đột biến nút

Sau đây là bảng thống kê số bước lặp để mạng hội tụ với mỗi phương án trong 100 lần thử nghiệm khác nhau.

GA: giải thuật di truyền

BP: giải thuật lan truyền ngược sai số

- : mạng không hội tụ (số lần lặp lớn hơn 10000)

Bảng 2.4 Kết quả thử nghiệm so sánh GA và BP với ngưỡng sai số 0.0005

STT GA BP STT GA BP STT GA BP 1 1075 1515 36 283 - 71 1936 - 2 613 1005 37 - 1417 72 2004 3827 3 4629 1613 38 692 2863 73 2550 1594 4 372 1121 39 703 - 74 628 - 5 - - 40 - 1827 75 298 1754 6 678 1770 41 - 1930 76 612 2665 7 777 - 42 254 1848 77 461 - 8 704 - 43 - - 78 812 911 9 - 1666 44 527 - 79 1088 - 10 2198 1618 45 - 4613 80 206 - 11 1392 3397 46 2307 - 81 1051 - 12 - - 47 285 1591 82 - 1323 13 5645 5569 48 - 1612 83 - 2319 14 - 2822 49 1663 - 84 479 2495 15 2330 - 50 - 1457 85 - - 16 - 2935 51 1067 - 86 1931 - 17 426 1373 52 - 2462 87 566 4041 18 844 2023 53 793 - 88 730 1833 19 875 - 54 261 2710 89 594 - 20 - 3320 55 5262 - 90 - -

Page 47: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

49

21 790 2397 56 - - 91 - 1555 22 - 1176 57 - 1325 92 1986 1493 23 1542 - 58 635 1279 93 252 1850 24 714 - 59 326 - 94 243 1195 25 629 2018 60 929 - 95 739 - 26 550 - 61 3106 1572 96 - - 27 566 - 62 6286 3351 97 903 1238 28 1462 - 63 692 - 98 - - 29 1238 1751 64 - - 99 2149 - 30 844 - 65 - 2879 100 760 3040 31 - - 66 487 1729 32 791 1150 67 209 1347 33 1153 1604 68 910 -

Số lần mạnghội tụ

70

58

34 - 7368 69 - 2083 35 - 1558 70 2505 1050

Trung bình

1228.59

2152.53

Kết quả trong 100 lần chạy :

- Giải thuật di truyền chạy thành công được 70 lần trung bình 1228.59 vòng lặp một lần chạy.

- Giải thuật lan truyền ngược sai số chạy thành công được 58 lần trung bình 2152.53 vòng lặp.

Ta có thể thấy rằng giải thuật di truyền có khả năng đạt được yêu cầu về hội tụ (sai số ≤ 0.05) tức tìm vùng chứa cực trị toàn cục dễ dàng hơn so với giải thuật lan truyền ngược sai số. Hay nói cách khác giải thuật lan truyền ngược sai số dễ rơi vào vùng chứa cực tiểu cục bộ hơn giải thuật di truyền. Trong 100 lần chạy, GA chỉ có 30 lần không tìm được cực trị toàn cục trong khi đó BP là 42 lần.

2.2.6 Giải thuật đề xuất

Trong thử nghiệm so sánh GA với BP ở trên ta thấy: tuy GA có khả năng đưa mạng vùng chứa cực tiểu toàn cục dễ dàng hơn so với BP tuy nhiên vẫn còn nhiều trường hợp GA không làm mạng hội tụ được (trong thử nghiệm trên 30/100 lần mạng không hội tụ với GA). Nguyên nhân nào đã làm cho mạng rơi vào cực tiểu địa phương mà không thoát ra được? Sau nhiều lần thử nghiệm, chúng tôi nhận thấy rất nhiều trường hợp mạng không thể hội tụ vì một số giá trị trọng số của mạng đã quá lớn. Có thể giải thích điều này là do phương pháp đột biến sử dụng là chỉ đột biến kiểu BIASED (phần 2.2.4). Phương pháp đột biến này sẽ cộng vào trọng số được đột biến một giá trị ngẫu nhiên xung quanh 0. Như Montana D. và Davis L. [16] đã thử nghiệm và nhận xét rằng phương pháp đột biến này là hiệu quả hơn UNBIASED (trọng số được đột biến sẽ được thay thế bằng một giá trị ngẫu nhiên xung quanh 0) do kế thừa được tính "tốt" của thế hệ trước. Tuy nhiên một số trường hợp đột biến kiểu BIASED sẽ đẩy một số trọng số ngày càng rời xa gốc 0 và có thể mạng sẽ rơi

Page 48: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

50

vào cực tiểu cục bộ mà không thoát ra được. Làm sao có thể tận dụng được những ưu điểm của đột biến dạng BIASED nhưng lại giúp mạng không rơi vào cực tiểu cục bộ chúng tôi đề xuất một phương pháp đột biến như sau:

Kết hợp đột biến BIASED với đột biến UNBIASED trong đó đột biến BIASED sẽ đóng vai trò chủ đạo (xác suất đột biến lớn hơn). Đột biến UNBIASED được đưa thêm vào với mục đích giúp cho các trọng số có giá trị quá lớn chuyển về các giá trị nhỏ (giá trị ngẫu nhiên xung quanh 0). Do đó, có thể giúp mạng thoát khỏi cực tiểu cục bộ.

Việc thử nghiệm giải thuật cải tiến được tiến hành với các tham số giống như thuật toán GA trong thử nghiệm 2.3.5 nhưng có kết hợp thêm đột biến UNBIASED với xác suất đột biến nhỏ: 0.03. Sau đây là số lần lặp để mạng hội tụ với phương pháp đột biến đề xuất :

Bảng 2.5 Kết quả thử nghiệm với giải thuật đề xuất

STT Số lần lặp STT Số lần lặp STT Số lần lặp 1 8510 36 277 71 1538 2 1052 37 1339 72 654 3 404 38 457 73 2986 4 215 39 - 74 190 5 912 40 2153 75 568 6 - 41 3177 76 169 7 7322 42 7414 77 201 8 873 43 627 78 - 9 4701 44 4248 79 6371 10 1014 45 1076 80 - 11 - 46 272 81 292 12 825 47 219 82 - 13 840 48 - 83 838 14 2835 49 6985 84 9910 15 157 50 2552 85 1207 16 216 51 473 86 4587 17 8552 52 8128 87 418 18 976 53 - 88 326 19 258 54 809 89 - 20 1151 55 4745 90 5244 21 481 56 - 91 216 22 4024 57 9084 92 514 23 835 58 1133 93 516 24 839 59 5617 94 1047 25 305 60 164 95 728 26 729 61 186 96 896 27 2935 62 525 97 900 28 614 63 8968 98 813

Page 49: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

51

29 890 64 334 99 565 30 1020 65 1522 100 4819 31 1816 66 461 32 6075 67 5859 33 223 68 323

Số lần mạnghội tụ

89

34 - 69 533 35 1667 70 630

Trung bình

2135.61

Có thể rút ra một số nhận xét sau thử nghiệm này:

- Số lần mạng hội tụ tăng lên rất nhiều so với đột biến chỉ dùng phương pháp BIASED (89 so với 70).

- Số lần lặp để mạng hội tụ của phương pháp cải tiến cao hơn nhiều so với đột biến chỉ dùng phương pháp BIASED (2135.61 so với 1228.59).

Có nghĩa là phương pháp cải tiến có nhiều khả năng đưa mạng về trạng thái hội tụ tuy nhiên thời gian hội tụ trung bình dài hơn so với phương pháp đột biến chỉ dùng BIASED.

2.3 Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu hoá trọng số mạng nơ-ron nhân tạo

2.3.1 Đặt vấn đề

Mặc dù GA có khả năng đạt tới cực trị toàn cục cho quá trình tìm kiếm nhưng do có kết hợp những yếu tố ngẫu nhiên nên tốc độ tìm kiếm nói chung là rất chậm. Mặt khác nó không thể hoàn toàn đạt được tới cực trị toàn cục mà chỉ cho những kết quả xung quanh đó. Đối lập với GA, giải thuật lan truyền ngược sai số (BP) lại cho phép đạt được những cực trị nếu như điểm xuất phát của quá trình tìm kiếm nằm trong vùng cực trị toàn cục. Để chứng minh nhận xét này chúng ta sẽ xem xét thử nghiệm sau:

Thử nghiệm được tiến hành với bài toán XOR có các tham số như trong thử nghiệm 2.2.5c. Riêng giá trị sai số dừng lặp giảm đi 100 lần là: 0.0005. Khi đạt được giá trị sai số rất nhỏ như vậy có thể coi mạng đã đạt được gần chính xác vị trí cực tiểu toàn cục. Thử nghiệm so sánh hai giải thuật:

GA’ - giải thuật di truyền sử dụng phương pháp đột biến đề xuất (2.2.6)

BP - giải thuật lan truyền ngược sai số

Sau đây là bảng thống kê số bước lặp để mạng hội tụ với mỗi phương án trong 100 lần thử nghiệm khác nhau.

Page 50: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

52

Bảng 2.6 Kết quả thử nghiệm so sánh GA’ và BP với ngưỡng sai số 0.0005

STT GA’ BP STT GA’ BP STT GA’ BP 1 - 4329 36 - 3150 71 - - 2 - - 37 2216 - 72 - 3811 3 - 7599 38 - 6215 73 - - 4 - 5122 39 - 3299 74 - 5214 5 - 5741 40 - - 75 - - 6 1791 - 41 - 4142 76 - 5388 7 - 6796 42 - - 77 - 3458 8 - - 43 - 9778 78 - - 9 2882 - 44 - - 79 - - 10 - 6960 45 - 6099 80 - - 11 - - 46 - 4066 81 6291 - 12 - 3792 47 - 3420 82 - - 13 - 2905 48 - 3974 83 - 4567 14 3860 - 49 - - 84 - - 15 - 6098 50 - - 85 - - 16 - - 51 - 3424 86 - 5535 17 - 5307 52 - 7975 87 - 5532 18 - 5935 53 - - 88 - 4443 19 - - 54 - 4838 89 - - 20 - 4014 55 - 6510 90 - - 21 - - 56 - 3979 91 - - 22 - 4710 57 - - 92 - 3523 23 - - 58 - 5583 93 - - 24 - 4314 59 - 3207 94 - - 25 - - 60 - 4802 95 - 6073 26 - 3798 61 - 5154 96 - 5708 27 - 3735 62 - 4030 97 - 4090 28 - 7098 63 - 5222 98 - - 29 - - 64 - - 99 - - 30 - - 65 - 3916 100 - - 31 - - 66 - 3940 32 - 8349 67 - - 33 - - 68 - 6560

Số lần mạnghội tụ

6 57

34 - 2987 69 - 3149 35 874 5030 70 - 4121

Trung bình 2985.67

4956.39

Qua thử nghiệm này có thể dễ dàng nhận thấy rằng chỉ rất ít trường hợp GA’ đạt được giá trị sai số mong muốn. Kết hợp với kết quả trong bảng 2.4 và 2.5 ta có thể tóm tắt khả năng hội tụ của mạng với hai phương pháp học: giải thuật di truyền và giải thuật lan truyền ngược sai số khi ngưỡng sai số dừng lặp khác nhau.

Page 51: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

53

Bảng 2.7 So sánh khả năng hội tụ của mạng khi sử dụng hai phương pháp học GA’ và BP với sai số dừng lặp khác nhau

Số lần hội tụ trong 100 lần thử nghiệm

Sai số dừng lặp GA’ BP

0.05 89 58

0.0005 6 57

Từ bảng 2.7 ta có nhận xét: GA có thể đạt đến vùng chứa cực tiểu toàn cục (sai số 0.05) dễ dàng hơn so với BP (89 lần so với 58 lần). Tuy nhiên, để đạt đến chính xác vị trí cực tiểu toàn cục (sai số 0.0005) thì GA lại rất kém (chỉ có 6 lần). Trong khi đó, hầu hết các trường hợp BP khi đã đưa mạng đến được vùng chứa cực tiểu toàn cục (sai số 0.05) thì BP sẽ đưa mạng đến chính xác cực tiểu toàn cục (sai số 0.0005). Do đó, việc kết hợp GA và BP có nhiều cơ hội đưa mạng đến được chính xác cực tiểu toàn cục.

2.3.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số

Có thể kết hợp cả GA và BP nhằm đạt tới một kết quả trọn vẹn của bài toán tối ưu trọng số mạng nơ-ron nhân tạo. Trong giải thuật kết hợp này, GA được sử dụng như một bộ khởi tạo cho BP. Tập trọng số được mã hoá thành các nhiễm sắc thể và được tiến hoá nhờ GA. Kết thúc quá trình tiến hoá, bộ trọng số tốt nhất tương ứng với cá thể ưu việt nhất trong quần thể được lựa chọn làm những trọng số khởi tạo cho giải thuật BP. Nó chính là bộ tham số cho phép xác định điểm gần cực trị nhất của hàm giá.

Với sự kết hợp này, giải thuật BP sẽ cần phải được thay đổi một vài yếu tố :

- Giải thuật không tự khởi tạo trọng số mà nhận các trọng số từ GA.

- Thành phần quán tính được loại bỏ để làm tăng tốc độ của quá trình hội tụ và loại bỏ dao động.

Page 52: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

54

Hình 2.6 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số

Việc thử nghiệm giải thuật kết hợp này được tiến hành với bài toán XOR ngưỡng sai số mong muốn là 0.0005. Giải thuật di truyền sử dụng phương pháp đột biến đề xuất (2.2.6). Các tham số cũng như các phần trước. Giải thuật gồm hai bước chính :

- (1) GA sẽ đưa mạng đạt đến sai số 0.05

- (2) BP sẽ nhận bộ trọng số tốt nhất của GA đóng vai trò là trọng số khởi tạo (có sai số 0.05) để đưa mạng đến sai số mong muốn 0.0005.

Bảng 2.8 Kết quả thử nghiệm giải thuật kết hợp GA’ và BP với ngưỡng sai sô 0.0005

STT (1) (2) STT (1) (2) STT (1) (2) 1 352 1366 36 4273 - 71 434 1793 2 924 2354 37 396 3428 72 - - 3 2520 1853 38 2636 - 73 320 1325 4 591 1260 39 509 1858 74 - - 5 362 1511 40 - - 75 751 1436 6 6949 1750 41 336 1988 76 876 1420 7 604 1768 42 568 922 77 - - 8 695 1730 43 4159 3411 78 1138 4423 9 348 2058 44 4235 1436 79 6986 1736 10 304 2372 45 265 2013 80 439 2724 11 2108 3171 46 2929 1548 81 640 3496 12 6109 1406 47 257 2692 82 472 2014 13 2615 1328 48 674 327 83 - -

Khởi tạo tập trọng số

Giải thuật di truyền

Giữ lại nhiễm sắc thể tốt nhất

Tập các trọng số

Học bằng giải thuật lan truyền ngược sai số có thay đổi

Page 53: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

55

14 653 3173 49 2370 5923 84 5173 1530 15 416 1265 50 242 2906 85 520 2769 16 2702 1783 51 594 1948 86 - - 17 535 2177 52 4925 861 87 3675 881 18 2856 1426 53 127 1248 88 373 2266 19 347 814 54 622 2006 89 632 1244 20 2800 1474 55 784 536 90 851 1331 21 1281 1184 56 272 6247 91 3852 1901 22 - - 57 8297 2247 92 3728 2300 23 3090 1399 58 7299 1356 93 1700 2806 24 426 2177 59 634 1434 94 - - 25 1685 1961 60 442 6227 95 3448 1020 26 1373 3254 61 220 1978 96 772 1850 27 1249 1993 62 3227 4801 97 332 4244 28 165 941 63 1177 - 98 1253 1826 29 605 1439 64 - - 99 764 1480 30 895 2082 65 704 4860 100 952 1499 31 708 2301 66 3922 1161 32 6097 2084 67 460 958 33 260 3072 68 613 1305

Số lần mạnghội tụ 90 87

34 8761 1914 69 - - 35 308 2376 70 164 1850

Trung bình 1778.956 2103.506

Nhận xét:

- Cũng giống như lần thử nghiệm trước giải thuật di truyền sử dụng đột biến kết hợp (2.2.6), kết quả mạng hội tụ với sai số 0.05 rất cao (90/100).

- Trong 90 lần nhận trọng số khởi tạo từ GA, BP có 87 lần đưa mạng từ sai số 0.05 về sai số 0.0005. Chỉ có 3 lần BP không đưa mạng đến yêu cầu sai số mong muốn (lần thử nghiệm thứ 36, 38, 63).

- So sánh với việc sử dụng GA và BP riêng rẽ thì giải thuật kết hợp này cho kết quả tốt hơn rất nhiều.

Kết luận chương Trong chương này chúng ta đã nghiên cứu các khái niệm và khả năng ứng dụng

của giải thuật di truyền cũng như cách thức để tiến hành thực hiện một bài toán bằng giải thuật di truyền. Giải thuật di truyền được biết đến như một giải thuật tìm kiếm dựa trên học thuyết về chọn lọc tự nhiên và nó cho phép ta đạt được tới cực trị toàn cục. Do đó, áp dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số mạng nơ-ron nhân tạo là một cách tiếp cận tiềm năng. Trong chương này chúng tôi đã nghiên cứu và thử nghiệm một số phương án và đưa ra một số cải tiến về phương pháp đột biến giúp cho quá trình học của mạng nơ-ron được tốt hơn. Ngoài ra chúng tôi cũng kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số nhằm đạt tới một kết

Page 54: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

56

quả trọn vẹn của bài toán tối ưu trọng số mạng nơ-ron nhân tạo. Trong chương tiếp theo chúng ta sẽ nghiên cứu việc ứng dụng mạng nơ-ron nhân tạo với các phương pháp học kết hợp đã đề cập trong chương này vào việc dự báo lưu lượng nước đến hồ Hoà Bình.

Page 55: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

57

CCHHƯƯƠƠNNGG 33 -- ỨỨNNGG DDỤỤNNGG MMẠẠNNGG NNƠƠ RROONN NNHHÂÂNN TTẠẠOO VVÀÀOO VVIIỆỆCC DDỰỰ BBÁÁOO LLƯƯUU LLƯƯỢỢNNGG NNƯƯỚỚCC ĐĐẾẾNN HHỒỒ HHOOÀÀ BBÌÌNNHH

Luận văn đề cập tới bài toán dự báo lưu lượng dòng chảy đến hồ Hoà Bình phục vụ tốt mục tiêu điều tiết vận hành hồ. Nguồn nước chính cung cấp cho hồ Hoà Bình là nguồn nước từ sông Đà. Dọc theo hệ thống sông Đà có các trạm đo quan trắc khí tượng và thuỷ văn bắt đầu hoạt động từ năm 1902. Trạm đo thuỷ văn gần hồ Hoà Bình nhất là trạm đo Tà Bú. Dự báo nước đến hồ Hoà Bình thực chất là dự báo lưu lượng nước tại trạm Tà Bú. Trong chương này, luận văn trình bày một số nội dung liên quan đến bài toán dự báo và một số thử nghiệm sử dụng những nghiên cứu trong chương 2 để dự báo nước đến hồ Hoà Bình trước 10 ngày.

3.1 Điều kiện địa lý, tự nhiên, khí tượng thuỷ văn lưu vực sông Đà

Sông Đà là chi lưu lớn nhất của sông Hồng bắt nguồn từ dãy Ngụy Sơn thuộc tỉnh Vân Nam Trung Quốc chảy vào Việt Nam theo hướng Tây Bắc – Đông Nam ở độ cao trên 1500m sau đó ngoặt sang hướng Đông ở Pa Vinh, khi tới thị xã Hòa Bình thì sông chảy theo hướng Bắc đổ vào sông Hồng ở Trung Hà. Sông Đà có diện tích lưu vực 52.900 km2 trong đó 50.6% thuộc phần lãnh thổ Việt Nam, bao gồm phần trung và hạ lưu sông và chiếm 37% diện tích tập trung nước của sông Hồng. Sông Đà có chiều dài dòng chính là 980km (phần thuộc lãnh thổ Việt Nam dài 540 km). Lưu vực sông Đà có dạng hình thuôn dài chạy dọc theo hướng Tây Bắc – Đông Nam, kéo dài từ 20o40’ đến 25o00’ độ vĩ Bắc và từ 100o22’ đến 105o24’ độ kinh Đông với chiều dài lưu vực 690km (phần thuộc lãnh thổ Việt Nam là 380 km) và chiều rộng bình quân lưu vực 76km (phần trong nước là 80 km). Chiều rộng lưu vực lớn nhất là 165 km thuộc tỉnh Lai Châu còn phần hẹp nhất 25km, thuộc tỉnh Hòa Bình. Độ dốc bình quân lòng sông trung bình 0.41‰, trong đó độ dốc lòng sông thuộc lãnh thổ Trung Quốc là 2,54‰.

3.1.1 Vị trí địa lý

Lưu vực sông Đà nằm giữa các dãy núi cao và trung bình chạy dài theo hướng Tây Bắc - Đông Nam. Đặc điểm nổi bật của lưu vực sông Đà là các dạng địa hình núi cao và cao nguyên đều cao và bị chia cắt theo chiều thẳng đứng rất mạnh. Điều nhận thấy rõ rệt là địa hình núi và cao nguyên ở đây có sự sắp xếp song song có ảnh hưởng lớn đến khí hậu của vùng. Có thể nói lưu vực sông Đà chia làm 3 nhóm địa hình: Nhóm kiểu địa hình núi, nhóm kiểu địa hình cao nguyên, nhóm kiểu địa hình thung lũng.

Page 56: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

58

3.1.2 Địa hình

Địa hình lưu vực sông Đà thuộc vùng Tây Bắc nước ta từ biên giới Việt - Trung, Việt - Lào tới Lai Châu, Mường Lay chủ yếu là các dãy núi ở độ cao trên 1000 m. Địa hình có hình dáng đường sống núi hẹp, có đỉnh cao nhất đạt tới 3076 m, chủ yếu cấu tạo bởi granit, ven rìa xen đá phiến và đá vôi.

3.1.3 Điều kiện địa chất

Về cấu trúc địa chất, sông Đà là vùng có cấu trúc địa chất phức tạp và chưa ổn định. Toàn bộ lưu vực phân bố rộng trên nền đá vôi, tạo nên cấu trúc Karst phức tạp, có nhiều đứt gãy ngang. Ba đới đứt gãy chính là đứt gãy sông Hồng, đứt gãy Điện Biên – Lai Châu và đứt gãy sông Mã. Về các hoạt động địa chấn, do lưu vực có địa hình núi chia cắt nên có nhiều quá trình ngoại sinh huỷ hoại, quá trình xói mòn đất, kết hợp với cấu trúc địa chất kém ổn định thường diễn ra các hoạt động địa chấn như động đất.

Ngoài ra trong vùng còn thường xuyên có động đất kích thích xảy ra như nứt, trượt, sạt lở đất đặc biệt ở các vùng dốc cao, do tổng hợp của nhiều nguyên nhân khác nhau gây ra: do tác động của trọng lực, do hoạt hoá trở lại của các đứt gãy kiến tạo, vv ... các quá trình địa chất này chủ yếu xảy ra trong giai đoạn đầu khi các hồ chứa tích nước. Các kết quả nghiên cứu trong nhiều năm qua cho thấy cùng với sự tích nước của hồ chứa, các hoạt động địa chất đã tăng lên, hiện tượng động đất kích thích xảy ra mạnh mẽ nhất ở khu vực xung quanh đập thuộc địa phận Thị xã Hoà Bình.

3.1.4 Điều kiện thổ nhưỡng

Tây Bắc là vùng rừng núi cao, có độ chia cắt mạnh nhất Việt Nam; riêng với lưu vực sông Đà, thổ nhưỡng có đặc điểm chủ yếu là trên nền đá vôi và đất phong hoá trên nền đá vôi. Tuy nhiên, do địa hình chia cắt mạnh và diễn biến khác biệt về chế độ khí hậu, thuỷ văn giữa các tiểu vùng sinh thái nên loại hình phân bố thổ nhưỡng của lưu vực sông Đà rất đa dạng và phong phú.

3.1.5 Đặc điểm khí hậu

Có thể nói rằng khí hậu vùng lưu vực sông Đà là khí hậu nhiệt đới, gió mùa vùng núi với hai mùa rõ rệt. Mùa đông lạnh, suốt mùa đông duy trì một tình trạng hanh khô điển hình, có sương muối và ít mưa (mùa khô) trùng với mùa gió Đông Bắc, kéo dài từ tháng Mười Một năm trước tới tháng Ba năm sau. Mùa hè trùng với mùa gió Tây Nam, nóng có gió tây khô nóng và nhiều mưa (mùa mưa), kéo dài từ tháng Năm tới tháng Chín hàng năm. Giữa hai mùa (tháng Tư, tháng Mười) là thời kỳ chuyển tiếp, nền nhiệt ẩm và có tính ôn hoà.

Page 57: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

59

Về cơ bản, mùa mưa gần như trùng với mùa nóng và mùa khô trùng với mùa lạnh. Mưa đá cũng thường xảy ra trong thời kỳ quá độ từ mùa lạnh sang mùa nóng.

Lượng mưa ở vùng lưu vực sông Đà phân bố rất không đều phụ thuộc vào đặc điểm của địa hình, giá trị trung bình năm biến đổi khá mạnh mẽ từ 1300-3200mm. Vùng mưa lớn Hoàng Liên – Sa Pa đạt tới trên 2000mm, trong khi vùng mưa ít Nam Sơn La chỉ đạt 1200 - 1600mm.

Tương ứng với vùng mưa lớn cũng là vùng có lượng ẩm phong phú quanh năm, đồng thời vùng mưa ít cũng là vùng thiếu ẩm, chủ yếu là trong mùa Đông.

Lưu vực sông Đà có độ ẩm cao và ít thay đổi. Độ ẩm tuyệt đối dao động trong phạm vi từ 11 - 32mb và độ ẩm tương đối khá cao, trung bình năm trong toàn vùng lưu vực sông Đà dao động trong khoảng từ 80 – 85% và không chênh lệch nhiều giữa các vùng (mùa nóng độ ẩm không khí trung bình khoảng 84 – 87%, mùa lạnh có khí hậu khô lạnh, độ ẩm không khí chỉ có 72 – 75%).

Lượng bốc hơi lớn nhất (đo bằng ống Piche) dao động trong phạm vi khá rộng, từ 666 đến 1052 mm/năm. Thời kỳ giữa mùa khô đến đầu mùa mưa (II-V) có lượng bốc hơi lớn nhất, đạt 70-150mm/tháng. Vào thời kỳ còn lại, lượng bốc hơi dao động trong khoảng 40-70mm/tháng.

Toàn lưu vực sông Đà chịu tác động của cơ chế gió mùa Đông Nam Á với hai mùa gió: gió mùa đông và gió mùa hạ. Gió mùa đông bị chi phối bởi không khí cực đới lục địa và không khí nhiệt đới biển Đông đã biến tính. Gió mùa hạ bị chi phối bởi ba khối không khí: không khí nhiệt đới biển Bắc Ấn Độ Dương (gió Tây Nam), không khí xích đạo (gió Nam) và không khí biển Thái Bình Dương.

Cơ chế gió mùa và sự thay đổi điều kiện bức xạ theo chu kỳ năm tạo nên biến đổi tuần hoàn năm của hầu hết các yếu tố khí hậu, nổi bật nhất là sự hình thành và diễn biến của các mùa.

3.1.6 Đặc điểm chế độ thuỷ văn

a. Mạng lưới sông ngòi

Sông ngòi trong lưu vực sông Đà có những đặc điểm khác so với những vùng Đông Bắc. Dòng chính của sông Đà có hướng trùng kiến tạo của khu Tây Bắc. Sông suối trong lưu vực sông Đà thuộc loại sông trẻ, thung lũng sông hẹp, nhiều đoạn có dạng hẻm vực sâu, chứng tỏ địa hình mới được nâng lên rất mạnh. Phần lớn lòng sông cao hơn mặt biển từ 100 - 500m. Do đó sông đang đào lòng mạnh, trắc diện hẹp, bồi tụ ít và lắm thác ghềnh.

Thượng lưu sông Đà kể từ nguồn tới Pắc Ma, dòng sông chảy theo hướng Tây Bắc - Đông Nam. Lòng sông đoạn này hẹp, mùa cạn rộng, trung bình 40 - 60m. Độ

Page 58: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

60

dốc lớn chỉ tính từ biên giới Việt Trung tới Lai Châu dài khoảng 125km, đạt độ dốc bình quân tới 160cm/km. Trung lưu sông Đà từ Pắc Ma tới Suối Rút, sông vẫn chảy theo hướng Tây Bắc - Đông Nam. Dòng sông chảy giữa hai bờ núi rất cao. Độ dốc đáy sông giảm xuống rõ rệt, còn khoảng 38 - 40cm/km nhưng thác ghềnh còn nhiều. Về mùa cạn, lòng sông rộng trung bình 90 - 100m. Tại hạ lưu sông Đà từ Suối Rút tới cửa sông (Trung Hà), lòng sông mở rộng rõ rệt, trung bình khoảng 200m về mùa cạn. Độ dốc dòng sông giảm không nhiều. Ngoài Thác Bờ, trên đoạn này không còn thác nữa, trong khi đó bãi bồi lại khá nhiều. Từ suối Rút, sông Đà chảy theo hướng Tây Đông cho tới Hoà Bình. Qua Hoà Bình, sông Đà chuyển theo hướng Tây Nam - Đông Bắc. Chính những khối núi Ba Vì, Viên Nam, Đối Thôi đã buộc sông Đà phải đổi hướng như vậy. Thung lũng sông trên đoạn này mở rộng tới 10km, giao thông tương đối thuận lợi.

Không kể những phụ lưu lớn, dòng chính sông Đà có mạng lưới thuỷ văn phân bố không đồng đều. Mật độ sông suối từ thưa đến dày. Vùng đá vôi mưa ít, mật độ có nơi xuống dưới 0,50km/km2 như ở lưu vực sông Nậm Sập, vùng núi cao mưa nhiều như vùng sông Nậm Mu, mạng lưới sông suối rất dày, khoảng 1,67km/km2. Các vùng còn lại có mật độ tương đối dày từ 0,50 đến 1,50km/km2. Tổng số sông suối có chiều dài từ 10 km trở lên thuộc lưu vực dòng chính sông Đà có tới 223 sông, trong đó có 148 sông có diện tích nhỏ hơn 100km2, có 67 con suối có chiều dài từ 15 đến hơn 100 km. Riêng khu vực thuỷ điện Hoà Bình ( từ Tạ Bú đến Hoà Bình ) có 34 con suối, tổng chiều dài của các sông suối của riêng lưu vực sông Đà vào khoảng gần 4500 km làm cho mật độ lưới sông trong lưu vực tương đối cao hơn so với các vùng khác trong nước.

Đồng thời, mạng lưới sông suối trên lưu vực sông Đà có dạng hình lông chim và các phụ lưu đổ thẳng góc vào dòng chính, khả năng tập trung nước trên sông Đà rất lớn và đây là nguyên nhân gây nên tính ác liệt của dòng chảy lũ trên lưu vực và các hiện tượng lũ quét, lũ bùn đá... xảy ra mạng tính chất thường xuyên trên lưu vực. Khả năng xói mòn xâm thực cát bùn trên bề mặt đưa xuống sông cũng rất lớn.

Page 59: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

61

Hình 3.1. Bản đồ phân bố các trạm trên sông Đà (dấu chấm đỏ)

b. Đặc điểm chế độ thuỷ văn

1. Dòng chảy năm

Như đã giới thiệu ở phần trên, lượng mưa trung bình hàng năm của cả lưu vực sông Đà tương đối lớn, vào khoảng 1900 mm và lượng mưa bình quân trong năm phân bố không đều theo không gian. Do đặc điểm mưa như vậy nên dòng chảy năm của sông Đà rất dồi dào.

Trong mùa mưa, lượng nước tính ở phần thượng lưu của đập thuỷ điện Hoà Bình chiếm khoảng 75% - 78% tổng lượng nước cả năm. Trong mùa khô, lượng nước giảm mạnh, còn trên 23%, chỉ có một số chi lưu chính như Nậm Na, Nậm Ma, Nậm Mức, Nậm Bú … là còn có lượng nước dồi dào.

Nước mặt và nước ngầm trong toàn lưu vực nói chung có lưu lượng và chất lượng dòng chảy thay đổi theo mùa. Mùa mưa, nước các dòng sông suối dâng cao, thường gây ra lũ lớn tại các địa phương trong vùng, thậm chí có cả lũ quét, kèm theo lở núi và lũ bùn với tần suất có xu hướng gia tăng.

Page 60: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

62

2. Dòng chảy lũ

Xem xét dòng chảy mùa lũ, lũ trên lưu vực sông Đà thường do những trận mưa rào nhiệt đới gây nên trên một phạm vi rộng, có cường độ lớn. Lượng nước mùa lũ chiếm bình quân từ 77,6% đến 78,5% lượng nước cả năm, riêng tháng Tám chiếm tới 23,7% là tháng có lượng dòng chảy lớn nhất. Mùa cạn kéo dài trong 7 tháng (từ tháng Mười Một năm trước đến tháng Năm năm sau). Nước lũ sông Đà lớn nhất trong hệ thống sông Hồng do các trung tâm mưa lớn phân bổ ở trung lưu sông Đà gây ra. Đoạn từ Lý Tiên Độ tới Tạ Bú, mưa lớn trên các sườn núi cao đón gió Tây Nam. Sự hoạt động sớm của áp thấp phía Tây là nguyên nhân chủ yếu dẫn đến sự xuất hiện lưu lượng đỉnh lũ vào tháng Bảy.

Đặc điểm về hình thái lưu vực sông thuận lợi cho nước lũ hình thành mau chóng và ác liệt. Tại Lai Châu, biên độ mực nước lớn nhất đạt trị số kỷ lục so với các sông lớn của miền Bắc (lớn hơn 25m) và cường suất lớn nhất bình quân đạt tới 77,4cm/h. Nguyên nhân chính là do địa hình dốc, mưa có cường độ lớn trên một vùng trơ trọi, cộng với thung lũng sông bị thắt hẹp lại ở phía dưới Lai Châu gây ra. Hệ số điều tiết hoàn toàn cũng thuộc loại lớn nhất miền Bắc đạt 0,42 tại Lai Châu và 0,40 tại Hoà Bình. Nguyên nhân chủ yếu là do mưa tập trung trên địa hình dốc nhiều, thung lũng sông hẹp nên khả năng điều tiết bị hạn chế.

Lượng lũ lớn, đỉnh lũ cao là đặc điểm nổi bật nhất của dòng chảy lớn nhất sông Đà. Theo tài liệu quan trắc, lưu lượng đỉnh lũ lớn nhất hàng năm trên lưu vực sông Đà dao động rất lớn: ở Tạ Bú từ 4630÷22.700 m3/s, ở Hoà Bình từ 4720÷21000 m3/s. Chỉ xét trong chuỗi số liệu 10 năm (1961-1970) đã có tới 6 năm nước lũ vượt quá mức 22m ở Hoà Bình. Dòng chảy tháng lớn nhất đều lớn hơn 20% lượng dòng chảy cả năm, xuất hiện vào tháng Bảy ở thượng lưu và vào tháng Tám ở trung và hạ lưu.

3. Dòng chảy kiệt

Từ tháng Mười Một năm trước đến tháng Năm năm sau là thời kỳ mùa cạn, lượng mưa trong thời kỳ này giảm nhiều và không vượt quá vài chục milimét trong mỗi tháng, nước sông chủ yếu do lượng nước ngầm cung cấp. Mực nước và lưu lượng giảm đi nhanh chóng trong tháng Mười Một và tháng Mười Hai, biến đổi chậm từ tháng Giêng đến tháng Hai.

Tình hình dòng chảy cạn của sông Đà cũng khá khắc nghiệt. Tuỳ thuộc vào tình hình mặt đệm và điều kiện mưa mà lượng dòng chảy nhỏ nhất trên sông Đà có sự thay đổi từ nơi này qua nơi khác. Nhìn chung, trên dòng chính và những phụ lưu chảy trên vùng đá vôi, có mưa ít thì dòng chảy cạn có trị số nhỏ nhất so với các sông suối khác trên miền Bắc. Dòng chảy bình quân tháng nhỏ nhất tại Lai Châu là 6,421/s.km2 ứng với lưu lượng bình quân tháng nhỏ nhất là 218m3/s và tại Hoà Bình

Page 61: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

63

là 6,721/s.km2 ứng với lưu lượng bình quân tháng nhỏ nhất là 346m3/s. Vùng có ít nước trong mùa cạn là khu vực Mộc Châu, Sơn La - nơi mưa ít nhất khu vực và có nhiều đá vôi. Vùng có lượng dòng chảy nhỏ nhất còn phong phú (trên 101/s.km2) phân bố trên các lưu vực thuộc các bờ trái là nơi mưa nhiều và lớp phủ rừng còn giữ được. Dòng chảy tháng nhỏ nhất bình quân xuất hiện đồng bộ vào tháng Ba chiếm trên dưới 2% lượng dòng chảy cả năm. Phần sông Đà thuộc Trung Quốc có dòng chảy nhỏ nhất còn thấp hơn nữa.

3.1.7 Thống kê dữ liệu thu thập được

Sông Đà có trạm quan trắc khí tượng thủy văn (KTTV) từ năm 1902. Tuy nhiên hầu hết các trạm quan trắc khí tượng, thủy văn trên sông Đà đều ngừng hoạt động trong thời kỳ chiến tranh (1945-1955). Sau hòa bình lập lại, mạng lưới quan trắc khí tượng thủy văn trên lưu vực sông Đà nói riêng và toàn miền Bắc nói chung đi vào hoạt động đồng bộ, quan trắc có hệ thống. Cho đến nay, tài liệu quan trắc KTTV trên lưu vực sông Đà là bộ số liệu tập trung và đáng tin cậy nhất. Sau đây là phần tổng hợp dữ liệu mà tôi đã thu thập được:

Bảng 3.1 Thống kê số liệu mưa thu thập được

Thời kỳ quan trắc TT Trạm Kinh độ Vĩ độ Độ cao (m)

Mưa Bốc hơi 1 Hoà Bình 105O20 20O49 23 1956-2004

2 Lai Châu 103O09 22O03 244 1956-

1992,1998-1999

3 Tạ Bú 104O03 21O27 241 1975-2004

4 Mù Cang Chải 104O05 21O51 975 1962-2004 5 Bình Lư 103O37 22O18 636 1961-1981

6 Mường Nhé 102O27 22O11 500 1961-1975 7 Mường Tè 102O50 22O22 310 1961-1995 1961-1992

8 Phong Thổ 103O20 22O32 330 1961-1978 1961-1978

9 Sìn Hồ 103O15 22O21 1529 1961-2004 1961-1992

10 Tam Đường 103O29 22O25 900 1973-2004 1973-1992 11 Tủa Chùa 103O21 21O59 1250 1956-1988 1968-1988

12 Bắc Yên 1973-1995 13 Cò Nòi 1964-1995

14 Mộc Châu 1961-2004

15 Quỳnh Nhai 103O34 21O50 155 1961-2004 1961-1992

16 Sơn La 103O54 21O20 676 1961-2004 1961-1992 17 Yên Châu 1961-2004

18 Lạc Sơn 1970-2004

19 Than Uyên 103O55 22O01 556 1961-1995

Page 62: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

64

20 Mai Châu 1993-1995

21 Thuận Châu 1969-1981

Bảng 3.2 Thống kê số liệu lưu lượng thu thập được Vị trí địa lý

TT Trạm Sông Kinh độ Vĩ độ

Diện tích lưu vực (km2)

Thời gian quan trắc Q

1 Lai châu Đà 103o10 22o04 33800 1957-2004 2 Nà hừ Nậm Bum 102o52 22o22 155 1968-2004 3 Nà tăm Nậm Mu 103o37 22o16 458 1967-1972 4 Nậm giàng Nậm Na 103o09 22o15 6740 1965-2004 5 Nậm mức Nậm Mức 103o17 21o52 2680 1961-2004 6 Nậm pô Nậm Pô 102o35 22o06 475 1963-1976 7 Pa há Nậm Mạ 103o24 22o13 424 1962-1976 8 Bản cuốn Nậm Cuốn 103o51 21o15 60 1965-1975 9 Nậm chiến Nậm Chiến 104o09 21o36 313 1963-1981 10 Tạ bú Đà 104o03 21o26 45900 1961-2004 11 Thác mộc Nậm Sập 104o33 20o52 405 1959-1981 12 Thác vai Nậm Bú 104o02 21o26 1360 1960-1976 13 Bãi sang Bãi Sang 105o03 20o45 97,5 1960-1976

14 Hoà bình Đà 105o19 20o49 51800 1956-1995, 2003-2004

15 Bản Củng Nậm Mu 103o48 21o47 2620 1961-1987, 2003-2004

16 Mù Cang Chải Nậm Kim 104o04 21o51 230 1981-2002 17 Mường Mít Nậm Mít 103o50 22o01 261 1967-1982 18 Suối Tân Nậm Tân 104o47 20o50 37 1970-1975 19 Phiêng Hiềng Suối Sập 104o29 21o12 269 1961-1976

3.2 Các phương pháp dự báo Trong phần này, luận văn trình bày về một số phương pháp dự báo đang áp dụng

hiện nay trong ngành thuỷ văn học [1] và giới thiệu kết quả tiếp cận sử dụng công nghệ học máy [5],[6][7][10][13],[14][19] vào dự báo thủy văn.

3.2.1 Dựa trên mô hình vật lý

Các phương pháp dự báo thuỷ văn truyền thống dựa trên việc nghiên cứu bản chất vật lý của quá trình hình thành nên hiện tượng. Quá trình đó thường được biểu diễn bằng các phương trình vi phân. Tuy nhiên, những phương trình đó thường khá phức tạp. Ví dụ, hiện tượng sóng lũ tuân theo quy luật chuyển động không ổn định và thường được biểu diễn bằng hệ phương trình Saint - Vernant :

Rcv

svv

gtv

gshid 2

21+

∂∂

+∂∂

=∂∂

−α (3.1)

Page 63: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

65

qsq

t=

∂∂

+∂∂ω (3.2)

Trong đó:

id : độ dốc đáy sông

v : vận tốc nước chảy qua mặt cắt ngang sông

s : chiều dài đoạn sông

t : thời gian

c: hệ số Chezi

R: bán kính thuỷ lực

ω: diện tích mặt cắt ướt

α: hệ số động năng

q: lượng nước gia nhập ở khu giữa trong một đơn vị dài của bờ sông

Về nguyên tắc, các phương trình vi phân này có thể giải được. Tuy nhiên do mối quan hệ phụ thuộc phức tạp giữa các yếu tố nên đến nay vẫn chưa tìm được nghiệm giải tích tổng quát của hệ phương trình trên và người ta phải tìm cách giải gần đúng cho từng trường hợp cụ thể riêng biệt. Có hai nhóm giải pháp để giải gần đúng các phương trình này đó là:

Phương pháp tính thuỷ lực lưới sông, phương pháp này cố gắng mô tả gần đúng quá trình hình thành lũ để tính toán dự báo. Tuy nhiên, hạn chế chủ yếu của phương pháp này là cần sử dụng nhiều tham số chi tiết về địa hình lòng sông tự nhiên mà thực tế thì các tài liệu này cho các hệ thống sông ở Việt Nam thường thiếu và không chính xác. Do đó, mặc dù phương pháp này đòi hỏi khối lượng tính toán rất lớn nhưng kết quả phụ thuộc nhiều vào độ chính xác và đầy đủ của số liệu đầu vào mô hình.

Phương pháp đơn giản hoá, phương pháp này tìm cách đơn giản hoá hệ phương trình Saint - Vernant tuỳ theo từng trường hợp tính toán cụ thể. Phương pháp này khắc phục được nhược điểm cần nhiều tham số khó thu thập của phương pháp trên.

Các mô hình truyền thống trên thường được gọi là các mô hình nhận thức hoặc mô hình vật lý. Các mô hình này xuất phát từ việc tìm hiểu các quá trình vật lý tạo nên các hiện tượng và diễn tả nó bằng các phương trình toán học. Loại mô hình này giúp chúng ta hiểu bản chất các quá trình vật lý tạo nên hiện tượng tự nhiên. Tuy vậy, nó đòi hỏi phải giải nhiều phương trình phức tạp với nhiều ẩn số đặc tả các quá trình vật lý đó. Nếu mô hình hoá không phù hợp sẽ dẫn đến kết quả dự báo không chính xác.

Page 64: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

66

3.2.2 Dựa trên mô hình toán

Mô hình toán học tập trung miêu tả hệ thống dưới dạng toán học. Mô hình toán học là tập hợp các phương trình toán học, các mệnh đề logic thể hiện các quan hệ giữa các biến và các thông số của mô hình để mô phỏng hệ thống tự nhiên, hay nói cách khác mô hình toán học là một hệ thống biến đổi đầu vào (hình dạng, điều kiện biên, lực v.v...) thành đầu ra (tốc độ chảy, mực nước, áp suất v.v...)

Hiện nay, sự phát triển của máy tính điện tử và phương pháp tính đã tạo điều kiện thuận lợi cho sự phát triển của mô hình toán, cấu trúc của mô hình ngày các đa dạng, phức tạp, mô tả sát thực được hiện tượng thuỷ văn.

Mô hình toán thuỷ văn hiện nay được phân làm hai loại: Mô hình tất định và mô hình ngẫu nhiên.

a. Mô hình tất định

Mô hình tất định là mô hình không xem xét đến tính ngẫu nhiên, các biến vào ra không mang tính ngẫu nhiên, không mang một phân bố xác suất nào. Các đầu vào như nhau đi qua hệ thống sẽ cho ta cùng một sản phẩm đầu ra. VenteChow (1964) có nêu ra định nghĩa: "Nếu các cơ hội xảy ra của các biến của quá trình thuỷ văn được bỏ qua trong mô hình toán, mô hình coi như tuân theo quy luật tất định và có thể gọi là mô hình tất định".

Mặc dù các hiện tượng thuỷ văn đều ít nhiều mang tính ngẫu nhiên, nhưng có những trường hợp mức độ biến đổi ngẫu nhiên của đầu ra có thể rất nhỏ bé so với sự biến đổi gây ra bởi các nhân tố đã biết. Trong những trường hợp này, sử dụng mô hình tất định là phù hợp.

b. Mô hình ngẫu nhiên

Trong mô hình ngẫu nhiên, các kết quả đầu ra luôn mang tính ngẫu nhiên, tức là luôn tuân theo một quy luật xác suất nào đấy. Nếu tính biến đổi ngẫu nhiên của đầu ra là lớn thì kết quả đầu ra có thể rất khác biệt với giá trị đơn nhất được tính toán từ mô hình tất định. Ví dụ, ta rất khó có thể xây dựng được mô hình tất định để dự báo được dòng chảy của một hệ thống sông nào đó, vì yếu tố mưa trong ngày là yếu tố ngẫu nhiên, nhưng lại có tác động quyết định đến kết quả dự báo.

Về thực chất, các quá trình thuỷ văn là các quá trình tự nhiên bị chi phối bởi rất nhiều yếu tố. Từng nhân tố lại hàm chứa của rất nhiều nhân tố khác mà con người chưa thể nào mô tả được quy luật của nó. Tiếp đó, các quá trình thuỷ văn lại là sự tổ hợp của vô vàn các mối quan hệ phức tạp, biểu hiện là một mô hình ngẫu nhiên nên được mô tả bằng mô hình ngẫu nhiên.

Page 65: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

67

Với quan điểm, dòng chảy là một quá trình ngẫu nhiên nên đầu vào để xây dựng mô hình chính là các chuỗi dữ liệu của bản thân nó trong quá khứ. Vì thế, chuỗi dữ liệu phải đủ dài để bộc lộ được nhiều đặc tính của nó.

3.2.3 Hướng tiếp cận mới

Một hướng tiếp cận mới để mô hình hoá các hiện tượng thuỷ văn là dựa trên các công nghệ học máy. Mô hình của nó được biểu diễn như sau:

Hình 3.2 Mô hình dự báo dựa trên công nghệ học máy

Mô hình này dựa trên một cơ sở dữ liệu thực tế đủ lớn và áp dụng các kỹ thuật tính toán hiện đại đang được dùng nhiều trong lĩnh vực công nghệ thông tin những năm gần đây như mạng nơ-ron nhân tạo, giải thuật di truyền, cây quyết định.v.v... và chúng thường được nói tới như các phương pháp học máy, một phần của trí tuệ nhân tạo. Hướng tiếp cận này đã mở ra một phương pháp mới để mô hình hoá các quá trình tự nhiên phức tạp, phi tuyến mà việc đặc tả các quá trình vật lý của nó gặp nhiều khó khăn như mô hình hoá quá trình mưa rào - dòng chảy, dự báo lũ, dự báo hạn hán, mô hình hoá dòng chảy ngầm, phân loại đất, dự báo nhu cầu sử dụng nước.v.v…

3.3 Một số chỉ tiêu đánh giá kết quả dự báo Dự báo hầu như bao giờ cũng có sai số vì hiện tượng thuỷ văn phụ thuộc quá

nhiều yếu tố, diễn biến rất phức tạp, khó mà tính toán hết. Để đánh giá, so sánh các phương pháp dự báo một cách định lượng chúng ta cần sử dụng các chỉ số dự báo. Dưới đây là một số chỉ số dự báo thông dụng nhất [1]:

Sai số quân phương (Mean Square Error):

( )2

1

1 ˆn

i ii

MSE Q Qn =

= −∑ (3.3)

Dữ liệu đầu vào

Hệ thống thực

Mô hình học máy

x Đầu ra thực tế (quan sát) Y

Học để tối thiểu hoá sự khác nhau

này

Đầu ra dự đoán Y'

Page 66: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

68

Sai số căn quân phương (Root Mean Square Error):

( )2

1

1 ˆn

i ii

RMSE Q Qn =

= −∑ (3.4)

Sai số tuyệt đối (Mean Absolute Error):

1

1 ˆn

i ii

MAE Q Qn =

= −∑ (3.5)

Trong đó:

o ˆiQ : Giá trị tính toán tại thời điểm i.

o iQ : Giá trị thực đo tại thời điểm i.

Tuy các chỉ số (3.3)-(3.5) là trực quan và dễ dàng tính toán song trong nhiều trường hợp khi dung lượng dữ liệu lớn hay dữ liệu có độ biến động cao thì các chỉ số này trở nên quá thô sơ. D.R. Legates và G.J. McCabe Jr. [12] trình bày về chỉ số hiệu quả - E (Coefficient of Efficiency) và chỉ số xác định - R2 (Coefficient of Determination) tuy có độ phức tạp tính toán cao hơn song khắc phục được các hạn chế của các chỉ số (3.3)-(3.5):

( )( )

2

12

1

ˆ1

n

i ii

n

ii

Q QE

Q Q

=

=

−= −

∑ (3.6)

( )( )

( ) ( )2 1

22

1 1

ˆ ˆ

ˆ ˆ

n

i ii

n n

i ii i

Q Q Q QR

Q Q Q Q

=

= =

− −=

− −

∑ ∑ (3.7)

Các chỉ số E và R2 có thể được dùng theo cách kết hợp hoặc riêng rẽ. Phương pháp tốt là phương pháp nhận được giá trị của các chỉ số này lớn.

Trong nghiên cứu của mình, chúng tôi sử dụng hai chỉ số: chỉ số sai số căn quân phương - RMSE và chỉ số xác định - R2 để đánh giá độ chính xác của dự báo.

3.4 Dự báo lưu lượng đến hồ Hoà Bình trước 10 ngày

3.4.1 Phần mềm xây dựng

Để có thể thử nghiệm các phương án học khác nhau đối với mạng nơ-ron nhân tạo như đề cập ở chương 2 và thử nghiệm các phương án dự báo dòng chảy, chúng tôi đã xây dựng một phần mềm mô phỏng mạng nơ-ron truyền thẳng sử dụng thuật toán học lan truyền ngược sai số kết hợp với giải thuật di truyền. Giao diện của chính

Page 67: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

69

của phần mềm như trên hình 3.3. Chi tiết về phần mềm này được trình bày trong phụ lục A.

Phần mềm được xây dựng bằng ngôn ngữ Visual Basic 6.0, không sử dụng thư viện đặc biệt nào. Các giải thuật lan truyền ngược sai số, giải thuật di truyền được lập trình từ đầu.

Cấu hình của hệ thống yêu cầu để có thể cài đặt được phần mềm là:

- Tốc độ CPU tương đương Pentium 4 trở lên.

- Dung lượng RAM 256MB trở lên.

- Dung lượng đĩa cứng còn trống trên 20 MB.

Hình 3.3 Giao diện chính của phần mềm thử nghiệm

3.4.2 Số liệu sử dụng

Chúng tôi sử dụng số liệu từ năm 1964 đến năm 2002 tại trạm đo Tạ Bú trên sông Đà, trạm đo lưu lượng gần hồ Hoà Bình nhất (xem mục 3.1.7). Số liệu này được đo trong mùa cạn từ tháng Mười Hai năm trước đến tháng Năm năm sau. Bộ dữ liệu được chia làm hai phần:

- Phần dữ liệu học (training set): Từ cuối năm 1964 đến đầu năm 1995 có tổng cộng 480 mẫu học.

Page 68: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

70

- Phần dữ liệu kiểm tra (test set): Từ cuối năm 1995 đến đầu năm 2002 tổng cộng có 90 mẫu kiểm tra.

3.4.3 Các tham số

a. Các tham số của mạng nơ-ron

- Kiến trúc mạng: chúng tôi sử dụng mạng nơ-ron lan truyền thẳng ba lớp: lớp vào, lớp ẩn và lớp ra. Trong đó lớp vào là đầu vào của các tham số phục vụ cho việc dự báo. Lớp ra chỉ có một nơ-ron, giá trị đầu ra của nơ-ron này chính là lưu lượng nước cần dự báo.

- Hàm kích hoạt được sử dụng là hàm sigmoid (hình 1.13).

b. Các tham số học

- Sử dụng phương pháp học kết hợp giữa giải thuật di truyền có cải tiến và giải thuật lan truyền ngược sai số như đã đề cập trong phần 2.4.

- Giá trị trọng số được khởi tạo ngẫu nhiên trong khoảng (-3, 3).

- Với giải thuật di truyền:

o Số lượng quần thể: 100

o Sử dụng lai ghép nút, đột biến nút

o Xác suất lai: 0.3

o Xác suất đột biến BIASED: 0.1

o Xác suất đột biến UNBIASED: 0.03

- Với giải thuật lan truyền ngược sai số:

o Hằng số học: 0.3

o Không sử dụng hằng số quán tính.

3.4.4 Các phương án dự báo

Việc thử nghiệm được tiến hành với 3 phương án dự báo dòng chảy đến hồ Hoà Bình trước 10 ngày như đã được chúng tôi trình bày trong [1]. Trong nghiên cứu được trình bày trong [1], chúng tôi sử dụng mạng nơ-ron truyền thẳng với phương pháp học dựa trên giải thuật lan truyền ngược sai số. Trong phần này, chúng tôi thử nghiệm các phương án dự báo đó với mạng nơ-ron sử dụng phương pháp học kết hợp giữa giải thuật di truyền cải tiến và giải thuật lan truyền ngược sai số như đã trình bày trong chương 2 phần 2.4 để so sánh với các kết quả trong [1].

Page 69: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

71

a. Phương án 1

Trong phương án này việc dự báo lưu lượng nước tương lai trước 10 ngày Q(t+10) dựa vào các lưu lượng nước tại thời điểm hiện tại và quá khứ. Chúng tôi sử dụng ba giá trị lưu lượng làm đầu vào của mạng gồm:

- Lưu lượng nước hiện tại: Q(t)

- Lưu lượng nước trước đó 10 ngày: Q(t-10)

- Lưu lượng nước trước đó 20 ngày: Q(t-20)

( )( 10) ( ), ( 10), ( 20)Q t f Q t Q t Q t+ = − − (3.6)

Ta sẽ dùng mạng nơ-ron để học được mối quan hệ này. Kết quả sau khi học, các chỉ số dự báo với dữ liệu kiểm tra (test set):

- Sai số căn quân phương RMSE = 102.60 m3/s

- Chỉ số R2 = 0.7703

(Kết quả dự báo dùng mạng nơ-ron sử dụng phương pháp lan truyền ngược sai số trình bày trong [1]: RMSE = 110.49 m3/s, R2 = 0.7509)

0

200

400

600

800

1000

1200

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86

Mẫu thử

Lưu

lượ

ng (m

3 /s)

Thực tế

Dự báo

Hình 3.3 Kết quả dự báo với dữ liệu kiểm tra theo phương án 1

Page 70: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

72

Thực tế

R2 = 0.7703

0

200

400

600

800

1000

1200

0 200 400 600 800 1000 1200

Dự

báo

Hình 3.4 Kết quả dự báo với dữ liệu kiểm tra theo phương án 1 trên đồ thị

scatter

b. Phương án 2

Theo các nghiên cứu thuỷ văn, dữ liệu về mưa trên lưu vực cũng ảnh hưởng rất lớn đến lưu lượng nước trong tương lai. Việc dự báo cần cả thông số về lượng mưa tại thời điểm hiện tại và lượng mưa trong quá khứ (do ảnh hưởng đến trữ lượng nước ngầm). Trong phương án này, dự báo lưu lượng nước tương lai trước 10 ngày Q(t+10) không những chỉ dựa vào các lưu lượng nước quá khứ và hiện tại ( )( ), ( 10), ( 20)Q t Q t Q t− − như phương án 1 mà còn phụ thuộc vào lượng mưa trong

quá khứ và hiện tại tại lưu vực đó ( )( ), ( 10), ( 20)X t X t X t− − .

( )( 10) ( ), ( 10), ( 20), ( ), ( 10), ( 20)Q t f Q t Q t Q t X t X t X t+ = − − − − (3.7)

Chúng tôi đã tiến hành cho mạng nơ-ron học mối quan hệ này và cho kết quả dự báo chính xác hơn phương án 1.

Kết quả với dữ liệu kiểm tra:

- Sai số căn quân phương RMSE = 99.76 m3/s

- Chỉ số R2 = 0.7902

(Kết quả dự báo dùng mạng nơ-ron sử dụng phương pháp lan truyền ngược sai số trình bày trong [1]: RMSE = 103.22 m3/s, R2 = 0.7866)

Page 71: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

73

0

200

400

600

800

1000

1200

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86

Mẫu thử

Lưu

lượ

ng (m

3 /s)

Thực tế

Dự báo

Hình 3.5 Kết quả dự báo với dữ liệu kiểm tra theo phương án 2

Thực tế

R2 = 0.7902

0

200

400

600

800

1000

1200

0 200 400 600 800 1000 1200

Dự

báo

Hình 3.6 Kết quả dự báo với dữ liệu kiểm tra theo phương án 2 trên đồ thị

scatter

c. Phương án 3

Chúng tôi nhận thấy ngoài các yếu tố như đã nêu trong phương án 2, lưu lượng nước trong 10 ngày tới còn phụ thuộc vào lưu lượng nước của ngày hiện tại Qng(t) và lượng mưa tại ngày hiện tại Xng(t) (khác với Q(t) và X(t) là giá trị lưu lượng và lượng mưa trung bình trong 10 ngày). Do đó:

( )( 10) ( ), ( 10), ( 20), ( ), ( ), ( 10), ( 20), ( )ng ngQ t f Q t Q t Q t Q t X t X t X t X t+ = − − − − (3.8)

Page 72: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

74

Kết quả với dữ liệu kiểm tra:

- Sai số căn quân phương RMSE = 72.28 m3/s

- Chỉ số R2 = 0.8742

(Kết quả dự báo dùng mạng nơ-ron sử dụng phương pháp lan truyền ngược sai số trình bày trong [1]: RMSE = 76.10 m3/s, R2 = 0.8737)

(Toàn bộ số liệu học và kiểm tra được trình bày trong phụ lục C)

0

200

400

600

800

1000

1200

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86Mẫu thử

Lưu

lượ

ng (m

3 /s)

Thực tếDự báo

Hình 3.7 Kết quả dự báo với dữ liệu kiểm tra theo phương án 3

Thực tế

R2 = 0.8742

0

200

400

600

800

1000

1200

0 200 400 600 800 1000 1200

Dự

báo

Hình 3.8 Kết quả dự báo với dữ liệu kiểm tra theo phương án 3 trên đồ thị

scatter

Page 73: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

75

Độ chính xác của phương án dự báo này cao hơn nhiều so với hai phương án trên chứng tỏ nhận xét trên là đúng. Lưu lượng nước của ngày hiện tại Qng(t) và lượng mưa tại ngày hiện tại Xng(t) ảnh hưởng rất nhiều đến lưu lượng nước trong 10 ngày tới.

Kết luận chương Chương chương này chúng ta đã ứng dụng mạng nơ-ron nhân tạo vào việc dự

báo dòng chảy đến hồ Hoà Bình trước 10 ngày. Thuật toán học của mạng nơ-ron được sử dụng đó là sự kết hợp giữa giải thuật di truyền cải tiến và giải thuật lan truyền ngược sai số như đã đề cập trong chương 2. Việc thử nghiệm dự báo được tiến hành với ba phương án. Trong các phương án thử nghiệm với giải thuật học kết hợp luôn cho kết quả tốt hơn so với phương pháp học chỉ sử dụng giải thuật lan truyền ngược sai số mà chúng tôi đã thử nghiệm trong [1]. Trong đó, phương án thử nghiệm thứ 3 cho kết quả tốt nhất: chỉ số đạt R2 = 0.8742. Đối với dự báo trước 10 ngày đây là một kết quả khả quan.

Page 74: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

76

KKẾẾTT LLUUẬẬNN Luận văn định hướng nội dung nghiên cứu vào mạng neuron nhân tạo, thuật toán gene, mô hình kết hợp giữa phương pháp học máy mạng neuron với thuật toán gene, đề xuất cải tiến và ứng dụng vào bài toán dự báo lưu lượng nước đến hồ Hòa Bình.

Các đóng góp khoa học của luận văn

1. Hệ thống hóa các nội dung cơ bản về mạng neuron nhân tạo và thuật toán gene.

2. Nghiên cứu các phương pháp kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số nhằm đạt tới một kết quả trọn vẹn của bài toán tối ưu trọng số mạng nơ-ron nhân tạo.

3. Trong mô hình kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số, luận văn đã đề xuất cải tiến việc kết hợp giữa đột biến BIASED và đột biến UNBIASED (với xác suất đột biến rất nhỏ) để tránh những trường hợp mạng rơi vào cực tiểu cục bộ. Kết quả thử nghiệm được tiến hành với bài toán XOR cho thấy rằng cải tiến này là hiệu quả.

4. Xây dựng phần mềm dự báo lưu lượng nước về hồ Hòa Bình triển khai phương pháp kết hợp mạng neuron với thuật toán gene với cải tiến nói trên. Kết quả thực nghiệm dự báo lưu lượng đến hồ Hoà Bình trước 10 ngày có chỉ số R2 đạt 0.8742, sai số RMSE = 72.28 m3/s. Đây là một kết quả cao trong dự báo dòng chảy trước 10 ngày.

Nội dung nghiên cứu của luận văn đã được công bố trong một báo cáo khoa học tại Hội nghị khoa học quốc gia Một số vấn đề chọn lọc về Công nghệ thông tin và Truyền thông lần thứ X tại Đại Lải vào tháng 9/2007 [2].

Hướng phát triển

Những kết quả nghiên cứu khả quan về ứng dụng mạng nơ-ron nhân tạo với hai thuật toán học là lan truyền ngược sai số và giải thuật di truyền trong bài toán dự báo lưu lượng nước đến hồ Hoà Bình đã chứng tỏ rằng đây là một mô hình có thể ứng dụng hiệu quả đối với bài toán này. Tuy nhiên, một câu hỏi đặt ra là: Liệu các phương pháp học máy khác như Support Vector Machine (SVM), Decision Tree... có thu được những kết quả tốt hơn hay không? Đã có nhiều nghiên cứu trên thế giới thành công khi sử dụng các phương pháp này trong bài toán dự báo chuỗi thời gian. Vì vậy, một trong những hướng phát triển tiếp theo của đề tài là nghiên cứu, cải tiến và thử nghiệm các phương pháp học máy tiên tiến khác để có thể nâng cao được kết quả dự báo và thời gian dự báo.

Page 75: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

77

Tuy nhiên, chúng tôi cũng nhận ra rằng, sự đầy đủ hay không của tập số liệu đầu vào ảnh hưởng rất lớn đến kết quả dự báo. Ví dụ, trong dự báo thuỷ văn dài hạn, những yếu tố như đặc điểm khí hậu, hình thái thời tiết... ảnh hưởng rất lớn đến độ chính xác và thời gian dự báo. Vì thế, đồng hành với hướng phát triển trên, chúng tôi sẽ tiến hành thu thập số liệu khí tượng trên lưu vực này để thử nghiệm và đánh giá kết quả dự báo.

Page 76: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

78

TTÀÀII LLIIỆỆUU TTHHAAMM KKHHẢẢOO [1]. Lê Văn Nghinh, Bùi Công Quang, Hoàng Thanh Tùng (2006), Mô hình

toán thuỷ văn, Nhà xuất bản xây dựng. [2]. Phạm Thị Hoàng Nhung, Hà Quang Thụy (2007), Nghiên cứu, sử dụng

mạng nơ-ron nhân tạo trong dự báo lưu lượng nước đến hồ Hoà Bình trước 10 ngày, Hội thảo Quốc gia Một số vấn đề chọn lọc về Công nghệ thông tin và Truyền thông, lần thứ X, Đại Lải, Vĩnh Phúc, 9/2007.

[3]. Viện Khí tượng Thủy văn. Danh sách các đề tài, dự án nghiên cứu khoa học công nghệ. http://www.imh.ac.vn/c_tt_chuyen_nganh/ce_detai_duan/.

[4]. Thomas Back (1996), Evolutionary Algorithm in Theory and Practice,

Oxford University Press. [5]. Ibrahim Can, Cahit Yerdelen, Ercan Kahya1 (2007), Stochastic modeling of

Karasu River (Turkey) using the methods of Artificial Neural Networks, Proceeding of the AGU Hydrology Days 2007, March 19 - March 21, 2007, Colorado State University, Fort Collins, Colorado, USA, 138-144.

[6]. Paulin Coulibaly, Francois Anctil, and Bernard Bobee (2001), Multivariate Reservoir Inflow Forecasting Using Temporal Neural Networks, Journal of Hydrologic Engineering, 6(5), 367-376.

[7]. Oscar R. Dolling, Eduardo A. Varas (2002), Artificial neural networks for stream flow prediction, Journal of Hydraaulic research, 40(5), 547-554.

[8]. D.E. Goldberg (1989), Genetic Algorithm in Search, Optimization and Machine Learning, Addison Wesley, Reading, MA.

[9]. J. Hertz, A. Krogh, and R.G. Palmer. (1991), Introduction to the Theory of Neural Computation, New York: Addison-Wesley.

[10]. Ismail Kilinş, Kerem Ciğizouğlu (2005), Reservoir Management Using Artificial Neural Networks, 14th. Reg. Directorate of DSI (State Hydraulic Works), Istanbul, Turkey.

[11]. Steve Lawrence and C. Lee Giles (2000), Overfitting and Neural Networks: Conjugate Gradient and Backpropagation, International Joint onference on Neural Networks, Como, Italy, July 24–27, 114–119, 2000.

[12]. D.R. Legates, G.J. McCabe Jr. (1998), Evaluating the Use of "Goodness-of-Fit" Measures in Hydrologic and Hydroclimatic Model Validation; Water Resour. Res. 1998WR900018, 35(1): 233.

[13]. Demetris F. Lekkas (2002), Development and Comparison of Data-Based Flow Forecasting Methods, PhD Thesis, Department of Civil and Environmental Engineering, Imperial College of Science, Technology and Medicine, London.

[14]. Lekkas D.F., Onof C (2005), Improved flow forecasting using artificial neural networks, 9th International Conference on Environmental and Technology, Rhodes Island, Greece, 1-3 September 2005, 877-884.

Page 77: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

79

[15]. Chin-Teng Lin, C.S. George Lee (1996), Neural fuzzy systems: a neuro-fuzzy synergism to intelligent systems, Prentice-Hall Inc.

[16]. D. Montana and L. Davis (1989), Training feedforward neural networks using genetic algorithms, In Proceedings of the Eleventh International Joint Conference on Artificial Intelligence, 762-767, Morgan Kaufmann, San Mateo, CA.

[17]. Nelson, M.C. and Illingworth, W.T. (1991), A Practical Guide to Neural Nets, Reading, MA: Addison-Wesley.

[18]. L.Wessels, E.Barnard (1992), Avoiding False Local Minima by Proper Initialization of Connections, IEEE Trans. on Neural Networks.

[19]. Cristiane Medina Finzi Quintao, Walmir Matos Caminhas, Selenio Rocha Silva, Bruno Rabelo Versiani (2004), Neo Fuzzy Neuron and its applications to Prediction flood and wind in Brazil, Workshop on Modelling and Control for Participatory Planning and Managing Water Systems, September 29-October 1, 2004 (Poster), Venice, Italia.

[20]. D.E. Rumelhart; G.E. Hinton and R.J. Williams (1986), Learning internal representations by error propagation, Rumelhart, D.E. et al. (eds.): Parallel distributed processing: Explorations in the microstructure of cognition (Cambridge MA.: MIT Press), 318-362.

[21]. D. Whitley, T. Starkweather et C. Bogart (1990), Genetic algorithms and neural networks: optimizing connections and connectivity, in: Parallel Computing 14, 347-361, North-Holland.

Page 78: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

80

PPHHỤỤ LLỤỤCC Phụ lục A - Giới thiệu về phần mềm dự báo 1. Cấu trúc file dữ liệu học và kiểm tra

Các file dữ liệu học có phần mở rộng là pat, các file dữ liệu kiểm tra là tst. Hai loại file này được lưu dưới dạng text, có cấu trúc như hình dưới. Trong đó dòng đầu tiên là 3 tham số của dữ liệu theo thứ tự:

- Số đầu tiên là số lượng mẫu học (p)

- Số thứ hai là số đầu vào của mạng (i)

- Số thứ ba là số đầu ra của mạng (o)

Các dòng tiếp theo là các số liệu học, trên mỗi dòng có i số liệu đầu vào và o số liệu đầu ra được phân cách nhau bởi dấu cách hoặc tab.

2. Module chuẩn hoá số liệu

Như đã đề cập trong chương 1, nếu dữ liệu học quá lớn ta cần chuẩn hoá số liệu về khoảng nằm trong phạm vi biểu diễn của mạng. Trong phần mềm này chúng tôi sử dụng phương pháp chuẩn hoá tuyến tính.

Page 79: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

81

3. Lựa chọn các tham số

Giao diện chính của chương trình như hình dưới.

Sau khi nhập số liệu học và chuẩn hoá (nếu cần) ta có thể nhập thêm file kiểm

tra. Sau đó ta sẽ thiết lập các tham số chung:

- Số lượng nơ-ron trong lớp ẩn.

- Ngưỡng sai số để dừng học.

- Khoảng giá trị để khởi tạo các trọng số.

Nếu sử dụng phương pháp học lan truyền ngược sai số cần chọn:

- Hằng số học.

- Hằng số quán tính.

Page 80: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

82

Nếu sử dụng phương pháp học dựa trên giải thuật di truyền cần chọn các tham số:

- Số lượng nhiễm sắc thể.

- Xác suất lai.

- Xác suất đột biến.

- Giá trị đột biến: giá trị trọng số được cộng thêm hoặc thay thế (tuỳ vào phương pháp đột biến) là số ngẫu nhiên có trị số tuyệt đối nhỏ hơn giá trị tham số này.

- Lựa chọn các phương pháp đột biến.

- Nếu sử dụng kết hợp đột biến BIASED và UNBIASED cần chọn thêm các tham số của đột biến UNBIASED gồm:

o Xác suất đột biến UNBIASED (thường rất nhỏ so với xác suất đột biến BIASED).

o Giá trị đột biến của UNBIASED.

- Lựa chọn các phương pháp lai ghép.

Nếu sử dụng phương pháp học kết hợp giữa giải thuật di truyền và giải thuật lan truyền ngược sai số như đề cập trong chương 2. Đầu tiên, sử dụng phương pháp học dựa trên giải thuật di truyền, sau khi sai số đã đạt đến một giá trị mong muốn tiến hành sử dụng giải thuật lan truyền ngược sai số để học tiếp với bộ trọng số của nhiễm sắc thể tốt nhất (chú ý: chỉ khởi tạo trọng số khi bắt đầu học với giải thuật di truyền, khi học bằng giải thuật lan truyền ngược sai số thì không khởi tạo lại).

4. Một số giao diện khác Trong giao giao diện chính ta có thể quan sát giá trị của các trọng số trong mạng.

Giá trị đầu vào, ra của mạng với dữ liệu học và kiểm tra và có thể xuất các dữ liệu này ra MS Excel hoặc file text. Ngoài ra ta có thể quan sát mạng nơ-ron nhân tạo một cách trực quan (kích vào nút mạng nơ-ron).

Page 81: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

83

Ta cũng có thể quan sát diễn biến quá trình học bằng cách kích vào nút đồ thị

trên giao diện chính. Trên giao diện này ta có thể quan sát:

Đầu ra của mạng và đầu ra mong muốn của mẫu học

Đầu ra của mạng và đầu ra mong muốn của mẫu kiểm tra

Page 82: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

84

Sai số căn quân phương – RMSE của mẫu học và mẫu kiểm tra

Page 83: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

85

Phụ lục B - Mẫu học thử nghiệm so sánh các phương pháp lai ghép và đột biến

STT Đầu vào 1 Đầu vào 2Đầu vào 3Đầu vào 4 Đầu ra 1 0.739713 0.920735 0.998747 0.954649 0.799236 2 0.920735 0.998747 0.954649 0.799236 0.570560 3 0.998747 0.954649 0.799236 0.570560 0.324608 4 0.954649 0.799236 0.570560 0.324608 0.121599 5 0.799236 0.570560 0.324608 0.121599 0.011235 6 0.570560 0.324608 0.121599 0.011235 0.020538 7 0.324608 0.121599 0.011235 0.020538 0.147230 8 0.121599 0.011235 0.020538 0.147230 0.360292 9 0.011235 0.020538 0.147230 0.360292 0.607560 10 0.020538 0.147230 0.360292 0.607560 0.828493 11 0.147230 0.360292 0.607560 0.828493 0.969000 12 0.360292 0.607560 0.828493 0.969000 0.994679 13 0.607560 0.828493 0.969000 0.994679 0.899244 14 0.828493 0.969000 0.994679 0.899244 0.706059 15 0.969000 0.994679 0.899244 0.706059 0.462424 16 0.994679 0.899244 0.706059 0.462424 0.227989 17 0.899244 0.706059 0.462424 0.227989 0.060152 18 0.706059 0.462424 0.227989 0.060152 0.000005 19 0.462424 0.227989 0.060152 0.000005 0.062274 20 0.227989 0.060152 0.000005 0.062274 0.231714 21 0.060152 0.000005 0.062274 0.231714 0.466839 22 0.000005 0.062274 0.231714 0.466839 0.710084 23 0.062274 0.231714 0.466839 0.710084 0.901892 24 0.231714 0.466839 0.710084 0.901892 0.995304 25 0.466839 0.710084 0.901892 0.995304 0.967448 26 0.710084 0.901892 0.995304 0.967448 0.825144 27 0.901892 0.995304 0.967448 0.825144 0.603234 28 0.995304 0.967448 0.825144 0.603234 0.356048 29 0.967448 0.825144 0.603234 0.356048 0.144107 30 0.825144 0.603234 0.356048 0.144107 0.019301

Page 84: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

86

Phụ lục C - Số liệu học và kiểm tra trong bài toán dự báo lưu lượng nước đến hồ Hoà Bình 1. Dữ liệu học

Gồm 480 mẫu học:

STT Năm Q(t) Q(t-10) Q(t-20) Qng(t) X(t) X(t-10) X(t-20) Xng(t) Q(t+10)

1 64-65 1019.00 870.00 1171.00 990.00 1.70 0.20 0.40 16.50 877.002 64-65 877.00 1019.00 870.00 810.00 1.80 1.70 0.20 15.50 733.503 64-65 733.50 877.00 1019.00 760.00 0.00 1.80 1.70 0.20 665.454 64-65 665.45 733.50 877.00 620.00 6.30 0.00 1.80 5.40 546.505 64-65 546.50 665.45 733.50 514.00 1.40 6.30 0.00 0.00 535.406 64-65 535.40 546.50 665.45 518.00 2.80 1.40 6.30 16.60 463.647 64-65 463.64 535.40 546.50 432.00 0.00 2.80 1.40 0.00 464.708 64-65 464.70 463.64 535.40 492.00 23.00 0.00 2.80 47.80 413.909 64-65 413.90 464.70 463.64 376.00 0.50 23.00 0.00 0.00 355.50

10 64-65 355.50 413.90 464.70 364.00 2.30 0.50 23.00 2.50 364.8011 64-65 364.80 355.50 413.90 347.00 16.70 2.30 0.50 10.70 319.7012 64-65 319.70 364.80 355.50 309.00 0.00 16.70 2.30 0.40 282.0913 64-65 282.09 319.70 364.80 269.00 0.00 0.00 16.70 2.90 303.7014 64-65 303.70 282.09 319.70 428.00 87.40 0.00 0.00 57.60 457.5015 64-65 457.50 303.70 282.09 454.00 92.10 87.40 0.00 35.40 328.5016 65-66 1015.50 1486.00 3237.00 890.00 0.00 36.10 91.40 9.40 796.5017 65-66 796.50 1015.50 1486.00 746.00 0.00 0.00 36.10 0.00 1267.0018 65-66 1267.00 796.50 1015.50 1870.00 5.20 0.00 0.00 70.40 900.2719 65-66 900.27 1267.00 796.50 746.00 0.00 5.20 0.00 7.60 757.0020 65-66 757.00 900.27 1267.00 725.00 1.50 0.00 5.20 2.40 657.5021 65-66 657.50 757.00 900.27 625.00 0.00 1.50 0.00 19.70 647.7322 65-66 647.73 657.50 757.00 660.00 25.00 0.00 1.50 0.00 540.5023 65-66 540.50 647.73 657.50 505.00 0.00 25.00 0.00 0.00 471.5024 65-66 471.50 540.50 647.73 440.00 0.00 0.00 25.00 0.00 417.3825 65-66 417.38 471.50 540.50 409.00 0.00 0.00 0.00 0.00 388.8026 65-66 388.80 417.38 471.50 364.00 0.00 0.00 0.00 2.20 358.5027 65-66 358.50 388.80 417.38 329.00 0.00 0.00 0.00 0.00 322.0928 65-66 322.09 358.50 388.80 319.00 0.00 0.00 0.00 0.00 337.4029 65-66 337.40 322.09 358.50 392.00 17.70 0.00 0.00 61.50 324.8030 65-66 324.80 337.40 322.09 336.00 45.20 17.70 0.00 40.70 340.5031 66-67 962.50 1037.50 1364.00 865.00 0.00 0.80 0.60 0.90 816.0032 66-67 816.00 962.50 1037.50 750.00 0.00 0.00 0.80 0.00 707.0033 66-67 707.00 816.00 962.50 665.00 0.00 0.00 0.00 0.00 615.4534 66-67 615.45 707.00 816.00 595.00 8.20 0.00 0.00 0.00 539.0035 66-67 539.00 615.45 707.00 532.00 0.00 8.20 0.00 0.00 624.0036 66-67 624.00 539.00 615.45 517.00 4.30 0.00 8.20 16.20 463.9137 66-67 463.91 624.00 539.00 408.00 0.00 4.30 0.00 0.00 461.7038 66-67 461.70 463.91 624.00 444.00 27.30 0.00 4.30 57.10 399.5039 66-67 399.50 461.70 463.91 376.00 0.00 27.30 0.00 0.00 347.7540 66-67 347.75 399.50 461.70 333.00 2.40 0.00 27.30 0.00 326.0041 66-67 326.00 347.75 399.50 326.00 1.20 2.40 0.00 0.00 337.3042 66-67 337.30 326.00 347.75 300.00 7.00 1.20 2.40 0.00 290.3643 66-67 290.36 337.30 326.00 268.00 0.00 7.00 1.20 7.70 254.4044 66-67 254.40 290.36 337.30 261.00 6.60 0.00 7.00 9.90 368.9045 66-67 368.90 254.40 290.36 487.00 126.30 6.60 0.00 96.50 450.60

Page 85: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

87

46 67-68 1074.20 1361.60 804.60 892.00 0.00 0.40 0.00 0.00 804.5047 67-68 804.50 1074.20 1361.60 762.00 12.10 0.00 0.40 10.40 769.0048 67-68 769.00 804.50 1074.20 682.00 10.20 12.10 0.00 12.20 599.2749 67-68 599.27 769.00 804.50 552.00 0.60 10.20 12.10 6.00 553.3050 67-68 553.30 599.27 769.00 519.00 0.00 0.60 10.20 0.00 776.3051 67-68 776.30 553.30 599.27 995.00 10.50 0.00 0.60 0.30 607.3652 67-68 607.36 776.30 553.30 528.00 0.00 10.50 0.00 9.20 488.0053 67-68 488.00 607.36 776.30 456.00 0.00 0.00 10.50 0.00 521.6054 67-68 521.60 488.00 607.36 460.00 19.30 0.00 0.00 49.00 553.5655 67-68 553.56 521.60 488.00 573.00 27.40 19.30 0.00 64.10 476.5056 67-68 476.50 553.56 521.60 424.00 23.10 27.40 19.30 7.90 408.7057 67-68 408.70 476.50 553.56 393.00 1.10 23.10 27.40 23.70 338.4558 67-68 338.45 408.70 476.50 315.00 5.30 1.10 23.10 16.30 524.5059 67-68 524.50 338.45 408.70 478.00 27.00 5.30 1.10 89.30 535.6060 67-68 535.60 524.50 338.45 610.00 32.40 27.00 5.30 39.00 689.7061 68-69 963.00 1299.00 1868.00 845.00 0.00 4.70 34.90 7.20 798.0062 68-69 798.00 963.00 1299.00 740.00 0.00 0.00 4.70 0.00 689.0063 68-69 689.00 798.00 963.00 650.00 0.00 0.00 0.00 0.00 600.4564 68-69 600.45 689.00 798.00 564.00 0.00 0.00 0.00 0.00 531.5065 68-69 531.50 600.45 689.00 520.00 0.00 0.00 0.00 0.00 524.0066 68-69 524.00 531.50 600.45 480.00 0.00 0.00 0.00 0.00 428.6467 68-69 428.64 524.00 531.50 400.00 1.00 0.00 0.00 0.00 387.3068 68-69 387.30 428.64 524.00 383.00 0.00 1.00 0.00 0.00 353.7069 68-69 353.70 387.30 428.64 333.00 0.00 0.00 1.00 0.00 314.6370 68-69 314.63 353.70 387.30 300.00 0.00 0.00 0.00 0.00 290.4071 68-69 290.40 314.63 353.70 285.00 0.00 0.00 0.00 0.50 282.7072 68-69 282.70 290.40 314.63 289.00 13.00 0.00 0.00 4.30 261.1873 68-69 261.18 282.70 290.40 239.00 0.00 13.00 0.00 9.40 241.4074 68-69 241.40 261.18 282.70 246.00 0.20 0.00 13.00 21.10 280.4075 68-69 280.40 241.40 261.18 400.00 75.50 0.20 0.00 47.90 266.3076 69-70 664.00 760.50 1053.50 650.00 0.00 0.00 37.60 7.20 590.0077 69-70 590.00 664.00 760.50 555.00 0.00 0.00 0.00 0.00 514.5078 69-70 514.50 590.00 664.00 500.00 0.00 0.00 0.00 0.00 482.2779 69-70 482.27 514.50 590.00 450.00 0.00 0.00 0.00 0.00 431.1080 69-70 431.10 482.27 514.50 423.00 2.10 0.00 0.00 8.00 432.0081 69-70 432.00 431.10 482.27 409.00 1.90 2.10 0.00 8.00 439.0982 69-70 439.09 432.00 431.10 374.00 6.20 1.90 2.10 42.90 355.3083 69-70 355.30 439.09 432.00 352.00 0.00 6.20 1.90 4.70 398.3084 69-70 398.30 355.30 439.09 331.00 18.80 0.00 6.20 13.70 302.5085 69-70 302.50 398.30 355.30 284.00 0.00 18.80 0.00 0.00 270.4086 69-70 270.40 302.50 398.30 262.00 0.00 0.00 18.80 0.00 243.4087 69-70 243.40 270.40 302.50 234.00 0.00 0.00 0.00 0.00 282.8288 69-70 282.82 243.40 270.40 273.00 18.70 0.00 0.00 13.80 244.6089 69-70 244.60 282.82 243.40 254.00 0.20 18.70 0.00 2.50 290.0090 69-70 290.00 244.60 282.82 258.00 41.00 0.20 18.70 56.80 394.5091 70-71 658.50 788.70 861.90 626.00 10.20 0.00 0.00 5.50 1360.2092 70-71 1360.20 658.50 788.70 1350.00 43.30 10.20 0.00 61.70 1583.0093 70-71 1583.00 1360.20 658.50 1150.00 11.00 43.30 10.20 21.40 881.1894 70-71 881.18 1583.00 1360.20 766.00 0.00 11.00 43.30 0.00 631.7095 70-71 631.70 881.18 1583.00 575.00 0.00 0.00 11.00 0.00 530.5096 70-71 530.50 631.70 881.18 496.00 0.00 0.00 0.00 5.50 496.3697 70-71 496.36 530.50 631.70 580.00 38.60 0.00 0.00 56.50 491.4098 70-71 491.40 496.36 530.50 518.00 3.20 38.60 0.00 1.70 474.9099 70-71 474.90 491.40 496.36 418.00 22.00 3.20 38.60 15.10 376.75

100 70-71 376.75 474.90 491.40 361.00 0.00 22.00 3.20 0.00 333.70

Page 86: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

88

101 70-71 333.70 376.75 474.90 326.00 0.00 0.00 22.00 8.10 326.70102 70-71 326.70 333.70 376.75 347.00 0.00 0.00 0.00 0.00 333.64103 70-71 333.64 326.70 333.70 319.00 2.20 0.00 0.00 19.70 285.40104 70-71 285.40 333.64 326.70 298.00 37.10 2.20 0.00 11.50 545.80105 70-71 545.80 285.40 333.64 527.00 7.90 37.10 2.20 74.00 418.60106 71-72 658.40 871.60 1104.20 616.00 0.00 0.00 0.00 0.00 580.40107 71-72 580.40 658.40 871.60 541.00 0.00 0.00 0.00 0.00 533.00108 71-72 533.00 580.40 658.40 575.00 0.00 0.00 0.00 4.80 521.09109 71-72 521.09 533.00 580.40 484.00 0.00 0.00 0.00 16.20 540.10110 71-72 540.10 521.09 533.00 496.00 0.00 0.00 0.00 9.30 445.10111 71-72 445.10 540.10 521.09 422.00 0.00 0.00 0.00 0.30 385.45112 71-72 385.45 445.10 540.10 395.00 17.20 0.00 0.00 7.00 367.20113 71-72 367.20 385.45 445.10 358.00 0.00 17.20 0.00 0.10 328.80114 71-72 328.80 367.20 385.45 304.00 0.00 0.00 17.20 9.00 308.33115 71-72 308.33 328.80 367.20 287.00 12.00 0.00 0.00 23.60 290.90116 71-72 290.90 308.33 328.80 278.00 0.00 12.00 0.00 0.00 279.80117 71-72 279.80 290.90 308.33 263.00 21.50 0.00 12.00 44.80 277.64118 71-72 277.64 279.80 290.90 422.00 32.00 21.50 0.00 77.00 399.10119 71-72 399.10 277.64 279.80 322.00 46.90 32.00 21.50 56.70 283.90120 71-72 283.90 399.10 277.64 248.00 2.80 46.90 32.00 2.10 381.60121 72-73 1665.00 1239.00 1489.00 2520.00 0.00 0.00 0.00 40.80 1877.00122 72-73 1877.00 1665.00 1239.00 1220.00 0.00 0.00 0.00 1.30 1053.30123 72-73 1053.30 1877.00 1665.00 964.00 20.30 0.00 0.00 40.60 829.91124 72-73 829.91 1053.30 1877.00 729.00 0.00 20.30 0.00 0.00 646.80125 72-73 646.80 829.91 1053.30 618.00 0.00 0.00 20.30 0.00 574.40126 72-73 574.40 646.80 829.91 546.00 0.00 0.00 0.00 0.00 485.73127 72-73 485.73 574.40 646.80 457.00 0.00 0.00 0.00 0.00 447.30128 72-73 447.30 485.73 574.40 415.00 0.00 0.00 0.00 0.00 478.30129 72-73 478.30 447.30 485.73 398.00 0.00 0.00 0.00 28.50 361.88130 72-73 361.88 478.30 447.30 340.00 0.00 0.00 0.00 0.00 557.90131 72-73 557.90 361.88 478.30 1520.00 59.70 0.00 0.00 150.60 486.70132 72-73 486.70 557.90 361.88 402.00 0.90 59.70 0.00 11.10 379.00133 72-73 379.00 486.70 557.90 373.00 18.70 0.90 59.70 23.30 303.20134 72-73 303.20 379.00 486.70 284.00 0.00 18.70 0.90 0.00 516.10135 72-73 516.10 303.20 379.00 899.00 98.50 0.00 18.70 174.80 708.90136 73-74 1109.00 1245.00 1291.00 895.00 2.50 0.00 0.00 11.50 781.00137 73-74 781.00 1109.00 1245.00 725.00 0.00 2.50 0.00 0.00 672.20138 73-74 672.20 781.00 1109.00 630.00 0.00 0.00 2.50 0.00 585.27139 73-74 585.27 672.20 781.00 544.00 0.00 0.00 0.00 0.00 532.60140 73-74 532.60 585.27 672.20 514.00 0.00 0.00 0.00 0.00 493.40141 73-74 493.40 532.60 585.27 470.00 0.00 0.00 0.00 0.00 450.00142 73-74 450.00 493.40 532.60 420.00 22.00 0.00 0.00 11.40 400.20143 73-74 400.20 450.00 493.40 384.00 0.00 22.00 0.00 1.10 380.90144 73-74 380.90 400.20 450.00 362.00 0.00 0.00 22.00 0.00 327.75145 73-74 327.75 380.90 400.20 314.00 0.00 0.00 0.00 0.00 311.20146 73-74 311.20 327.75 380.90 287.00 0.00 0.00 0.00 0.00 282.40147 73-74 282.40 311.20 327.75 291.00 0.00 0.00 0.00 26.10 344.91148 73-74 344.91 282.40 311.20 314.00 0.00 0.00 0.00 32.70 386.70149 73-74 386.70 344.91 282.40 323.00 29.40 0.00 0.00 29.90 313.80150 73-74 313.80 386.70 344.91 349.00 48.00 29.40 0.00 19.30 383.70151 74-75 810.40 836.30 921.80 727.00 0.00 0.00 0.00 0.00 663.70152 74-75 663.70 810.40 836.30 631.00 4.30 0.00 0.00 0.60 576.50153 74-75 576.50 663.70 810.40 551.00 0.00 4.30 0.00 0.00 517.73154 74-75 517.73 576.50 663.70 496.00 1.40 0.00 4.30 3.50 483.90155 74-75 483.90 517.73 576.50 495.00 37.00 1.40 0.00 55.10 655.30

Page 87: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

89

156 74-75 655.30 483.90 517.73 601.00 58.70 37.00 1.40 60.50 470.82157 74-75 470.82 655.30 483.90 422.00 0.00 58.70 37.00 0.00 401.60158 74-75 401.60 470.82 655.30 376.00 0.00 0.00 58.70 1.50 412.20159 74-75 412.20 401.60 470.82 357.00 10.80 0.00 0.00 16.20 340.75160 74-75 340.75 412.20 401.60 330.00 5.20 10.80 0.00 0.20 329.40161 74-75 329.40 340.75 412.20 298.00 10.30 5.20 10.80 17.80 268.10162 74-75 268.10 329.40 340.75 270.00 7.90 10.30 5.20 9.10 264.91163 74-75 264.91 268.10 329.40 344.00 61.50 7.90 10.30 69.70 418.00164 74-75 418.00 264.91 268.10 279.00 0.00 61.50 7.90 34.10 488.10165 74-75 488.10 418.00 264.91 629.00 0.00 0.00 61.50 205.20 406.60166 75-76 830.20 1291.80 1041.00 770.00 0.00 36.10 0.10 0.00 715.60167 75-76 715.60 830.20 1291.80 657.00 0.00 0.00 36.10 0.00 737.50168 75-76 737.50 715.60 830.20 671.00 70.90 0.00 0.00 59.60 608.73169 75-76 608.73 737.50 715.60 578.00 0.00 70.90 0.00 0.00 490.60170 75-76 490.60 608.73 737.50 491.00 8.60 0.00 70.90 4.10 462.90171 75-76 462.90 490.60 608.73 429.00 0.00 8.60 0.00 0.00 535.55172 75-76 535.55 462.90 490.60 475.00 10.20 0.00 8.60 50.10 689.00173 75-76 689.00 535.55 462.90 1160.00 40.10 10.20 0.00 86.10 560.70174 75-76 560.70 689.00 535.55 434.00 1.80 40.10 10.20 0.70 392.00175 75-76 392.00 560.70 689.00 366.00 0.00 1.80 40.10 0.00 409.40176 75-76 409.40 392.00 560.70 385.00 1.00 0.00 1.80 10.40 324.30177 75-76 324.30 409.40 392.00 287.00 0.00 1.00 0.00 0.00 337.18178 75-76 337.18 324.30 409.40 287.00 26.70 0.00 1.00 42.10 359.20179 75-76 359.20 337.18 324.30 444.00 37.90 26.70 0.00 44.10 455.70180 75-76 455.70 359.20 337.18 313.00 78.60 37.90 26.70 91.00 348.70181 76-77 921.10 1178.70 1468.00 852.00 0.20 19.00 16.00 0.00 902.70182 76-77 902.70 921.10 1178.70 835.00 0.40 0.20 19.00 2.20 742.50183 76-77 742.50 902.70 921.10 661.00 0.00 0.40 0.20 0.00 606.45184 76-77 606.45 742.50 902.70 561.00 0.90 0.00 0.40 0.30 609.20185 76-77 609.20 606.45 742.50 539.00 34.10 0.90 0.00 19.70 512.30186 76-77 512.30 609.20 606.45 482.00 0.00 34.10 0.90 0.00 466.91187 76-77 466.91 512.30 609.20 426.00 10.50 0.00 34.10 5.60 434.10188 76-77 434.10 466.91 512.30 597.00 7.50 10.50 0.00 22.20 431.60189 76-77 431.60 434.10 466.91 396.00 1.40 7.50 10.50 0.00 426.75190 76-77 426.75 431.60 434.10 406.00 0.70 1.40 7.50 20.80 345.00191 76-77 345.00 426.75 431.60 326.00 0.70 0.70 1.40 0.00 336.20192 76-77 336.20 345.00 426.75 294.00 7.80 0.70 0.70 17.50 323.09193 76-77 323.09 336.20 345.00 312.00 47.00 7.80 0.70 28.10 475.20194 76-77 475.20 323.09 336.20 623.00 104.20 47.00 7.80 84.20 533.30195 76-77 533.30 475.20 323.09 386.00 42.90 104.20 47.00 74.10 325.40196 77-78 718.80 884.20 1277.00 698.00 18.20 0.00 5.10 17.20 703.50197 77-78 703.50 718.80 884.20 608.00 0.00 18.20 0.00 2.10 551.90198 77-78 551.90 703.50 718.80 529.00 11.50 0.00 18.20 7.20 547.82199 77-78 547.82 551.90 703.50 714.00 49.00 11.50 0.00 21.90 668.30200 77-78 668.30 547.82 551.90 1310.00 24.70 49.00 11.50 17.40 1145.60201 77-78 1145.60 668.30 547.82 528.00 15.50 24.70 49.00 24.20 461.09202 77-78 461.09 1145.60 668.30 411.00 0.00 15.50 24.70 0.00 382.50203 77-78 382.50 461.09 1145.60 359.00 2.50 0.00 15.50 1.00 324.20204 77-78 324.20 382.50 461.09 318.00 4.50 2.50 0.00 11.70 495.50205 77-78 495.50 324.20 382.50 380.00 36.10 4.50 2.50 29.70 318.70206 77-78 318.70 495.50 324.20 257.00 8.10 36.10 4.50 0.00 283.00207 77-78 283.00 318.70 495.50 257.00 11.00 8.10 36.10 0.00 267.55208 77-78 267.55 283.00 318.70 248.00 0.20 11.00 8.10 0.00 231.80209 77-78 231.80 267.55 283.00 216.00 4.00 0.20 11.00 10.20 291.00210 77-78 291.00 231.80 267.55 474.00 22.20 4.00 0.20 30.50 260.90

Page 88: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

90

211 78-79 521.10 620.80 649.20 464.00 0.00 12.30 8.70 13.90 439.50212 78-79 439.50 521.10 620.80 401.00 0.00 0.00 12.30 0.00 375.20213 78-79 375.20 439.50 521.10 354.00 0.00 0.00 0.00 0.00 343.55214 78-79 343.55 375.20 439.50 396.00 8.60 0.00 0.00 20.40 371.30215 78-79 371.30 343.55 375.20 328.00 17.40 8.60 0.00 22.20 298.30216 78-79 298.30 371.30 343.55 283.00 0.00 17.40 8.60 0.00 282.91217 78-79 282.91 298.30 371.30 275.00 12.70 0.00 17.40 11.30 322.70218 78-79 322.70 282.91 298.30 500.00 27.20 12.70 0.00 82.50 363.10219 78-79 363.10 322.70 282.91 279.00 37.70 27.20 12.70 6.70 246.88220 78-79 246.88 363.10 322.70 236.00 25.00 37.70 27.20 3.30 290.50221 78-79 290.50 246.88 363.10 236.00 14.30 25.00 37.70 30.20 219.00222 78-79 219.00 290.50 246.88 215.00 0.00 14.30 25.00 0.00 207.45223 78-79 207.45 219.00 290.50 200.00 8.30 0.00 14.30 8.50 188.70224 78-79 188.70 207.45 219.00 186.00 7.30 8.30 0.00 7.90 253.40225 78-79 253.40 188.70 207.45 296.00 48.70 7.30 8.30 84.60 274.60226 79-80 555.00 592.00 716.00 530.00 0.00 0.00 0.00 1.90 499.00227 79-80 499.00 555.00 592.00 460.00 0.00 0.00 0.00 0.00 444.50228 79-80 444.50 499.00 555.00 470.00 0.20 0.00 0.00 10.20 398.00229 79-80 398.00 444.50 499.00 365.00 0.00 0.20 0.00 0.00 352.70230 79-80 352.70 398.00 444.50 345.00 0.10 0.00 0.20 6.10 327.20231 79-80 327.20 352.70 398.00 309.00 0.00 0.10 0.00 1.00 292.55232 79-80 292.55 327.20 352.70 279.00 0.00 0.00 0.10 0.00 295.80233 79-80 295.80 292.55 327.20 291.00 0.00 0.00 0.00 0.00 309.40234 79-80 309.40 295.80 292.55 374.00 0.00 0.00 0.00 2.10 329.89235 79-80 329.89 309.40 295.80 279.00 12.90 0.00 0.00 5.00 240.10236 79-80 240.10 329.89 309.40 224.00 0.00 12.90 0.00 0.00 224.50237 79-80 224.50 240.10 329.89 241.00 40.20 0.00 12.90 11.40 258.27238 79-80 258.27 224.50 240.10 263.00 55.70 40.20 0.00 44.60 268.60239 79-80 268.60 258.27 224.50 227.00 43.90 55.70 40.20 33.30 211.00240 79-80 211.00 268.60 258.27 201.00 16.70 43.90 55.70 15.50 190.90241 80-81 525.00 592.00 728.60 503.00 7.70 0.00 0.00 8.80 450.00242 80-81 450.00 525.00 592.00 423.00 0.00 7.70 0.00 0.20 441.50243 80-81 441.50 450.00 525.00 433.00 23.30 0.00 7.70 2.90 508.45244 80-81 508.45 441.50 450.00 388.00 8.70 23.30 0.00 6.00 475.00245 80-81 475.00 508.45 441.50 422.00 24.40 8.70 23.30 39.40 386.00246 80-81 386.00 475.00 508.45 364.00 0.00 24.40 8.70 0.00 331.45247 80-81 331.45 386.00 475.00 319.00 13.90 0.00 24.40 5.20 297.60248 80-81 297.60 331.45 386.00 275.00 0.00 13.90 0.00 13.00 344.60249 80-81 344.60 297.60 331.45 270.00 2.10 0.00 13.90 5.40 246.00250 80-81 246.00 344.60 297.60 231.00 0.00 2.10 0.00 1.90 220.90251 80-81 220.90 246.00 344.60 222.00 13.40 0.00 2.10 0.60 232.80252 80-81 232.80 220.90 246.00 209.00 20.30 13.40 0.00 14.50 248.27253 80-81 248.27 232.80 220.90 319.00 79.80 20.30 13.40 58.50 333.90254 80-81 333.90 248.27 232.80 213.00 11.70 79.80 20.30 66.70 250.70255 80-81 250.70 333.90 248.27 270.00 44.30 11.70 79.80 58.70 283.30256 81-82 1488.00 2206.00 1599.50 1100.00 0.00 0.00 0.00 0.00 963.10257 81-82 963.10 1488.00 2206.00 874.00 0.00 0.00 0.00 0.00 834.20258 81-82 834.20 963.10 1488.00 842.00 0.00 0.00 0.00 0.20 784.91259 81-82 784.91 834.20 963.10 655.00 0.00 0.00 0.00 0.00 658.70260 81-82 658.70 784.91 834.20 631.00 0.00 0.00 0.00 0.00 616.50261 81-82 616.50 658.70 784.91 615.00 0.00 0.00 0.00 14.20 512.45262 81-82 512.45 616.50 658.70 475.00 1.00 0.00 0.00 0.00 489.00263 81-82 489.00 512.45 616.50 440.00 2.00 1.00 0.00 6.00 481.90264 81-82 481.90 489.00 512.45 621.00 0.00 2.00 1.00 30.70 472.13265 81-82 472.13 481.90 489.00 368.00 0.00 0.00 2.00 0.00 339.70

Page 89: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

91

266 81-82 339.70 472.13 481.90 312.00 0.00 0.00 0.00 0.00 280.50267 81-82 280.50 339.70 472.13 267.00 7.60 0.00 0.00 0.00 272.91268 81-82 272.91 280.50 339.70 317.00 8.80 7.60 0.00 27.80 456.10269 81-82 456.10 272.91 280.50 404.00 56.80 8.80 7.60 69.70 429.10270 81-82 429.10 456.10 272.91 558.00 83.70 56.80 8.80 64.70 539.30271 82-83 1094.50 1110.20 1096.00 1420.00 15.60 22.90 56.60 170.80 866.10272 82-83 866.10 1094.50 1110.20 744.00 0.40 15.60 22.90 0.00 687.60273 82-83 687.60 866.10 1094.50 690.00 0.00 0.40 15.60 0.00 616.91274 82-83 616.91 687.60 866.10 574.00 0.90 0.00 0.40 30.00 598.20275 82-83 598.20 616.91 687.60 565.00 30.10 0.90 0.00 19.30 502.50276 82-83 502.50 598.20 616.91 470.00 0.00 30.10 0.90 0.00 486.82277 82-83 486.82 502.50 598.20 435.00 0.00 0.00 30.10 14.10 406.50278 82-83 406.50 486.82 502.50 395.00 30.30 0.00 0.00 18.90 380.50279 82-83 380.50 406.50 486.82 360.00 17.70 30.30 0.00 0.80 400.13280 82-83 400.13 380.50 406.50 435.00 6.80 17.70 30.30 22.50 482.10281 82-83 482.10 400.13 380.50 460.00 41.90 6.80 17.70 15.80 433.60282 82-83 433.60 482.10 400.13 665.00 58.60 41.90 6.80 66.30 391.00283 82-83 391.00 433.60 482.10 295.00 0.00 58.60 41.90 15.00 274.00284 82-83 274.00 391.00 433.60 255.00 23.40 0.00 58.60 19.50 216.50285 82-83 216.50 274.00 391.00 180.00 0.00 23.40 0.00 0.00 218.00286 83-84 1455.00 3282.00 1077.70 1120.00 0.00 103.60 17.90 0.00 951.10287 83-84 951.10 1455.00 3282.00 860.00 0.00 0.00 103.60 0.00 774.50288 83-84 774.50 951.10 1455.00 714.00 0.00 0.00 0.00 0.00 928.45289 83-84 928.45 774.50 951.10 1370.00 14.00 0.00 0.00 12.90 761.00290 83-84 761.00 928.45 774.50 634.00 0.00 14.00 0.00 0.00 578.00291 83-84 578.00 761.00 928.45 538.00 0.00 0.00 14.00 0.00 504.36292 83-84 504.36 578.00 761.00 468.00 0.00 0.00 0.00 0.00 443.00293 83-84 443.00 504.36 578.00 423.00 10.10 0.00 0.00 1.00 420.00294 83-84 420.00 443.00 504.36 368.00 0.00 10.10 0.00 0.00 340.78295 83-84 340.78 420.00 443.00 323.00 0.00 0.00 10.10 0.00 334.00296 83-84 334.00 340.78 420.00 328.00 0.00 0.00 0.00 0.00 268.00297 83-84 268.00 334.00 340.78 233.00 0.00 0.00 0.00 0.00 250.73298 83-84 250.73 268.00 334.00 228.00 0.00 0.00 0.00 2.00 208.50299 83-84 208.50 250.73 268.00 243.00 25.90 0.00 0.00 26.60 200.80300 83-84 200.80 208.50 250.73 179.00 17.80 25.90 0.00 5.00 475.10301 84-85 695.60 816.30 1017.20 649.00 0.00 0.00 0.00 0.00 614.80302 84-85 614.80 695.60 816.30 558.00 0.00 0.00 0.00 0.00 543.50303 84-85 543.50 614.80 695.60 508.00 0.00 0.00 0.00 0.00 481.18304 84-85 481.18 543.50 614.80 488.00 0.00 0.00 0.00 3.50 490.60305 84-85 490.60 481.18 543.50 450.00 0.30 0.00 0.00 0.50 426.00306 84-85 426.00 490.60 481.18 412.00 0.10 0.30 0.00 0.00 399.36307 84-85 399.36 426.00 490.60 426.00 8.30 0.10 0.30 29.60 394.90308 84-85 394.90 399.36 426.00 351.00 0.00 8.30 0.10 0.00 351.20309 84-85 351.20 394.90 399.36 389.00 46.30 0.00 8.30 12.00 325.50310 84-85 325.50 351.20 394.90 300.00 0.00 46.30 0.00 1.40 266.40311 84-85 266.40 325.50 351.20 256.00 0.00 0.00 46.30 0.70 260.70312 84-85 260.70 266.40 325.50 260.00 0.00 0.00 0.00 0.00 270.91313 84-85 270.91 260.70 266.40 273.00 41.70 0.00 0.00 19.90 311.50314 84-85 311.50 270.91 260.70 323.00 28.30 41.70 0.00 34.90 323.80315 84-85 323.80 311.50 270.91 517.00 37.20 28.30 41.70 78.30 467.70316 85-86 1801.00 2528.30 909.70 1300.00 0.10 115.80 0.00 22.10 1064.70317 85-86 1064.70 1801.00 2528.30 893.00 0.00 0.10 115.80 0.00 816.70318 85-86 816.70 1064.70 1801.00 762.00 0.00 0.00 0.10 0.00 701.64319 85-86 701.64 816.70 1064.70 653.00 0.00 0.00 0.00 0.00 581.40320 85-86 581.40 701.64 816.70 544.00 0.00 0.00 0.00 0.00 527.80

Page 90: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

92

321 85-86 527.80 581.40 701.64 515.00 0.00 0.00 0.00 0.00 468.64322 85-86 468.64 527.80 581.40 449.00 0.00 0.00 0.00 2.20 416.00323 85-86 416.00 468.64 527.80 395.00 0.00 0.00 0.00 0.00 380.20324 85-86 380.20 416.00 468.64 343.00 0.00 0.00 0.00 0.00 330.13325 85-86 330.13 380.20 416.00 326.00 0.00 0.00 0.00 6.40 336.10326 85-86 336.10 330.13 380.20 330.00 0.00 0.00 0.00 0.10 303.10327 85-86 303.10 336.10 330.13 271.00 0.00 0.00 0.00 0.00 249.00328 85-86 249.00 303.10 336.10 244.00 6.00 0.00 0.00 6.00 317.60329 85-86 317.60 249.00 303.10 510.00 93.80 6.00 0.00 50.90 629.60330 85-86 629.60 317.60 249.00 644.00 137.60 93.80 6.00 73.00 460.10331 86-87 768.50 1091.60 987.60 707.00 0.00 29.50 7.40 0.00 649.70332 86-87 649.70 768.50 1091.60 606.00 0.00 0.00 29.50 0.00 584.80333 86-87 584.80 649.70 768.50 544.00 0.00 0.00 0.00 2.70 538.00334 86-87 538.00 584.80 649.70 529.00 5.40 0.00 0.00 17.30 571.50335 86-87 571.50 538.00 584.80 467.00 24.70 5.40 0.00 35.00 453.90336 86-87 453.90 571.50 538.00 444.00 0.00 24.70 5.40 0.00 405.64337 86-87 405.64 453.90 571.50 384.00 0.00 0.00 24.70 6.00 417.80338 86-87 417.80 405.64 453.90 444.00 0.20 0.00 0.00 4.00 367.00339 86-87 367.00 417.80 405.64 334.00 0.00 0.20 0.00 0.00 314.63340 86-87 314.63 367.00 417.80 296.00 0.00 0.00 0.20 16.80 367.80341 86-87 367.80 314.63 367.00 311.00 24.00 0.00 0.00 29.50 277.80342 86-87 277.80 367.80 314.63 268.00 0.00 24.00 0.00 0.30 259.55343 86-87 259.55 277.80 367.80 247.00 0.00 0.00 24.00 5.10 260.70344 86-87 260.70 259.55 277.80 251.00 56.20 0.00 0.00 31.00 309.50345 86-87 309.50 260.70 259.55 264.00 22.00 56.20 0.00 19.40 244.70346 87-88 1001.40 1497.20 1154.40 832.00 0.00 40.20 33.90 0.00 737.80347 87-88 737.80 1001.40 1497.20 680.00 0.00 0.00 40.20 0.00 665.40348 87-88 665.40 737.80 1001.40 622.00 0.00 0.00 0.00 0.00 557.45349 87-88 557.45 665.40 737.80 518.00 0.00 0.00 0.00 0.00 477.80350 87-88 477.80 557.45 665.40 461.00 0.00 0.00 0.00 0.00 456.00351 87-88 456.00 477.80 557.45 488.00 6.00 0.00 0.00 14.40 401.91352 87-88 401.91 456.00 477.80 372.00 0.00 6.00 0.00 0.00 352.40353 87-88 352.40 401.91 456.00 333.00 0.00 0.00 6.00 0.00 354.20354 87-88 354.20 352.40 401.91 491.00 28.20 0.00 0.00 69.10 431.89355 87-88 431.89 354.20 352.40 380.00 4.50 28.20 0.00 0.30 319.30356 87-88 319.30 431.89 354.20 325.00 0.00 4.50 28.20 1.40 288.70357 87-88 288.70 319.30 431.89 257.00 0.00 0.00 4.50 0.00 243.82358 87-88 243.82 288.70 319.30 232.00 0.00 0.00 0.00 0.00 224.90359 87-88 224.90 243.82 288.70 218.00 2.90 0.00 0.00 0.00 290.00360 87-88 290.00 224.90 243.82 348.00 26.80 2.90 0.00 67.20 380.30361 88-89 608.80 615.10 729.10 629.00 0.00 0.60 0.00 0.00 568.40362 88-89 568.40 608.80 615.10 488.00 0.00 0.00 0.60 0.00 457.40363 88-89 457.40 568.40 608.80 434.00 0.00 0.00 0.00 0.00 411.82364 88-89 411.82 457.40 568.40 396.00 0.00 0.00 0.00 0.00 399.50365 88-89 399.50 411.82 457.40 382.00 47.10 0.00 0.00 27.40 355.60366 88-89 355.60 399.50 411.82 358.00 0.00 47.10 0.00 0.00 351.00367 88-89 351.00 355.60 399.50 350.00 4.40 0.00 47.10 0.40 337.00368 88-89 337.00 351.00 355.60 335.00 0.00 4.40 0.00 0.00 325.40369 88-89 325.40 337.00 351.00 310.00 5.00 0.00 4.40 0.00 297.75370 88-89 297.75 325.40 337.00 278.00 0.00 5.00 0.00 14.60 256.00371 88-89 256.00 297.75 325.40 241.00 0.00 0.00 5.00 0.00 277.60372 88-89 277.60 256.00 297.75 320.00 37.50 0.00 0.00 39.90 417.82373 88-89 417.82 277.60 256.00 292.00 60.20 37.50 0.00 98.10 404.70374 88-89 404.70 417.82 277.60 579.00 29.40 60.20 37.50 38.40 301.50375 88-89 301.50 404.70 417.82 268.00 20.30 29.40 60.20 2.80 269.30

Page 91: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

93

376 89-90 528.40 688.30 961.90 526.00 0.00 0.00 0.00 0.00 501.80377 89-90 501.80 528.40 688.30 469.00 0.00 0.00 0.00 0.00 453.20378 89-90 453.20 501.80 528.40 451.00 0.00 0.00 0.00 0.00 421.82379 89-90 421.82 453.20 501.80 389.00 0.00 0.00 0.00 11.80 367.50380 89-90 367.50 421.82 453.20 350.00 5.50 0.00 0.00 27.40 346.10381 89-90 346.10 367.50 421.82 326.00 9.70 5.50 0.00 0.00 315.45382 89-90 315.45 346.10 367.50 310.00 0.70 9.70 5.50 0.40 302.40383 89-90 302.40 315.45 346.10 290.00 0.00 0.70 9.70 0.00 298.00384 89-90 298.00 302.40 315.45 298.00 5.60 0.00 0.70 0.00 362.75385 89-90 362.75 298.00 302.40 489.00 38.00 5.60 0.00 14.60 398.80386 89-90 398.80 362.75 298.00 444.00 37.60 38.00 5.60 0.00 636.60387 89-90 636.60 398.80 362.75 485.00 35.30 37.60 38.00 39.90 442.91388 89-90 442.91 636.60 398.80 457.00 29.00 35.30 37.60 98.10 532.70389 89-90 532.70 442.91 636.60 905.00 92.00 29.00 35.30 38.40 455.90390 89-90 455.90 532.70 442.91 314.00 0.20 92.00 29.00 2.80 296.00391 90-91 602.10 780.00 921.70 586.00 14.50 0.00 5.30 0.00 595.80392 90-91 595.80 602.10 780.00 537.00 0.40 14.50 0.00 0.00 482.00393 90-91 482.00 595.80 602.10 457.00 0.00 0.40 14.50 0.00 441.82394 90-91 441.82 482.00 595.80 413.00 4.70 0.00 0.40 11.80 431.70395 90-91 431.70 441.82 482.00 409.00 0.00 4.70 0.00 0.00 378.10396 90-91 378.10 431.70 441.82 396.00 0.00 0.00 4.70 13.90 347.91397 90-91 347.91 378.10 431.70 324.00 1.50 0.00 0.00 48.70 398.10398 90-91 398.10 347.91 378.10 340.00 0.00 1.50 0.00 0.00 304.80399 90-91 304.80 398.10 347.91 280.00 0.00 0.00 1.50 0.00 274.00400 90-91 274.00 304.80 398.10 276.00 0.50 0.00 0.00 0.00 262.70401 90-91 262.70 274.00 304.80 246.00 0.00 0.50 0.00 47.80 240.70402 90-91 240.70 262.70 274.00 246.00 1.80 0.00 0.50 38.70 216.73403 90-91 216.73 240.70 262.70 272.00 65.40 1.80 0.00 52.00 359.40404 90-91 359.40 216.73 240.70 253.00 13.00 65.40 1.80 94.00 199.70405 90-91 199.70 359.40 216.73 170.00 38.70 13.00 65.40 6.80 307.40406 91-92 1005.20 1246.00 1884.00 926.00 0.00 0.00 0.40 22.60 883.40407 91-92 883.40 1005.20 1246.00 827.00 0.00 0.00 0.00 1.60 753.50408 91-92 753.50 883.40 1005.20 709.00 0.00 0.00 0.00 0.00 792.73409 91-92 792.73 753.50 883.40 960.00 0.00 0.00 0.00 3.20 760.20410 91-92 760.20 792.73 753.50 720.00 8.20 0.00 0.00 26.00 654.80411 91-92 654.80 760.20 792.73 607.00 0.90 8.20 0.00 16.00 609.64412 91-92 609.64 654.80 760.20 592.00 0.00 0.90 8.20 7.80 518.00413 91-92 518.00 609.64 654.80 484.00 0.60 0.00 0.90 1.80 499.50414 91-92 499.50 518.00 609.64 531.00 0.00 0.60 0.00 9.40 791.56415 91-92 791.56 499.50 518.00 1120.00 60.00 0.00 0.60 76.40 852.80416 91-92 852.80 791.56 499.50 550.00 0.00 60.00 0.00 0.00 407.00417 91-92 407.00 852.80 791.56 355.00 0.00 0.00 60.00 0.00 346.73418 91-92 346.73 407.00 852.80 355.00 0.00 0.00 0.00 0.70 319.70419 91-92 319.70 346.73 407.00 306.00 35.50 0.00 0.00 25.00 276.30420 91-92 276.30 319.70 346.73 244.00 12.00 35.50 0.00 17.10 255.40421 92-93 1139.70 835.00 745.10 840.00 0.00 0.00 0.00 1.20 731.00422 92-93 731.00 1139.70 835.00 678.00 0.00 0.00 0.00 1.40 668.50423 92-93 668.50 731.00 1139.70 642.00 0.00 0.00 0.00 0.00 682.09424 92-93 682.09 668.50 731.00 720.00 57.00 0.00 0.00 52.40 493.00425 92-93 493.00 682.09 668.50 371.00 0.00 57.00 0.00 0.00 331.40426 92-93 331.40 493.00 682.09 314.00 3.00 0.00 57.00 3.70 308.45427 92-93 308.45 331.40 493.00 306.00 0.00 3.00 0.00 0.10 303.40428 92-93 303.40 308.45 331.40 302.00 0.00 0.00 3.00 0.00 301.70429 92-93 301.70 303.40 308.45 301.00 56.60 0.00 0.00 50.10 302.38430 92-93 302.38 301.70 303.40 306.00 0.00 56.60 0.00 2.30 346.90

Page 92: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

94

431 92-93 346.90 302.38 301.70 371.00 14.80 0.00 56.60 5.40 299.20432 92-93 299.20 346.90 302.38 226.00 4.20 14.80 0.00 5.60 229.55433 92-93 229.55 299.20 346.90 208.00 13.20 4.20 14.80 17.20 195.30434 92-93 195.30 229.55 299.20 191.00 0.00 13.20 4.20 7.30 436.10435 92-93 436.10 195.30 229.55 337.00 69.10 0.00 13.20 60.20 304.40436 93-94 808.90 840.90 1006.00 766.00 0.00 0.00 0.00 0.10 674.80437 93-94 674.80 808.90 840.90 588.00 0.00 0.00 0.00 0.00 551.30438 93-94 551.30 674.80 808.90 528.00 0.10 0.00 0.00 7.90 515.36439 93-94 515.36 551.30 674.80 509.00 0.00 0.10 0.00 0.00 460.70440 93-94 460.70 515.36 551.30 444.00 0.00 0.00 0.10 0.10 424.00441 93-94 424.00 460.70 515.36 403.00 0.00 0.00 0.00 0.00 359.18442 93-94 359.18 424.00 460.70 323.00 0.00 0.00 0.00 0.00 285.70443 93-94 285.70 359.18 424.00 285.00 5.10 0.00 0.00 0.50 303.40444 93-94 303.40 285.70 359.18 273.00 0.00 5.10 0.00 0.00 238.38445 93-94 238.38 303.40 285.70 226.00 0.00 0.00 5.10 0.00 242.90446 93-94 242.90 238.38 303.40 223.00 17.10 0.00 0.00 10.40 217.70447 93-94 217.70 242.90 238.38 240.00 12.30 17.10 0.00 24.60 319.27448 93-94 319.27 217.70 242.90 462.00 27.90 12.30 17.10 89.50 322.30449 93-94 322.30 319.27 217.70 206.00 4.70 27.90 12.30 6.90 270.20450 93-94 270.20 322.30 319.27 314.00 45.90 4.70 27.90 77.80 379.82451 94-95 857.70 896.70 915.70 865.00 20.00 0.00 0.00 7.90 1124.00452 94-95 1124.00 857.70 896.70 1300.00 64.00 20.00 0.00 32.80 867.00453 94-95 867.00 1124.00 857.70 734.00 0.00 64.00 20.00 0.00 916.27454 94-95 916.27 867.00 1124.00 697.00 0.00 0.00 64.00 0.50 680.00455 94-95 680.00 916.27 867.00 689.00 0.00 0.00 0.00 5.60 590.20456 94-95 590.20 680.00 916.27 504.00 0.00 0.00 0.00 0.00 495.91457 94-95 495.91 590.20 680.00 506.00 2.30 0.00 0.00 14.20 516.30458 94-95 516.30 495.91 590.20 531.00 1.50 2.30 0.00 9.00 499.60459 94-95 499.60 516.30 495.91 448.00 0.00 1.50 2.30 0.00 410.50460 94-95 410.50 499.60 516.30 389.00 0.00 0.00 1.50 0.00 377.30461 94-95 377.30 410.50 499.60 420.00 0.00 0.00 0.00 0.00 370.60462 94-95 370.60 377.30 410.50 301.00 0.00 0.00 0.00 0.00 343.18463 94-95 343.18 370.60 377.30 434.00 51.00 0.00 0.00 40.00 351.40464 94-95 351.40 343.18 370.60 381.00 13.60 51.00 0.00 39.30 332.80465 94-95 332.80 351.40 343.18 289.00 1.20 13.60 51.00 6.20 304.40466 95-96 780.40 986.40 1223.00 692.00 0.00 125.20 0.00 0.50 718.20467 95-96 718.20 780.40 986.40 720.00 0.00 0.00 125.20 0.10 642.00468 95-96 642.00 718.20 780.40 604.00 0.00 0.00 0.00 0.00 561.36469 95-96 561.36 642.00 718.20 542.00 0.00 0.00 0.00 0.00 541.50470 95-96 541.50 561.36 642.00 540.00 0.00 0.00 0.00 0.00 540.00471 95-96 540.00 541.50 561.36 540.00 0.00 0.00 0.00 8.20 518.09472 95-96 518.09 540.00 541.50 468.00 0.00 0.00 0.00 0.00 402.80473 95-96 402.80 518.09 540.00 377.00 3.00 0.00 0.00 0.20 346.80474 95-96 346.80 402.80 518.09 325.00 0.00 3.00 0.00 0.20 319.78475 95-96 319.78 346.80 402.80 315.00 18.90 0.00 3.00 17.10 300.80476 95-96 300.80 319.78 346.80 288.00 0.00 18.90 0.00 0.80 262.90477 95-96 262.90 300.80 319.78 236.00 0.00 0.00 18.90 0.00 252.00478 95-96 252.00 262.90 300.80 272.00 125.80 0.00 0.00 148.60 382.10479 95-96 382.10 252.00 262.90 380.00 9.60 125.80 0.00 15.70 363.60480 95-96 363.60 382.10 252.00 330.00 9.00 9.60 125.80 22.00 570.30

Page 93: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

95

2. Dữ liệu kiểm tra

Gồm 90 mẫu kiểm tra:

STT Năm Q(t) Q(t-10) Q(t-20) Qng(t) X(t) X(t-10) X(t-20) Xng(t) Q(t+10)

1 96-97 966.20 980.70 1124.00 968.00 0.00 0.00 31.50 0.00 949.402 96-97 949.40 966.20 980.70 850.00 16.10 0.00 0.00 13.00 748.603 96-97 748.60 949.40 966.20 690.00 0.00 16.10 0.00 0.00 609.734 96-97 609.73 748.60 949.40 560.00 0.00 0.00 16.10 0.00 563.505 96-97 563.50 609.73 748.60 510.00 0.00 0.00 0.00 0.00 475.506 96-97 475.50 563.50 609.73 440.00 0.00 0.00 0.00 7.90 465.007 96-97 465.00 475.50 563.50 500.00 17.10 0.00 0.00 8.30 501.008 96-97 501.00 465.00 475.50 490.00 0.00 17.10 0.00 0.00 427.009 96-97 427.00 501.00 465.00 400.00 0.00 0.00 17.10 0.00 399.38

10 96-97 399.38 427.00 501.00 395.00 5.40 0.00 0.00 18.30 398.5011 96-97 398.50 399.38 427.00 420.00 9.00 5.40 0.00 4.20 603.6012 96-97 603.60 398.50 399.38 1080.00 67.50 9.00 5.40 83.10 795.7313 96-97 795.73 603.60 398.50 901.00 29.10 67.50 9.00 104.30 981.1014 96-97 981.10 795.73 603.60 841.00 24.70 29.10 67.50 19.20 1000.5015 96-97 1000.50 981.10 795.73 879.00 49.20 24.70 29.10 30.80 951.9016 97-98 881.50 1192.50 1305.00 850.00 0.00 0.00 0.00 0.00 833.0017 97-98 833.00 881.50 1192.50 830.00 0.00 0.00 0.00 0.00 824.5018 97-98 824.50 833.00 881.50 800.00 2.10 0.00 0.00 30.00 677.7319 97-98 677.73 824.50 833.00 580.00 6.40 2.10 0.00 0.00 577.5720 97-98 577.57 677.73 824.50 560.78 0.00 6.40 2.10 0.00 546.6621 97-98 546.66 577.57 677.73 538.34 0.00 0.00 6.40 0.00 490.8622 97-98 490.86 546.66 577.57 482.07 0.00 0.00 0.00 0.00 477.8723 97-98 477.87 490.86 546.66 479.48 0.00 0.00 0.00 2.90 477.6824 97-98 477.68 477.87 490.86 457.27 0.00 0.00 0.00 0.00 571.3725 97-98 571.37 477.68 477.87 550.00 0.00 0.00 0.00 15.50 597.1526 97-98 597.15 571.37 477.68 596.57 0.00 0.00 0.00 0.00 500.1227 97-98 500.12 597.15 571.37 475.64 0.00 0.00 0.00 0.00 559.5728 97-98 559.57 500.12 597.15 758.06 24.20 0.00 0.00 81.10 912.2329 97-98 912.23 559.57 500.12 815.29 39.80 24.20 0.00 108.90 625.3030 97-98 625.30 912.23 559.57 771.43 13.10 39.80 24.20 7.40 754.3131 98-99 574.20 766.18 1138.33 569.84 1.20 0.00 39.90 0.00 534.8032 98-99 534.80 574.20 766.18 535.09 4.30 1.20 0.00 16.30 491.0733 98-99 491.07 534.80 574.20 465.31 0.00 4.30 1.20 0.00 446.4334 98-99 446.43 491.07 534.80 436.19 3.50 0.00 4.30 8.70 420.9035 98-99 420.90 446.43 491.07 425.00 0.00 3.50 0.00 1.00 426.8036 98-99 426.80 420.90 446.43 421.00 27.20 0.00 3.50 33.80 399.1837 98-99 399.18 426.80 420.90 367.00 0.00 27.20 0.00 0.20 350.8038 98-99 350.80 399.18 426.80 340.00 0.00 0.00 27.20 0.00 335.7039 98-99 335.70 350.80 399.18 328.00 0.00 0.00 0.00 0.20 327.1340 98-99 327.13 335.70 350.80 330.00 0.00 0.00 0.00 0.20 328.8041 98-99 328.80 327.13 335.70 327.00 20.50 0.00 0.00 18.50 341.5042 98-99 341.50 328.80 327.13 360.00 24.40 20.50 0.00 7.30 359.5543 98-99 359.55 341.50 328.80 340.00 6.20 24.40 20.50 19.60 361.0044 98-99 361.00 359.55 341.50 410.00 19.60 6.20 24.40 48.10 504.3045 98-99 504.30 361.00 359.55 480.00 56.80 19.60 6.20 89.70 522.0046 99-00 1148.00 2623.00 4154.00 1040.00 0.00 2.40 27.80 0.00 1061.0047 99-00 1061.00 1148.00 2623.00 1020.00 31.10 0.00 2.40 35.10 869.0048 99-00 869.00 1061.00 1148.00 820.00 0.20 31.10 0.00 0.30 722.7349 99-00 722.73 869.00 1061.00 610.00 0.00 0.20 31.10 0.00 661.10

Page 94: ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước

96

50 99-00 661.10 722.73 869.00 722.00 9.00 0.00 0.20 1.00 702.0051 99-00 702.00 661.10 722.73 579.00 0.00 9.00 0.00 1.90 509.5552 99-00 509.55 702.00 661.10 575.00 2.10 0.00 9.00 6.10 604.8053 99-00 604.80 509.55 702.00 680.00 0.00 2.10 0.00 1.80 649.3054 99-00 649.30 604.80 509.55 595.00 17.20 0.00 2.10 2.70 736.6755 99-00 736.67 649.30 604.80 830.00 67.40 17.20 0.00 41.80 784.7056 99-00 784.70 736.67 649.30 682.00 23.10 67.40 17.20 22.00 598.1057 99-00 598.10 784.70 736.67 600.00 0.00 23.10 67.40 0.00 455.7358 99-00 455.73 598.10 784.70 440.00 14.60 0.00 23.10 12.80 467.2059 99-00 467.20 455.73 598.10 440.00 5.90 14.60 0.00 24.40 507.2060 99-00 507.20 467.20 455.73 450.00 28.20 5.90 14.60 53.40 476.3061 00-01 936.50 885.90 1012.50 1020.00 0.00 0.00 0.00 1.70 1090.0062 00-01 1090.00 936.50 885.90 1000.00 13.50 0.00 0.00 8.40 958.0063 00-01 958.00 1090.00 936.50 920.00 0.50 13.50 0.00 4.30 870.5564 00-01 870.55 958.00 1090.00 830.00 0.00 0.50 13.50 0.00 763.5065 00-01 763.50 870.55 958.00 697.00 0.00 0.00 0.50 5.70 626.1066 00-01 626.10 763.50 870.55 582.00 20.40 0.00 0.00 10.00 591.9167 00-01 591.91 626.10 763.50 605.00 0.00 20.40 0.00 0.10 569.9068 00-01 569.90 591.91 626.10 540.00 4.60 0.00 20.40 5.80 479.6069 00-01 479.60 569.90 591.91 438.00 5.00 4.60 0.00 0.00 404.3870 00-01 404.38 479.60 569.90 390.00 3.30 5.00 4.60 11.60 392.4071 00-01 392.40 404.38 479.60 419.00 28.70 3.30 5.00 21.10 516.0072 00-01 516.00 392.40 404.38 465.00 20.70 28.70 3.30 42.00 363.0073 00-01 363.00 516.00 392.40 332.00 42.10 20.70 28.70 86.60 383.6074 00-01 383.60 363.00 516.00 254.00 28.90 42.10 20.70 24.90 255.8075 00-01 255.80 383.60 363.00 254.00 17.40 28.90 42.10 1.60 374.6076 01-02 1429.00 2875.00 3015.00 1030.00 0.00 0.00 0.00 0.30 980.0077 01-02 980.00 1429.00 2875.00 940.00 0.00 0.00 0.00 0.10 878.7078 01-02 878.70 980.00 1429.00 822.00 0.00 0.00 0.00 0.00 715.3679 01-02 715.36 878.70 980.00 676.00 0.00 0.00 0.00 0.00 651.2080 01-02 651.20 715.36 878.70 634.00 0.00 0.00 0.00 0.00 614.7081 01-02 614.70 651.20 715.36 593.00 19.00 0.00 0.00 7.50 552.4582 01-02 552.45 614.70 651.20 520.00 27.10 19.00 0.00 51.40 481.8083 01-02 481.80 552.45 614.70 440.00 5.10 27.10 19.00 2.90 379.4084 01-02 379.40 481.80 552.45 360.00 0.00 5.10 27.10 15.90 334.1385 01-02 334.13 379.40 481.80 317.00 18.10 0.00 5.10 18.20 314.7086 01-02 314.70 334.13 379.40 285.00 2.00 18.10 0.00 11.20 277.7087 01-02 277.70 314.70 334.13 310.00 0.00 2.00 18.10 6.50 337.8288 01-02 337.82 277.70 314.70 330.00 39.20 0.00 2.00 29.90 371.9089 01-02 371.90 337.82 277.70 255.00 23.80 39.20 0.00 30.10 288.7090 01-02 288.70 371.90 337.82 245.00 15.20 23.80 39.20 27.10 326.00