chƯƠng 1
TRANSCRIPT
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 1/37
Kỹ Thuật Watermarking Ảnh Số Trang
CHƯƠNG 1:TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1 CÁC KHÁI NIỆM CƠ BẢN
1.1.1 Phần tử ảnh
Ảnh trong tự nhiên là những tín hiệu liên tục về không gian và giá trị độ
sáng. Để có thể lưu trữ và biểu diễn ảnh này bằng máy tính, ta phải biến đổi các tín
hiệu liên tục đó thành một số hữu hạn các tín hiệu rời rạc thông qua quá trình
lượng tử hóa và lấy mẫu thành phần giá trị độ sáng.
Một phần tử ảnh (Picture Element) là một giá trị biểu diễn cho mức xám
hay cường độ ảnh tại một vị trí sau khi đã biến đổi ảnh thành một số hữu hạn các
tín hiệu rời rạc.
1.1.2 Mức xám
Là kết quả của sự biến đổi tương ứng giá trị độ sáng của một điểm ảnh với
một giá trị số nguyên dương. Tùy thuộc vào số giá trị biểu diễn mức xám mà mỗiđiểm ảnh sẽ được biểu diễn trên 1, 4, 8, 24 hay 32 bit. Số lượng bit biểu diễn mức
xám càng lớn thì chất lượng ảnh càng cao nhưng sẽ tốn dung lượng bộ nhớ nhiều
hơn để lưu trữ và cần một hệ thống mạnh hơn để xử lý.
1.1.3 Ảnh
Là một tập hợp hữu hạn các điểm ảnh kề nhau, ảnh thường được biểu diễn
bằng một ma trận hai chiều, mỗi phần tử của ma trận tương ứng với một điểm ảnh.
Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm ảnh
được biểu diễn bằng 1 bit (giá trị 0 hoặc 1).
0 1 1 0
1 1 1 0
0 0 1 1
0 1 1 1
Chương 1: Tổng Quan Về Xử Lý Ảnh
1
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 2/37
Kỹ Thuật Watermarking Ảnh Số Trang
Ảnh xám: giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit (giátrị từ 0 đến 255).
0 5 12 0
15 94 21 0
0 0 156
9
0 11 245
12
Hình 1.1: Ảnh xám
Ảnh màu: được tạo nên từ 3 ảnh xám đối với màu nền đỏ (red), lục
(green), lam (blue). Tất cả các màu trong tự nhiên đều có thể được tổng hợp từ 3
thành phần màu trên theo các tỷ lệ khác nhau.
- Ma trận biểu diễn mức xám của thành phần Red.
0 7 11 0
115
94 21 0
Chương 1: Tổng Quan Về Xử Lý Ảnh
2
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 3/37
Kỹ Thuật Watermarking Ảnh Số Trang
0 0 156
9
0 11 24
5
12
- Ma trận biểu diễn mức xám của thành phần Green.
- Ma trận biểu diễn
mức xám của thành phần Blue.
0 17 21 0
135
93 50 0
0 0 15 67
0 11 25 19
Hình 1.2: Ảnh màu
Chương 1: Tổng Quan Về Xử Lý Ảnh
0 1 121
0
14 9 210 0
0 0 155
16
0 11 22 2
3
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 4/37
Kỹ Thuật Watermarking Ảnh Số Trang
1.2 BIỂU DIỄN ẢNH TRONG MIỀN KHÔNG GIAN
1.2.1 Biểu diễn ảnh số
Một ảnh có thể được biểu diễn bởi hàm hai chiều f (x, y) trong đó x,y là tọađộ không gian phẳng hai chiều, và biên độ f là bất cứ cặp tọa độ (x,y) được gọi là
cường độ điểm ảnh, giá trị của f (x, y) là liên tục trong khoảng ( - ∞∞, ).
Các tín hiệu liên tục theo thời gian qua quá trình số hóa ta thu được tín hiệu
rời rạc ( tín hiệu số ).
x(t)
Hình 1.3: Tín hiệu số rời rạc
Ảnh số chính là ảnh xử lý bằng máy tính thu được từ ảnh liên tục bởi quá
trình số hóa ( lấy mẫu và lượng tử hóa ), thường được ký hiệu là I[m, n].
Giá trị I[x, y] biểu diễn cường độ sáng được mã hóa của mỗi điểm ảnh
(x,y), giá trị đó còn gọi là mức xám (grey level). Vậy I[x, y] có giá trị rời rạc, giá
trị của I[x, y] là nguyên:
I[x, y] ∈{0,1,…., L-1}
Với L là mức xám tối đa dùng để biểu diễn.
Để giảm độ phức tạp tính toán, các giá trị của (m, n) thường chọn là hữu
hạn và thường chọn là 512, còn L chọn là 256. Ảnh có nhiều mức xám gọi là ảnh
đa cấp xám. Ảnh chỉ có 2 mức xám là 0 và 1 gọi là ảnh nhị phân.
Chương 1: Tổng Quan Về Xử Lý Ảnh
4
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 5/37
Kỹ Thuật Watermarking Ảnh Số Trang
Với cách biểu diễn trên, ảnh số chính là một phần của tín hiệu số trong
không gian 2 chiều. Và cách biểu diễn ảnh số thông dụng nhất là dùng bảng 2
chiều mà thuật ngữ thường gọi là ma trận ảnh hay bản đồ ảnh.
1.2.1.1 Việc chuyển đổi tọa độ
Kết quả của việc lấy mẫu và lượng tử hóa là ma trận số. Chúng ta sử dụng
hai phương pháp cơ bản để biễu diễn ảnh số. Giả sử ảnh f (x,y) được lấy mẫu có M
hàng và N cột. Giá trị của tọa độ (x, y) là được lượng tử hóa rời rạc. Chúng ta
dùng giá trị nguyên cho rời rạc tọa độ. Ảnh gốc được xác định (x, y) = (0, 0), giá
trị kế tiếp của hàng thứ nhất của ảnh là (x, y) = (0, 1). Nó được dùng cho lấy mẫu
thứ hai trong hàng đầu tiên, không có nghĩa là giá trị thật của tọa độ vật lý khi ảnh
được lấy mẫu. Chú ý phạm vi x từ 0 – M-1, y từ 0 – N-1.
Hình 1.4: Hệ tọa độ để biểu diễn ảnh số.
1.2.1.2 Ma Trận ảnh
Việc chuyển đổi tọa độ được sử dụng trong hộp công cụ dạng ký hiệu chuỗi
khác bằng hai cách:
Cách thứ nhất: Các điểm ảnh rời rạc được sắp xếp theo cột và hàng. Tọa
độ của các điểm ảnh (x, y) là rời rạc. Gốc tọa độ nằm tại góc trên bên trái của ảnh
(x, y) = (1,1).
Như vậy ta có thể biểu diễn ảnh số như ma trận kích thước M x N.
Chương 1: Tổng Quan Về Xử Lý Ảnh
5
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 6/37
Kỹ Thuật Watermarking Ảnh Số Trang
f (x, y) =
−−
−
−
−− )1,1(
)1,1(
)1,0(
)1,1(
)1,1(
)1,0(
)0,1(
)0,1(
)0,0(
...
...
...
...
...
......
N M
N
N
M M f
f
f
f
f
f
f
f
f
Mỗi phần tử của ma trận được gọi là một điểm ảnh (image element hay
pixel).
Cách thứ hai: Chúng ta có thể sử dụng phương pháp mô tả ảnh số như một
số ma trận thông thường.
A =
−−−−
−
−
1,11,10,1
1,11.10.1
1.01.00.0
...
............
...
...
N M M M
N
N
aaa
aaa
aaa
Với cách biểu diễn trên ),( jia = f (x = i, y = j) = f (i,j) do đó hai ma trận
trên hoàn toàn giống nhau.
Đối với ảnh số giá trị M và N phải là số nguyên dương. Số lượng mức xám
có thể gán cho một điểm ảnh L thường được lựa chọn sao cho L = 2k , k là số
nguyên dương.
Như vậy số lượng bit được sử dụng để biểu diễn một ảnh số sẽ được xác
định theo công thức: b = M x N x k.
1.2.2 Chuyển ảnh màu thành ảnh xám
Đơn vị tế bào của ảnh số là pixel. Tùy theo mỗi định dạng là ảnh màu hayảnh xám mà từng pixel có thông số khác nhau. Đối với ảnh màu từng pixel sẽ
mang thông tin của ba màu cơ bản tạo ra bản màu khả kiến là đỏ (R), lục (G) và
lam (B) [Thomas 1892]. Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B
được bố trí sát nhau và có cường độ sáng khác nhau. Thông thường, mỗi màu cơ
bản được biểu diễn bằng 8 bit tương ứng 256 mức độ màu khác nhau. Như vậy
mỗi pixel chúng ta sẽ có 28x3=224 màu (khoảng 16.78 triệu màu). Đối với ảnh xám,
thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng với 8 bit)
Chương 1: Tổng Quan Về Xử Lý Ảnh
6
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 7/37
Kỹ Thuật Watermarking Ảnh Số Trang
như vậy ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của một ảnh màu tương
ứng thông qua 8 mặt phẳng bit theo độ xám.
Trong hầu hết quá trình xử lý ảnh, chúng ta chủ yếu chỉ quan tâm đến cấu
trúc của ảnh và bỏ qua ảnh hưởng của yếu tố màu sắc. Do đó bước chuyển từ ảnh
màu thành ảnh xám là một công đoạn phổ biến trong các quá trình xử lý ảnh vì nó
làm tăng tốc độ xử lý là giảm mức độ phức tạp của các thuật toán trên ảnh.
Chúng ta có công thức chuyển các thông số giá trị màu của một pixel thành
mức xám tương ứng như sau:
G= α .CR +β .CG+δ .CB (1.1)
Trong đó các giá trị C R , C G và C B lần lượt là các mức độ màu đỏ, lục và lam
của pixel màu. Các hệ số α, β, và δ là các giá trị thay đổi tùy thuộc hệ màu.
Lược đồ của ảnh xám
Lược đồ xám của một ảnh số có các mức xám trong khoảng [0, L−1] là
một hàm rời rạc p(r k ) = nk /n . Trong đó nk là số pixel có mức xám thứ r k , n là
tổng số pixel trong ảnh và k = 0,1,2.... L−1. Do đó P (r k ) cho một xấp xỉ xác suất
xảy ra mức xám r k . Vẽ hàm này với tất cả các giá trị của k sẽ biểu diễn khái quát
sự xuất hiện các mức xám của một ảnh. Chúng ta cũng có thể thể hiện lược đồ
mức xám của ảnh thông qua tần suất xuất hiện mỗi mức xám qua hệ tọa độ vuông
góc Oxy. Trong đó, trục hoành biểu diễn số mức xám từ 0 đến N (số bit của ảnh
xám). Trục tung biểu diễn số pixel của mỗi mức xám.
Hình 1.5: Lược đồ ảnh xám.
1.3 BIỂU DIỄN ẢNH TRONG MIỀN TẦN SỐ
Chương 1: Tổng Quan Về Xử Lý Ảnh
7
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 8/37
Kỹ Thuật Watermarking Ảnh Số Trang
Do phải xử lý nhiều thông tin, các phép toán nhân và cộng trong khai triển
là khá lớn. Do vậy ta phải sử dụng các phép biến đổi để làm giảm thứ nguyên của
ảnh cho việc xử lý ảnh hiệu quả hơn. Có nhiều loại phép biến đổi được sử dụng
như:
Phép biến đổi Fourier.
Biến đổi KL (Karhumen Loeve): biến đổi này có nguồn gốc từ khai triển
của quá trình ngẫu nhiên gọi là phương pháp trích chọn các thành phần chính.
Phép biến đổi Lalapce.
Phép biến đổi DCT.
Phép biến đổi Wavelet.
Thường được sử dụng nhiều nhất là phép biến đổi DCT và phép biến đổi
Wavelet.
1.4 CẢI THIỆN ẢNH DÙNG TOÁN TỬ KHÔNG GIAN
Ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ
hoặc làm rõ các chi tiết như biên. Các toán tử không gian dùng trong kỷ thuật tăng
cường ảnh được phân theo nhóm theo công dụng: làm trơn nhiễu, nổi biên. Để làm
trơn nhiễu hay tách nhiễu người ta sử dụng các bộ lọc tuyến tính (lọc trung bình,
thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình).
Từ bản chất của nhiễu thường tương ứng với tần số cao và từ cơ sở lý
thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua. Do đó để lọc
nhiễu người ta dùng lọc thông thấp (theo quan điểm của tần số không gian) hay lấy
tổ hợp tuyến tính để san bằng (lọc trung bình). Để làm nổi ảnh ứng với tần số cao
người ta dùng các bộ lọc thông cao, lọc Laplace.
1.4.1 Làm trơn nhiễu bằng lọc tuyến tính (Linear Filter)
Chương 1: Tổng Quan Về Xử Lý Ảnh
8
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 9/37
Kỹ Thuật Watermarking Ảnh Số Trang
Vì có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh như: nhiễu cộng,
nhiễu xung, nhiễu nhân nên dùng các bộ lọc thông thấp, trung bình và lọc đồng
hình (homomorphie); với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài
(outlier).
1.4.1.1 Lọc trung bình không gian
Với lọc trung bình mỗi điểm ảnh được thay thế bằng trung bình trọng số
của các điểm lân cận và được định nghĩa như sau:
v (m, n) = ∑∑ −−eW l k
l nk m yl k a),(
),(),( (1.2)
Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau.
v (m, n) = N
1 ∑∑ −−eW l k
l nk m y),(
),( (1.3)
Với :
o y (m,n) : ảnh đầu vào
o v (m,n) : ảnh đầu ra
o w (m, n): cửa sổ lọc
o a (k, l) : trọng số lọc
Với a k,l = Nw
1và Nw là số điểm ảnh trong cửa sổ lọc W
Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân
chập H. Nhân chập H trong trường hợp này có dạng:
H =9
1
111
111
111
Trong lọc trung bình, đôi khi người ta ưu tiên cho các hướng để bảo vệ biên
của ảnh khỏi bị mờ đi do làm trơn ảnh. Các kiểu mặt nạ sử dụng tùy theo các
Chương 1: Tổng Quan Về Xử Lý Ảnh
9
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 10/37
Kỹ Thuật Watermarking Ảnh Số Trang
trường hợp khác nhau. Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa là điểm ảnh
ở tâm cửa sổ sẽ được thay thế bởi tổ hợp tuyến tính các điểm lân cận chập với mặt
nạ.
1.4.1.2 Lọc thông thấp không gian (Spacial Low – Pass Filter)
Lọc thông thấp thường được sử dụng để làm trơn nhiễu, khử nhiễu cộng và
nội suy ảnh. Về nguyên lý giống lọc trung bình không gian. Trong kỹ thuật này
người ta hay dùng một số nhân chập sau:
H t1 =8
1
010
121
010
H b = 2)2(
1
+b
11
112
b
bbb
b
Ta dễ dàng thấy khi b = 1, H b chính là nhân chập H 1 (lọc trung bình);còn
khi b=2H b chính là nhân chập H 3 . Ta viết lại chương trình thu nhận ảnh dưới
dạng:
X qs [ ]nm, =X ∞ g [ ]nm, +η [ ]nm, (1.4)
Trong đó η [ ]nm, là nhiễu cộng có phương sai 2
nσ .Như vậy, theo cách
tính của lọc trung bình ta có :
Y [ ]nm, = w N
1 [ ]nml nk m X eW l k
g ,),(
),(
η +−−
∑ ∑∞ (1.5)
Hay Y [ ]nm, = Nw
1 ∑∑ +−−∞ ),( l nk m x g
Nw
n2
σ (1.6)
Như vậy nhiễu cộng trong ảnh đã giảm đi w N lần.
1.4.1.3 Lọc đồng hình (Homomorphie filter)
Chương 1: Tổng Quan Về Xử Lý Ảnh
10
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 11/37
Kỹ Thuật Watermarking Ảnh Số Trang
Kỹ thuật lọc này hiệu quả với ảnh có nhiễu nhân. Thực tế là ảnh quan sát
được gồm ảnh gốc nhân với một hệ số nhiễu. Gọi X(m,n) là ảnh thu được, X(m,n)
là ảnh gốc và ( )nm,η là nhiễu. Như vậy:
X(m,n) =X(m,n). ( )nm,η (1.7)
Lọc đồng hình thực hiện lấy logarit của ảnh quan sát. Do vậy ta có kết quả
sau:
Log(X(m,n))= log (X(m,n)+log( ( )nm,η ) (1.8)
Rõ ràng nhiễu nhân có trong ảnh sẽ bị giảm. Sau quá trình lọc tuyến tính ta
lại chuyển về ảnh cũ bằng phép biến đổi hàm e mũ. Ảnh thu được lọc đồng hình sẽ
tốt hơn ảnh gốc.
1.4.2 Làm trơn nhiễu bằng lọc phi tuyến (NonLinear Filter)
Các bộ lọc phi tuyến cũng hay được dùng trong tăng cường ảnh. Trong kỹ
thuật này người ta dùng bộ lọc trung vị (Median Filtering), giả trung vị (Pseudo
MedianFiltering), lọc ngoài (ourlier). Với lọc trung vị, điểm ảnh đầu vào sẽ đượcthay thế bởi trung vị các điểm ảnh. Còn lọc giả trung vị sẽ dùng trung bình cộng
của 2 giá trị “trung vị” (trung bình cộng của max và min).
1.4.2.1 Lọc trung vị (Median Filter)
Được sử dụng chủ yếu cho giảm nhiễu.
Một bộ lọc trung vị cũng dựa vào việc dùng một cửa sổ di chuyển trên ảnh,và giá trị xám pixel đầu ra được thay thế bởi trung vị của các pixel trong cửa sổ
đó.
v ( )nm, = Trungvi (y(m-k, n-l) với (k,l) ∈ W (1.9)
Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tự
tăng hay giảm dần so với giá trị trung vị. Kích thước cửa sổ thường được chọn sao
cho số điểm ảnh trong cửa sổ là lẻ. Các cửa sổ hay dùng là cửa sổ 3x3, 5x5 hay
7x7.
Chương 1: Tổng Quan Về Xử Lý Ảnh
11
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 12/37
Kỹ Thuật Watermarking Ảnh Số Trang
Tính chất của lọc trung vị:
Lọc trung vị là phi tuyến.
Trungvi ((x(m) + y(m)) # Trungvi (x(m)) + Trungvi (y(m)) (1.10)
Hữu ích cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn bảo toàn
độ phân giải.
Hiệu quả giảm khi số điểm nhiễu trong cửa sổ lớn hơn hay bằng một
nửa số điểm trong cửa sổ. Vì trung vị là ( w N + 1) /2 giá trị lớn nhất nếu w
N lẻ.
Lọc trung vị cho trường hợp hai chiều coi như trung vị tách được theo từng chiều,có nghĩa là tiến hành lọc trung vị cho cột tiếp theo cho hàng.
1.4.2.2 Lọc ngoài
Giả thiết rằng có một mức ngưỡng nào đó cho các mức nhiễu ( dựa vào
lược đồ xám). Tiến hành so sánh giá trị của một điểm ảnh với trung bình số học 8
lân cận của nó. Nếu sự sai lệch này lớn hơn ngưỡng , điểm ảnh này được coi như
nhiễu. Trong trường hợp này ta thay thế giá trị của điểm ảnh bằng giá trị trung
bình 8 lân cận vừa tính được. Các cửa sổ tính toán thường là 3x3. Tuy nhiên cửa
sổ có thể mở rộng đến 5x5 hay 7x7 để đảm bảo tính tương quan giữa các điểm
ảnh. Vấn đề quan trọng là xác định ngưỡng để loại nhiễu mà vẫn không làm mất
thông tin.
1.4.2.3 Bộ lọc giữ biên (Kuwahara Filter)
Biên đóng vai trò quan trọng trong cảm nhận ảnh của chúng ta và trong
phân tích ảnh. Bằng cách nào đó ta làm trơn ảnh mà không làm mất đi độ sắc nét
của biên, nếu có thể thì không làm thay đổi vị trí của biên.
Bộ lọc đạt được mục đích này gọi là bộ lọc biên.
Bộ lọc biên sử dụng một cửa sổ.
Kích thước J = K = 4L+ 1. Với L nguyên.
Chương 1: Tổng Quan Về Xử Lý Ảnh
12
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 13/37
Kỹ Thuật Watermarking Ảnh Số Trang
Chia cửa sổ thành 4 vùng.
Trong mỗi vùng ta tính trung bình độ sáng.
im =∧1 ∑
∈ Rnm
nm s),(
),( (1.11)
Và bình phương độ lệch chuẩn
2
i µ =1
1
−∧
2
),(
)),((∑∈
− Rnm
imnm s Với ∧ là số điểm ảnh của vùng R (1.12)
Giá trị đầu ra của pixel trung tâm trong cửa sổ là giá trị trung bình của vùng
có bình phương độ lệch chuẩn nhỏ nhất.
1.4.2.4 Lọc thông cao, thông dải (Spacial High – Pass, Band Pass – Filter)
Mục đích : Làm trơn ảnh và trích chọn biên.
Nếu ta có bộ lọc thông thấp không gian là ),( nm H LP thì bộ lọc thông cao
được định nghĩa = HP H ),(),( nm LP H nm −∞ và bộ lọc thông dãi là
= BP H −),(1 nm H LP
),(2 nm H LP (1.13)
Dưới đây là các mặt nạ thường dùng cho lọc thông cao.
HP 1 =
−−−
−−
−−−
111
191
111
HP 2 =
−
−−
−
010
151
010
HP 3 =
−
−−
−
121
252
121
Chương 1: Tổng Quan Về Xử Lý Ảnh
13
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 14/37
Kỹ Thuật Watermarking Ảnh Số Trang
Chương 1: Tổng Quan Về Xử Lý Ảnh
14
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 15/37
Kỹ Thuật Watermarking Ảnh Số Trang
1.5 GIỚI THIỆU VỀ XỬ LÝ ẢNH MÀU
1.5.1 Cơ sở của màu sắc
Ánh sáng là một dạng của năng lượng sóng điện từ có bước sóng vào
khoảng 400m µ (millicron) cho ánh sáng tím và khoảng 700m µ cho ánh sáng đỏ.
Hình 1.6: Sự cảm nhận cường độ ánh sáng của mắt người.
Tất cả các bước sóng này đều được cảm nhận bởi mắt người như là một sắc
màu, tất cả các sắc màu này nằm trong ánh sáng trắng của mặt trời với năng lượng
nằm trong khoảng từ hồng ngoại đến cực tím. Màu sắc của một vật thể là một hàm
của các bước sóng không bị hấp thụ phản chiếu từ vật thể, một vật thể có các màu
sắc khác nhau phụ thuộc vào ánh sáng mà nó được quan sát. Một vật thể khi quan
sát dưới ánh sáng mặt trời sẽ có màu sắc khác khi nó được quan sát bằng ánh sáng
đèn điện.
Phần lớn kiến thức cơ sở về màu sắc dựa trên tìm tòi của Isaac Newton và
học thuyết quang học của ông. Newton kết luận rằng cảm giác về màu sắc của
chúng ta là do tác động sự phản xạ có chọn lọc về bước sóng các tia sáng tới. Ông
cho rằng màu sắc vật thể có nguyên nhân bắt nguồn từ phản xạ bước sóng chọn lọc
của truyền đạt các tia sáng xuất phát từ vật thể. Newton trình bày một hỗn hợp của
hai màu có phổ liên tiếp cho ta một màu phổ trung gian, nhưng hỗn hợp của hai
màu có phổ xa nhau đỏ và lam cho ta màu đỏ tía, một màu không phổ. Ông cũng
giới thiệu một loạt màu mà khi tổng hợp với nhau cho màu trắng. Ông gọi các màu
Chương 1: Tổng Quan Về Xử Lý Ảnh
15
( n m )λ 4 0 0 5 0 0 6 0 0 7 0 0
1 . 0
0 . 8
0 . 6
0 . 4
0 . 2
0
T Ý m
L a m
L ô c
V µ n g c a m
§ á c a m
§ á
Q u a n h Ö ® é s¸ n g
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 16/37
Kỹ Thuật Watermarking Ảnh Số Trang
này là các màu chính, bao gồm bảy màu: đỏ, cam, vàng, lục, lam, chàm, tím và
được dùng để tính các màu có bước sóng khác nhau.
Bất kỳ màu nào cũng được tạo ra bởi một tỷ lệ thích hợp của ba màu có phổ
riêng biệt mà bất kỳ màu nào trong số ba màu này cũng không thể tạo ra bằng tổng
hợp của hai màu còn lại. Ba màu này gọi là ba màu riêng (màu chính) được kết
hợp với nhau khi tổng hợp ánh sáng màu, được tách ra khi phân tích thành các
màu thành phần..
Hình 1.7: Tổng hợp màu theo phương pháp cộng và trừ.
Trong hình a, hệ thống tổng hợp ánh sáng được giới thiệu với các màu
riêng hay dùng nhất là đỏ, lục, lam.
- Cộng màu đỏ với màu lục ta được màu vàng.
- Cộng ba màu đỏ, lục, lam theo tỷ lệ thích hợp cho màu trắng.
- Hai màu được bổ sung khi trộn với tỷ lệ thích hợp cho màu trắng.
- Khi trộn với tỷ lệ bù thêm vào của màu lục cho ta màu trắng. Vì
vậy màu đỏ tươi là bù của màu lục.
Trong hình b, các phân tích riêng cho các màu nhuộm thành phần là phần
bù các màu tổng hợp của ánh sáng. Các màu riêng phân tích khi trộn tỷ lệ cho kết
quả là màu đen.
Chương 1: Tổng Quan Về Xử Lý Ảnh
16
Lụclam
Trắng
Lục
vàng
ĐỏLam
Đỏ tươi
(a)
Đỏ
Đen
Đỏ tươi
Lam
Lục lamVàng
Lục
(b)
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 17/37
Kỹ Thuật Watermarking Ảnh Số Trang
Để xác định một ánh sáng màu cần các yếu tố sau:
Độ sáng hay chói: Nó là tổng hợp của ánh sáng nhận được bởi mắt không
kể tới màu sắc. Nó nằm trong khoảng từ lờ mờ tối đến rất sáng hoặc chói mắt.
Sắc màu: Chính là màu có phổ trội hơn trong ánh sáng.
Bão hòa màu: Tạo ra độ tinh khiết phổ của màu trong ánh sáng. Cho một
hỗn hợp của màu và đen trắng độ bão hòa màu được tăng thêm bởi tăng của tổng
các sắc màu.
Hình 1.8: Thuộc tính của màu.
Các tính chất cơ bản quyết định hỗn hợp của ba màu:
Một điểm màu tổng hợp thì độc lập đối với độ sáng trên một phạm vi rộng.
Độ sáng của một hỗn hợp các màu là tổng của các độ sáng riêng lẻ.
Bất kỳ một màu nào cũng được tạo ra bởi một hỗn hợp không nhiều hơn ba
màu thành phần.
Chương 1: Tổng Quan Về Xử Lý Ảnh
17
Lục
Đỏ Vàng
Sáng
nhất
B·o hoµ
Giới hạn củacảm giác
Màu sắc
Tốt nhất
Lam
Tranga
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 18/37
Kỹ Thuật Watermarking Ảnh Số Trang
Các màu thành phần không thể nhận ra được bằng mắt.
Một điểm màu có thể biểu diễn dưới dạng biểu thức:
C = R(R) + G(G) + B(B) (1.14)
R là đơn vị của R.
G là đơn vị của G.
B là đơn vị của B.
Khi tính tổng tạo ra một điểm với màu C.
Các màu được kết hợp theo luật cộng. Giả sử C1 kết hợp với C2 kết hợp C3
kết hợp C4 thì C1 + C3, C2 + C4. Quy tắc này được gọi là luật Grassman.
Các màu kết hợp tuân theo luật trừ.
Các màu kết hợp tuân theo luật bắc cầu. Nếu C1 kết hợp C2 và C2 kết hợp
C3 thì C1 kết hợp với C3.
1.5.2 Biểu thức màu
RGB là các màu riêng vật lý được dùng trong các thí nghiệm vật lý. Các
màu riêng này không phải là duy nhất và ta có thể dùng các màu riêng khác để
thay thế. Vào năm 1938 CIE đã đưa ra một tập các màu không vật lý, ký hiệu là X,
Y, Z. Cải tiến chính trong tập màu này là đỏ sáng được đưa ra trực tiếp như một
màu riêng (Y), Y sẽ cho ta mức xám từ ảnh màu. Các màu riêng này được rút ra từ
các màu riêng vật lý theo biến đổi tuyến tính:
X = 2.7690R + 1.7518G + 1.1300B
Y = 1.0000R + 4.5907G + 0.0601B
Z = 0.0000R + 0.0565G + 5.5943B
Chương 1: Tổng Quan Về Xử Lý Ảnh
18
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 19/37
Kỹ Thuật Watermarking Ảnh Số Trang
Các biểu thức này đúng cho bất kỳ màu nào dựa trên các X, Y, Z sơ đồ màu
CIE đã được phát triển. Sơ đồ này là một không gian biểu diễn cho tất cả các màu
có phổ và tổng hợp của chúng.
Tọa độ màu rút ra từ:
D = X + Y + Z
x = D
X y = D
Y z = D
Z (1.15)
x + y + z = 1
Hình 1.9: Biểu đồ màu CIE
Trong sơ đồ CIE một loạt các màu có phổ được cho dọc theo đường cong,
các góc biểu diễn cho 3 màu riêng: đỏ, lục và lam. Gần trung tâm của miền nằm
trong tam giác các màu trở nên ít bão hòa hơn, biểu diễn cho hỗn hợp màu. Màu
trắng nằm tại điểm trung tâm W với tọa độ x = y = 0.3333.
Sơ đồ màu trên chứa các màu với cùng một độ sáng. Nếu độ sáng của màu
được cho bởi giá trị của z tại góc bên phải của mặt phẳng x - y, tất cả các màu với
độ sáng của nó sẽ có dạng như hình 1.8.
Chương 1: Tổng Quan Về Xử Lý Ảnh
19
.
L ô c
( R )
( B )
L a m
L ô c l a m
Vµ ng
§ á Tr ¾ ng
§á t ¬ i
C¸ c s¾ c m µu kh ̧ c
( G )
(G ')
.
.
.
y
x
1 .0
0 .9
0 .8
0 .7
0 .6
0 .5
0 .4
0 .3
0 .2
0 .1
0
0 .80 .70 .60 .50 .40 .30 .20 .1
B í c s ã ng
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 20/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hình 1.10: Hình chóp màu
Nếu độ sáng tăng lên, sơ đồ màu sẽ trở nên rộng hơn và sẽ có nhiều chi tiết
màu trông thấy. Tại các mức độ sáng thấp, các màu trở nên khó phân biệt và sơ đồ
sẽ thu hẹp lại một điểm, biểu diễn cho màu đen.
1.5.3 Ảnh màu
Nếu bạn kiểm tra màn hình của một tivi khi nó được bật lên, bạn sẽ chú ý
thấy tại tất cả các điểm ảnh màu được tạo nên bằng ba vòng tròn nhỏ hoặc tam
giác có màu đỏ, lục, lam. Sự thay đổi độ sáng của ba phần tử màu này tạo nên màusắc của điểm ảnh. Trong ảnh số thì các điểm ảnh được biểu diễn bằng một số từ có
cùng số bit cho các màu đỏ, lục, lam.
Ví dụ như ảnh màu được biểu diễn bằng 16 bit thì đều có 5 bit để biểu diễn
cho mỗi màu, bit cuối cùng dùng cho một vài chức năng đặc biệt như ngăn xếp.
Trong một khung số thì bit cuối cùng thông thường để chỉ ra điểm ảnh này được
lấy từ bộ đệm khung (bộ nhớ ngăn xếp) hay là từ tín hiệu video bên ngoài (ngănxếp trực tiếp). Trong hệ thống 16 bit 32, 768 màu có thể được biểu diễn với ba
màu riêng có khả năng biểu hiện 32 trạng thái.
1.6 CÁC LOẠI ẢNH MÀU
1.6.1 Không gian màu RGB
Mọi màu được biểu diễn bởi không gian màu RGB đều là sự pha trộn của 3thành phần màu cơ bản.
Chương 1: Tổng Quan Về Xử Lý Ảnh
20
R
B
Đen
Độ chói
W••
Bóng xám
G
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 21/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hình 1.11: Hệ tọa độ RGB
Nhận xét:
Mô hình này không thể biểu diễn mọi màu trong phổ nhìn thấy.
Đủ cho các ứng dụng máy tính.
Màn hình máy tính và TV sử dụng cho mô hình này.
Được sử dụng rộng rãi.
Đơn giản.
Hình 1.12: Ảnh RGB
Chương 1: Tổng Quan Về Xử Lý Ảnh
21
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 22/37
Kỹ Thuật Watermarking Ảnh Số Trang
Trong bảng 1.1 là danh sách giá trị RGB cho một số màu cơ bản. Bất kỳ 3
giá trị được biểu diễn sử dụng cho một màu đặc biệt.
Bảng 1.1: Giá trị RGB cho một số màu cơ bản.
Tên đầy đủ Tên ngằn Giá trị RGB
Black (đen)
Blue (lam)
Green (lục)
Cyan (xanh ngọc)
Red (đỏ)
Magenta (đỏ tươi)
Yellow (vàng)
White (trắng)
k
b
g
c
r
m
y
w
[ 0 0 0]
[ 0 0 1]
[ 0 1 0]
[ 0 1 1]
[ 1 0 0]
[ 1 0 1]
[ 1 1 0]
[ 1 1 1]
1.6.2 Không gian màu NTSC
Hệ thống màu NTSC được sử dụng trong Tivi ở nước Mỹ. Một ưu điểm
chính của dạng này là thông tin mức xám và phân chia dữ liệu màu. Vì vậy tín
hiệu giống được sử dụng trong cả hai màu và cài đặt Tivi đen trắng. Dạng NTSC
dữ liệu ảnh gồm 3 thành phần màu: cường độ sáng ( Y ), độ màu ( I ), và độ bão
hòa ( Q ). Trong đó việc chọn YIQ làm chuyển đổi, thành phần cường độ sáng
biểu diễn mức xám và 2 thành phần khác mang thông tin màu tín hiệu của Tivi.
Thành phần YIQ bao gồm thành phần RGB của ảnh sử dụng biến đổi sau:
Q
I
Y
=
−
−−
312.0523.0211.0
322.0274.0596.0
114.0587.0299.0
B
G
R
Chú ý phần tử của hàng đầu tiên cộng đến 1 và phần tử của hàng thứ 2 kế
tiếp cộng đến 0. Đây là được chấp nhận vì tất cả thành phần RGB trong ảnh xám
là bằng nhau. Vì vậy thành phần I và Q bằng 0 cho nhiều ảnh, công thức của dạngchuyển đổi rgb2ntsc:
Chương 1: Tổng Quan Về Xử Lý Ảnh
22
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 23/37
Kỹ Thuật Watermarking Ảnh Số Trang
yiq_image = rgb2ntsc(rgb_image)
Tương tự thành phần RGB được chứa trong thành phần YIQ dưới công
thức:
B
G
R
=
−
−−
703.1106.1000.1
647.0272.0000.1
621.0956.0000.1
Q
I
Y
Hình 1.13: Ảnh NTSC
1.6.3 Không gian màu YCbCr
Không gian màu RGB được sử dụng rộng rãi trong video số. Trong dạng
này cường độ sáng được biểu diễn bằng thành phần đơn, Y và các màu được lưu
trữ như 2 thành phần màu riêng biệt Cb và Cr. Thành phần Cb là sự thay đổi giữa
thành phần lục và giá trị khác, và thành phần Cr là sự thay đổi giữa thành phần đỏ
và giá trị khác (Poynton 1996). Việc chuyển đổi được sử dụng bởi IPT chuyển đổi
từ RGB sang YCbCr:
Cr
Cb
Y
=
128
128
16
+
−−
−−
214.18786.93000.112
000.112203.74797.37
996.24553.128481.65
B
G
R
Chương 1: Tổng Quan Về Xử Lý Ảnh
23
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 24/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hình 1.14: Ảnh YCbCr
1.6.4 Không gian màu CMY
Mô hình CMY dùng cho in ảnh màu.
Gồm 3 thành phần màu cơ bản Cyan (xanh ngọc), magenta (đỏ tươi),
yellow (vàng). Là bù màu của không gian RGB.
Mối quan hệ giữa 2 không gian:
C = 1.0 – R
M = 1.0 – G
Y = 1.0 – B
Phương pháp pha trộn màu:
Hình 1.15: Phương pháp pha trộn màu.
Chương 1: Tổng Quan Về Xử Lý Ảnh
24
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 25/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hình 1.16: Ảnh CMY
1.6.5 Không gian màu CMYK
Là sự mở rộng mô hình màu CMK bằng cách thêm vào thành phần màu
black (đen) (K), bởi vì với thành phần màu black tinh khiết sẽ cho ta độ tương
phản cao hơn.
Mối quan hệ giữa CMY và CMYK:
K = min (C, M, Y)
C = C – K
M = M – K
Y = Y – K
1.6.6 Không gian màu HSV
Thay vì chọn các phần tử RGB để có màu mong muốn, người ta chọn các
tham số màu: Hue, Saturation, Value (HSV).
Hue: bước sóng gốc của ánh sáng. Trong mô hình Hue được biểu diễn bằng
gốc từ 00 đến 3600.
Chương 1: Tổng Quan Về Xử Lý Ảnh
25
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 26/37
Kỹ Thuật Watermarking Ảnh Số Trang
Saturation: Thước đo độ tinh khiết ánh sáng gốc, S trong khoảng từ [0, 1].
Biểu diễn độ tinh khiết của màu sẽ chọn với độ tinh khiết cực đại.
Value: cường độ hay độ chói ánh sáng. Value có giá trị [0, 1], V = 0 màu
đen. Đỉnh lục giác có cường độ màu cực đại.
Không gian màu HSV được trình bày trong màu RGB dọc tâm trục xám
(các đỉnh đen và trắng) mà kết quả của màu là hình lục giác hình 1.22 a, chúng ta
có trục tọa độ xám như hình 1.22 b, kích thước của hình lục giác trục thẳng đứng
có kích thước thay đổi được mô tả trong hình. Độ màu được biểu diễn như một
góc quanh hình lục giác màu, màu đỏ được sử dụng là 00. Giá trị là khoảng cách
quanh hình nón. Cuối cùng V = 0 là màu đen. Gốc V = 1 là màu trắng, đó là trung
tâm hình lục giác màu. Vì vậy biểu diễn tất cả các bóng mờ của màu xám. Độ bão
hòa màu là khoảng cách xa nhất từ V.
Hình 1.17 a: Lục giác màu HSV. Hình 1.17 b: Hình nón lục giác.
Chương 1: Tổng Quan Về Xử Lý Ảnh
26
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 27/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hình 1.18: Ảnh HSV
Hệ thống màu cơ bản HSV được cơ bản lại trong hệ tọa độ hình trụ. Việc
chuyển đổi từ RGB sang HSV thực chất có cùng công thức RGB trong tọa độ hình
trụ. Loại này được tạo ra chi tiết trong máy tính đồ họa.
Ngoài ra còn có hệ YIQ dùng cho truyền hình màu.
Việc chuyển đổi giữa các không gian biểu diễn màu được thực hiện theo
nguyên tắc sau:
Nếu gọi χ là không gian biểu diễn các màu ban đầu.
' χ không gian biểu diễn màu mới.
A là ma trận biểu diễn phép biến đổi. Ta có quan hệ sau:
' = χ A (1.16)
Ví dụ, biến đổi hệ tọa độ màu RGBCIE sang hệ tọa độ màu RGB NTSC ta có
các vecto tương ứng:
Px =
RGB
RGB
RGB
R
G
R
và Px’ =
NTSC
NTSC
NTSC
B
G
R
Chương 1: Tổng Quan Về Xử Lý Ảnh
27
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 28/37
Kỹ Thuật Watermarking Ảnh Số Trang
Công thức chuyển đổi được viết dưới dạng ma trận:
CIE
CIE
CIE
B
G
R
=
−
−−
128,1059,0001,0
159,0753,0114,0
151,0146,0167,1
NTSC
NTSC
NTSC
B
G
R
1.6.7 Không gian màu HSI
Khác với HSV không gian màu tốt hơn và xa hơn mô tả dưới dạng mà
người dùng giải thích. Khi người sử dụng quan sát màu sẽ hướng tới mô tả nó
bằng hue (cường độ màu), saturation (bão hòa màu) và brightness (độ chói). Hue
mô tả màu nguyên chất ví dụ màu vàng, cam hoặc đỏ. Saturation đo bậc màu tinhkhiết được pha loãng bằng màu trắng sáng. Brightness được mô tả trong thực
nghiệm mà không thể đo được. Khái niệm cường độ của vô sắc và hàm khóa mô tả
cảm giác màu sắc. Chúng ta biết cường độ (mức xám) sử dụng nhiều trong mô tả
ảnh đơn sắc. Xác định chất lượng là đo và đổi cực dễ dàng.
Không gian màu hiện tại được gọi là không gian màu HSI ( hue, saturation,
intensity ), khử ghép thành phần cường độ từ thông điệp mang màu (hue,saturation) trong ảnh màu. Kết quả là kiểu màu HSI trong thanh công cụ phát triển
thuật toán cơ bản trong việc mô tả màu dựa vào tự nhiên và trực giác của con
người, sau đó phát triển và sử dụng các thuật toán. Tương tự như không gian màu
HSV nhưng có nghĩa là màu biểu diễn hội tụ khi được giải thích trong bảng màu.
Một ảnh màu RGB bao gồm 3 ảnh xám vì vậy ta phải trích mức xám từ ảnh
RGB. Nó sẽ bắt đầu xóa hết nếu tính theo trục màu hình 1.17 và chuẩn màu đen là(0,0,0) và màu trắng là ( 1, 1, 1) trực tiếp quanh trục như hình 1.19.
Chương 1: Tổng Quan Về Xử Lý Ảnh
28
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 29/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hình 1.19: Mối quan hệ giữa kiểu màu RGB và HSI.
Đường hiển thị mức xám dọc theo màu trắng và màu đen. Vì vậy muốn xác
định thành phần mức xám là điểm màu bất kỳ như hình 1.19. Chú ý việc kết hợp
với hình 1.19 mức xám là đường thẳng quanh trục đứng, đơn giản dọc theo pháp
tuyến và chứa các điểm màu. Phần không gian với mức xám sẽ cho ra giá trị mức
xám trong khoảng từ [ 0,1]. Chú ý độ bão hòa nhỏ (tinh khiết) của màu tăng như
hàm mức xám. Thực tế độ bão hòa của điểm trong mức xám là zero, được xác
minh thực tế bằng tất cả các điểm là màu xám.
Như ta thấy sự khác nhau của độ màu như thế nào trong điểm RGB, không
gian biểu diễn được xác định bởi 3 điểm (đen, trắng và xanh ngọc). Thực tế, điểm
đen và trắng được chứa trong không gian. Như chúng ta nói rằng cường độ được
chứa trong không gian. Ngoài ra, chúng ta nói rằng tất cả những điểm chứa trong
không gian được xác định bằng cường độ và biên giống như độ màu (trong trường
hợp màu xanh ngọc). Bởi vì đây là một màu bên nhiều gốc màu bên ngoài tamgiác màu được kết hợp các giá trị hoặc hỗn hợp 3 thành phần màu. Nếu 2 trong số
đó là màu đen và màu trắng và thứ 3 là một điểm màu, tất cả các điểm màu trên
tam giác giống như độ màu trước thành phần đen và trắng không kết hợp từ thay
đổi độ màu. Từ khái niệm này chúng ta có thể kết luận giống như độ màu bão hòa
và cường độ giá trị yêu cầu từ không gian HSI có thể nhận được từ khối màu
RGB, đó là chúng ta có thể thay đổi một số điểm RGB từ một điểm đồng vị là mẫu
màu HSI làm công việc mô tả đẳng thức hình học chỉ đường ra được lập luận
chính xác trong việc thảo luận vấn đề trước.
Chương 1: Tổng Quan Về Xử Lý Ảnh
29
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 30/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hình 1.20: Độ màu và bão hòa trong hệ màu HSI.
1.7 MỘT SỐ ĐỊNH DẠNG ẢNH HIỆN NAY
Ảnh thu được sau quá trình số hóa có nhiều loại khác nhau phụ thuộc vào
kỹ thuật số hóa ảnh. Ở các phần trên ta đã biết ảnh được chia làm hai loại: ảnh đen
trắng và ảnh màu. Ảnh thu nhận được có thể lưu trữ trên tệp để tiện cho các bước
xử lý tiếp theo. Phần bên dưới sẽ trình bày một số kiểu định dạng ảnh thông dụnghay dùng trong kỹ thuật xử lý ảnh hiện nay.
1.7.1 Ảnh IMG
Ảnh IMG là ảnh đen trắng. Phần đầu của ảnh IMG có 16 byte chứa các
thông tin cần biết:
Sáu byte đầu dùng để đánh dấu định dạng ảnh IMG. Giá trị của sáu bytenày viết dưới dạng số Hexa: 0x0001 0x0008 0x0001.
Hai byte tiếp theo chứa độ dài mẫu tin. Đó là độ dài của dãy các byte kề
liền nhau mà dãy này sẽ được lặp lại một số lần nào đó. Số lần lặp lại này sẽ được
lưu trong byte đếm. Nhiều dãy giống nhau được lưu trong một byte.
Bốn byte tiếp mô tả kích cỡ pixel.
Hai byte tiếp mô tả số pixel trên một dòng ảnh.
Chương 1: Tổng Quan Về Xử Lý Ảnh
30
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 31/37
Kỹ Thuật Watermarking Ảnh Số Trang
Hai byte cuối là số dòng ảnh trong ảnh.
Ảnh IMG được nén theo từng dòng, mỗi dòng bao gồm các gói ( pack ). Các
dòng giống nhau cũng được nén thành một gói. Có bốn loại gói sau:
Loại 1: Gói các dòng giống nhau. Quy cách gói tin này như sau: 0x00 0x00
0xFF Count. Ba byte đầu cho biết số các dãy giống nhau, byte cuối cho biết số các
dòng giống nhau.
Loại 2: Gói các dãy giống nhau. Quy cách gói tin này như sau: 0x 00
Count. Byte thứ hai cho biết số các dãy giống nhau được nén trong gói. Độ dài của
dãy ghi ở đầu tệp.
Loại 3: Dãy các pixel không giống nhau, không lặp lại và không nén được.
Quy cách như sau: 0x 80 Count. Byte thứ hai cho biết độ dài dãy các pixel không
giống nhau không nén được.
Loại 4: Dãy các pixel giống nhau. Tùy theo các bit cao của byte đầu được
bật hay tắt. Nếu bit cao được bật ( giá trị 1) thì đây là gói nén các byte chỉ gồm bit
0, số các byte được nén được tính bởi bảy bit thấp cón lại. Nếu bit cao tắt ( giá trị
0) thì đây là gói nén các byte gồm toàn bit 1, số các byte được nén được tính bởi
bảy bit thấp còn lại.
Các gói tin của file IMG phong phú như vậy là do ảnh IMG là ảnh đen
trắng. Do vậy, chỉ cần một bit cho một pixel thay vì bốn hay tám như đã nói ở trên.
Toàn bộ ảnh chỉ có điểm sáng và tối tương ứng giá trị 1 hoặc giá trị 0. Tỉ lệ nén
của kiểu định dạng này là khá cao.
1.7.2 Ảnh PCX
Định dạng ảnh PCX là một trong những kiểu định dạng cổ điển nhất. Nó sử
dụng phương pháp mã loạt dài RLE ( Run Length Encoded ) để nén dữ liệu ảnh.
Quá trình nén và giải nén được thực hiện trên từng dòng ảnh. Thực tế phương
pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG. Tệp PCX gồm ba phần:đầu tệp (header ), dữ liệu ảnh (image data), bảng màu mở rộng.
Chương 1: Tổng Quan Về Xử Lý Ảnh
31
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 32/37
Kỹ Thuật Watermarking Ảnh Số Trang
Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố
như sau:
− Một byte: chỉ kiểu định dạng, nếu là kiểu PCX/PCC nó luôn có giá trị là
0Ah.
− Một byte: chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau: 0:
version 2.5; 2: version 2.8 với bảng màu; 3: version 2.8 hay 3.0 không có bảng
màu; 5: version 3.0 có bảng màu.
− Một byte: chỉ ra phương pháp mã hóa. Nếu là 0 thì mã hóa theo phương
pháp BYTE PACKED, nếu là 1 thì mã hóa theo phương pháp RLE.
− Một byte: số bit cho một điểm ảnh plane.
− Một word: tọa độ góc trái trên của ảnh. Với kiểu PCX nó có giá trị là (0,
0), còn PCC thì khác (0, 0).
− Một word: tọa độ góc phải dưới.
− Một word: kích thước bề rộng và bề cao ảnh.
− Một word: số điểm ảnh.
− Một word: độ phân giải màn hình.
− Một word.
− 48 byte: chia thành 16 nhóm, mỗi nhóm ba byte. Mỗi nhóm này chứa
thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.
− Một byte: không dùng đến và luôn đạt là 0.
− Một byte: số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là
bốn, với ảnh 256 màu (1pixel/8bit) thì số bit plane lại là một.
− Một byte: số byte cho một dòng quét ảnh.
Chương 1: Tổng Quan Về Xử Lý Ảnh
32
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 33/37
Kỹ Thuật Watermarking Ảnh Số Trang
− Một word: kiểu bảng màu.
− 58 byte: không dùng.
Tóm lại, định dạng ảnh PCX thường được dùng để lưu trữ ảnh vì thao tác
đơn giản, cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố định
nên trong một số trường hợp nó làm tăng kích thước lưu trữ. Và vì vậy mà một số
ứng dụng lại sử dụng một kiểu định dạng khác mềm dẻo hơn đó là TIFF.
1.7.3 Ảnh TIFF (Targed Image File Format)
Kiểu định dạng TIFF được thiết kế để làm nhẹ bớt các vấn đề liên quan đếnviệc mở rộng tệp ảnh cố định. Về cấu trúc nó cũng có ba phần chính:
Phần Header (IFH): có trong tất cả các tệp TIFF và gồm tám byte:
− Một word: chỉ ra kiểu tạo tệp trên máy tính PC hay Macinfosh. Hai loại
này khác nhau rất lớn ở thứ tự các byte lưu trữ trong các số dài hai hay bốn byte.
Nếu trường này có giá trị là 4D4Dh thì đó là ảnh cho máy Macintosh; nếu lá
4949h là của máy PC.
− Một word: version. Từ này luôn có giá trị là 42. Có thể coi đó là đặc trưng
của file TIFF vì nó không thay đổi.
− Hai word: giá trị Offset theo byte tính từ đầu file tới cấu trúc IFD ( Image
File Directory) là cấu trúc thứ hai của file. Thứ tự các byte ở đây phụ thuộc vào
dấu hiệu trường đầu tiên.
Phần thứ hai (IFD): Nó không ở ngay sau cấu trúc IFH mà vị trí nó được xác
định bởi trường Offset trong đầu tệp. Có thể có một hay nhiều IFD cùng tồn tại
trong file (nếu file có nhiều hơn một ảnh).
Một IFD gồm:
− Hai byte: chứa các DE ( Directory Entry).
Chương 1: Tổng Quan Về Xử Lý Ảnh
33
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 34/37
Kỹ Thuật Watermarking Ảnh Số Trang
− 12 byte là các DE xếp liên tiếp, mỗi DE chiếm mười hai byte.
− Bốn byte: chứa Offset trỏ tới IFD tiếp theo. Nếu đây là IFD cuối cùng thì
trường này có giá trị là 0.
Phần dữ liệu thứ ba (các DE): các DE có độ dài cố định gồm 12 byte chia
làm bốn phần:
− Hai byte: chỉ ra dấu hiệu mà tệp ảnh đã được xây dựng.
− Hai byte: kiểu dữ liệu của tham số ảnh. Có năm kiểu tham số cơ bản:
1: BYTE (1 byte)
2: ASCII (1 byte)
3: SHORT (2 byte)
4: LONG (4 byte)
5: RATIONAL (8 byte)
− Bốn byte: trường độ dài (bộ đếm) chứa số lương chỉ mục của kiểu dữ liệu
đã chỉ ra. Nó không phải là tổng số byte cần thiết để lưu trữ. Để có dữ liệu này ta
cần nhân tham số chỉ mục với kiểu dữ liệu đã dùng.
− Bốn byte: đó là Offset tới điểm bắt đầu dữ liệu thực liên quan tới dấu
hiệu, tức là dữ liệu liên quan với DE không phải lưu trữ vật lý cùng với nó nằm ở
một vị trí nào đó trong file.
Dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dòng (cột)
quét của dữ liệu ảnh. Cách tổ chức này làm giảm bộ nhớ cần thiết cho việc đọc
tệp. Việc giải nén được thực hiện theo bốn kiểu khác nhau được lưu trữ trong ba
dấu hiệu nén. Như đã nói ở trên, file ảnh TIFF là dùng để giải quyết vấn đề khó
mở rộng của file PCX. Tuy nhiên, với cùng một ảnh thì việc dùng file PCX chiếm
ít không gian nhớ hơn.
Chương 1: Tổng Quan Về Xử Lý Ảnh
34
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 35/37
Kỹ Thuật Watermarking Ảnh Số Trang
1.7.4 Ảnh GIF (Graphics Interchanger Format)
Cách lưu trữ kiểu PCX có lợi về không gian lưu trữ với ảnh đen trắng kích
thước tệp có thể nhỏ hơn bản gốc từ năm đến bảy lần. Với 16 màu kích thước ảnh
nhỏ hơn ảnh gốc hai đến ba lần, có trường hợp có thể xấp xỉ ảnh gốc. Tuy nhiên,
với ảnh 256 màu thì nó bộc lộ rõ khả năng nén rất kém. Điều này có thể lý giải
như sau: khi số màu tăng lên các loạt dài xuất hiện ít hơn và vì thế lưu trữ theo
kiểu PCX không còn lợi nữa. Hơn nữa, nếu ta muốn lưu trữ nhiều đối tượng trên
một tệp ảnh như kiểu định dạng TIFF đòi hỏi có một định dạng khác thích hợp.
Định dạng ảnh GIF do hãng ComputServer Incorporated (Mỹ) đề xuất lần
đầu tiên vào năm 1990. Với định dạng GIF, những vướng mắc mà các định dạng
khác gặp phải khi số màu trong ảnh tăng lên không còn nữa. Khi số màu càng tăng
thì ưu thế của định dạng GIF càng nổi trội. Những ưu thế này có được là do GIF
tiếp cận các thuật toán nén LZW ( Lempel Ziv Weleh). Bản chất của kỹ thuật nén
LZW là dựa vào sự lặp lại của một nhóm điểm chứ không phải loạt dài giống
nhau. Do vậy, dữ liệu càng lớn thì sự lặp lại càng nhiều. Dạng ảnh GIF cho chất
lượng cao, độ phân giải đồ họa cũng đạt cao, cho phép hiển thị trên hầu hết các phần cứng đồ họa. Định dạng tổng quát của ảnh GIF như sau:
Chữ ký của ảnh: có giá trị GIF87a. Nó gồm sáu ký tự, ba ký tự đầu chỉ ra
kiểu định dạng, ba ký tự sau chỉ ra version của ảnh.
Bộ hình hiển thị: chứa mô tả các thông số cho toàn bộ ảnh GIF.
Bản đồ màu tổng thể: mô tả bộ màu tối ưu đòi hỏi khi bit M = 1. Khi bộ
màu tổng thể được thể hiện, nó sẽ xác lập ngay bộ mô tả hình hiển thị. Số lượng
thực thể bản đồ màu lấy theo bộ mô tả hình hiển thị ở trên và bằng 2m, với m là
lượng bit trên một pixel khi mỗi thực thể chứa đựng ba byte (biểu diễn cường độ
màu cơ bản Red-Green-Blue).
Bộ mô tả ảnh: định nghĩa vị trí thực tế và phần mở rộng của ảnh trong
phạm vi không gian ảnh đã có trong phần mô tả hình hiển thị. Nếu ảnh biểu diễn
theo ánh xạ bản đồ màu cục bộ thì cờ định nghĩa phải được thiết lập. Mỗi bộ mô tả
Chương 1: Tổng Quan Về Xử Lý Ảnh
35
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 36/37
Kỹ Thuật Watermarking Ảnh Số Trang
ảnh được chỉ ra bởi ký tự kết nối ảnh. Ký tự này chỉ được dùng khi định dạng
GIF có từ hai ảnh trở lên. Ký tự này có giá trị 0x2c (ký tự dấu phẩy).
Bản đồ màu cục bộ: chỉ được chọn khi bit M của byte thứ 10 là 1. Khi bản
đồ màu được chọn, bản đồ màu sẽ chiếu theo bộ mô tả ảnh mà lấy vào cho đúng.
Tại phần cuối ảnh, bản đồ màu sẽ lấy lại phần xác lập sau bộ mô tả hình hiển thị.
Lưu ý đây là trường “pixel” của byte thứ 10 chỉ được dùng khi bản đồ màu được
chỉ định. Các tham số này không chỉ cho biết kích thước ảnh theo pixel mà còn chỉ
ra số thực thể bản đồ màu của nó.
Dữ liệu ảnh: chuỗi các giá trị có thứ tự của các pixel màu tạo nên ảnh. Các
pixel được xếp liên tục trên một dòng ảnh từ trái qua phải. Các dòng ảnh được xếp
từ trên xuống dưới.
Phần kết thúc ảnh: cung cấp tính đồng bộ cho đầu cuối của ảnh GIF, cuối
của ảnh sẽ xác định bởi ký tự “;" (0x3b).
Định dạng GIF có rất nhiều ưu điểm và đã được công nhận là chuẩn để lưu
trữ ảnh màu thực tế (chuẩn ISO 10918-1). Nó được mọi trình duyệt Web (WebBrowser) hỗ trợ với nhiều ứng dụng hiện đại. Cùng với nó có chuẩn JPEG (Joint
Photograph Expert Group). GIF dùng cho ảnh chụp (Photograph).
1.7.5 Ảnh BMP (Bitmap)
Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng
màu của các điểm ảnh tương ứng khi hiển thị. Ưu điểm của ảnh Bitmap là tốc độ
vẽ và tốc độ xử lý nhanh. Nhược điểm của nó là kích thước rất lớn.
1.7.6 Ảnh JPEG (Joint Photographic Experts Group)
Đây là một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web. Ảnh
JPEG được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt
nhất cho đồ họa có nhiều màu sắc, ví dụ như là ảnh chụp được scan. File Ảnh
JPEG là ảnh Bitmap đã được nén lại.
Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
Chương 1: Tổng Quan Về Xử Lý Ảnh
36
5/8/2018 CHƯƠNG 1 - slidepdf.com
http://slidepdf.com/reader/full/chuong-1-559abee47341f 37/37
Kỹ Thuật Watermarking Ảnh Số Trang
Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh
JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh.
Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG
không giới hạn số màu mà chúng sử dụng.
1.7.7 Ảnh WMF (Windows Metafiles)
Là một tập hợp các lệnh GDI dùng để mô tả ảnh và nội dung ảnh. Có hai ưu
điểm khi sử dụng ảnh WMF: kích thước file WMF nhỏ và ít phụ thuộc vào thiết bị
hiển thị hơn so với ảnh Bitmap.
Chương 1: Tổng Quan Về Xử Lý Ảnh
37