kĨ thuẬt nÉn Ảnh sỐ

58
KĨ THUẬT NÉN ẢNH SỐ ĐIỆN TỬ 3-K4 Đại học Công nghiệp Hà Nội

Upload: hien-nguyen

Post on 24-Jul-2015

912 views

Category:

Documents


11 download

TRANSCRIPT

Page 1: KĨ THUẬT NÉN ẢNH SỐ

KĨ THUẬT NÉN ẢNH SỐĐIỆN TỬ 3-K4

Đại học Công nghiệp Hà Nội

Page 2: KĨ THUẬT NÉN ẢNH SỐ

Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc tín hiệu số. Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí đó. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh, thông thường kí hiệu là PEL (Picture Element) hoặc là điểm ảnh (Pixel).

Với ảnh đa cấp xám: Nếu dùng 8 bit (1 byte) để biểu diễn mức xám, thì số các mức xám có thể biểu diễn được là 28 hay 256. Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất.

TỔNG QUAN VỀ KỸ THUẬT NÉN ẢNH SỐ

Page 3: KĨ THUẬT NÉN ẢNH SỐ

Với ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24 bit, 24 bit này được chia thành ba khoảng 8 bit. Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính.

TỔNG QUAN VỀ KỸ THUẬT NÉN ẢNH SỐ

Page 4: KĨ THUẬT NÉN ẢNH SỐ

• Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý dữ liệu đa phương tiện. Mục đích là làm thế nào để lưu trữ bức ảnh dưới dạng có kích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ yêu cầu số bít mã hoá ít hơn so với bức ảnh gốc.

Công nghệ số hiện đại cho phép chúng ta thao tác với những tín hiệu nhiều chiều bằng những hệ thống từ đơn giản như các mạch điện tử đến phức tạp như những máy tính song song cao cấp. Mục đích của việc thao tác này có thể chia thành ba nhóm:

Xử lý ảnh: ảnh vào ảnh ra Phân tích ảnh: ảnh vào số liệu đo đạc ra Hiểu ảnh: ảnh vào thông tin mô tả ra

TỔNG QUAN VỀ KỸ THUẬT NÉN ẢNH SỐ

Page 5: KĨ THUẬT NÉN ẢNH SỐ

Một ảnh số được mô tả trong một không gian 2 chiều được lấy từ ảnh thực trong một không gian hai chiều liên tục qua một khâu lấy mẫu ảnh thường được gọi là số hóa. Hiệu ứng của việc số hóa được biểu thị như hình dưới.

Tấm hình 2 chiều liên tục a(x,y ) được chia thành N hàng và M cột. Giao điểm của một hàng và một cột được gọi là điểm ảnh. Giá trị được gán cho các tọa độ số nguyên [m,n], với { m=0, 1, 2, …, M-1} và { n= 0, 1, 2,…, N-1} là a[m,n]. Thực ra, trong nhiều trường hợp a(x,y ) - mà ta có thể coi là tín hiệu vật lý được tiếp nhận ở bề mặt 2 chiều của thiết bị đo - lại là một hàm số của nhiều biến bao gồm độ sâu (z), màu (λ), và thời gian (t).

TỔNG QUAN VỀ KỸ THUẬT NÉN ẢNH SỐ

Page 6: KĨ THUẬT NÉN ẢNH SỐ

TỔNG QUAN VỀ KỸ THUẬT NÉN ẢNH SỐ

Ảnh dưới được chia thành N=16 hàng và M=16 cột. Giá trị được gán cho mỗi điểm ảnh thì bằng trung bình cộng của các độ sáng trong điểm ảnh, làm tròn về số nguyên gần nhất. Quá trình biểu diễn biên độ của tín hiệu 2 chiều tại một tọa độ xác định như số nguyên với L cấp độ xám khác nhau thì thường được gọi là rời rạc hóa biên độ hay đơn giản hơn là rời rạc hóa.

Page 7: KĨ THUẬT NÉN ẢNH SỐ

• Biến đổi Fourier ( Fourier Transform-FT):

1. FT của hàm 1 chiều: f(x)

2. FT của hàm 2 chiều: f(x,y)

CƠ SỞ TOÁN HỌC TRONG XỬ LÝ ẢNH

Page 8: KĨ THUẬT NÉN ẢNH SỐ

3. Biến đổi Fourier 2 phía:

CƠ SỞ TOÁN HỌC TRONG XỬ LÝ ẢNH

Page 9: KĨ THUẬT NÉN ẢNH SỐ

4. Đặc trưng của biến đổi Fourier:

CƠ SỞ TOÁN HỌC TRONG XỬ LÝ ẢNH

Page 10: KĨ THUẬT NÉN ẢNH SỐ

5. Biến đổi Z ( chuỗi Laurent):- Với 2 biến m,n ta có chuỗi x(m,n): X(z1,z2)=z1

-mz2-n

với z1, z2 là các biến số phức.

- Biến đổi Z ngược:

x(m,n)= khi

Đặc trưng của biến đổi Z:

Page 11: KĨ THUẬT NÉN ẢNH SỐ

6. Ma trận và các hệ quả:

- Ma trận M hàng và N cột

CƠ SỞ TOÁN HỌC TRONG XỬ LÝ ẢNH

Page 12: KĨ THUẬT NÉN ẢNH SỐ

Sơ đồ tổng quát:

XỬ LÝ ẢNH CƠ BẢN

Page 13: KĨ THUẬT NÉN ẢNH SỐ

Quá trình thu nhận hình ảnh: Sơ đồ khối quá trình thu nhận hình ảnh

1: ánh sáng hoặc hình ảnh chưa được xử lý

2: tín hiệu ảnh tương tự

3: tín hiệu ảnh số

XỬ LÝ ẢNH CƠ BẢN

Lấy mẫu Lượng tử hóaPre- filter Lưu trữ321

Page 14: KĨ THUẬT NÉN ẢNH SỐ

Lấy mẫu:

Lấy mẫu thành phần hoặc phần tử của ảnh điểm ảnh.

Sơ đồ minh họa quá trình lấy mẫu:

XỬ LÝ ẢNH CƠ BẢN

Page 15: KĨ THUẬT NÉN ẢNH SỐ

VD1: hệ số lấy mẫu của tín hiệu video hệ NTSC

3(for color) x(512x512)[samples/frame]x30[samples/sec]

=3x(1/4)M x 30[samples/sec]

=3x 7,5M [samples/sec]• VD2 : chưa lấy mẫu: có gợn,

răng cưa => lọc thông thấp trước

khi lấy mẫu

XỬ LÝ ẢNH CƠ BẢN

Page 16: KĨ THUẬT NÉN ẢNH SỐ

Lượng tử hóa:

8-bit đều được lượng tử hóa: thường áp dụng cho ảnh chưa qua xử lý.

PSNR=10

=1059dB. =1

VD: lượng tử hóa chưa hoàn thiện

XỬ LÝ ẢNH CƠ BẢN

Page 17: KĨ THUẬT NÉN ẢNH SỐ

XỬ LÝ ẢNH CƠ BẢN

Page 18: KĨ THUẬT NÉN ẢNH SỐ

Sử dụng các phép biến đổi toán học:

1. Biến đổi Unita:

BIẾN ĐỔI HÌNH ẢNH

Page 19: KĨ THUẬT NÉN ẢNH SỐ

2. Biến đổi Unita mở rộng:

BIẾN ĐỔI HÌNH ẢNH

Page 20: KĨ THUẬT NÉN ẢNH SỐ

3. Biến đổi Fourier rời rạc 1 phía (DFT):

- Một cặp biến đổi DFT được định nghĩa như sau:

- Một cặp unita DFT được định nghĩa như sau:

BIẾN ĐỔI HÌNH ẢNH

Page 21: KĨ THUẬT NÉN ẢNH SỐ

4. Biến đổi DFT 2 phía:

BIẾN ĐỔI HÌNH ẢNH

Page 22: KĨ THUẬT NÉN ẢNH SỐ

VD: ảnh qua biến đổi DFT 2 phía

BIẾN ĐỔI HÌNH ẢNH

Page 23: KĨ THUẬT NÉN ẢNH SỐ

Tín hiệu tổng hợp của pha hoặc độ lớn:

Page 24: KĨ THUẬT NÉN ẢNH SỐ

5. Biến đổi Cosine rời rạc:

BIẾN ĐỔI HÌNH ẢNH

Page 25: KĨ THUẬT NÉN ẢNH SỐ

Ngoài ra còn có các

phép biến đổi

khác như biến đổi Hadamard,

biến đổi Karhunen Loeve

được sử dụng nhiều

trong xử lý hình ảnh.

BIẾN ĐỔI HÌNH ẢNH

Page 26: KĨ THUẬT NÉN ẢNH SỐ

Nâng cao chất lượng là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một số đặc tính của ảnh. Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ảnh. Tăng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như :

1. Lọc nhiễu, hay làm trơn ảnh, 

2. Tăng độ tương phản, điều chỉnh mức xám của ảnh,

3. Làm nổi biên ảnh.

CẢI THIỆN ẢNH

Page 27: KĨ THUẬT NÉN ẢNH SỐ

Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian và tần số. Toán tử điểm là phép biến đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân cận khác, trong khi đó, toán tử không gian sử dụng các điểm lân cận để quy chiếu tới điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp được chuyển sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền không gian nhờ các biến đổi ngược.

CẢI THIỆN ẢNH

Page 28: KĨ THUẬT NÉN ẢNH SỐ

Các dạng toán tử điểm:

1) Tăng độ tương phản

2) Tách nhiễu và phân ngưỡng

3) Biến đổi âm bản

4) Cắt theo mức

5) Trích chọn bit

CẢI THIỆN ẢNH

Page 29: KĨ THUẬT NÉN ẢNH SỐ

Làm trơn nhiễu sử dụng toán tử không gian:

1. Sử dụng lọc tuyến tính: lọc dải thông thấp và lọc trung bình.

2. Dùng lọc phi tuyến: lọc trung vị, lọc ngoài.

3. Mặt nạ gờ sai phân và làm nhẵn.

4. Lọc thông thấp, lọc thông cao và lọc dải thông.

5. Khuếch đại và nội suy ảnh.

CẢI THIỆN ẢNH

Page 30: KĨ THUẬT NÉN ẢNH SỐ

Sau đó ảnh tiếp tục được xử lý qua các bước tiếp theo:o Phát hiện biên ảnho Phân vùng ảnho Nhận dạng ảnh

Và bước xử lý cuối cùng là nén dữ liệu ảnh.

NÉN DỮ LIỆU ẢNH

Page 31: KĨ THUẬT NÉN ẢNH SỐ

Nén dữ liệu nhằm làm giảm lượng thông tin “dư thừa” trong dữ liệu gốc và do vậy, lượng thông tin thu được sau khi nén thường nhỏ hơn dữ liệu gốc rất nhiều. Với dữ liệu ảnh, kết quả thường là 10:1. Một số phương pháp còn cho kết quả cao hơn. Theo kết quả nghiên cứu được công bố gần đây tại Viện Kỹ thuật Georfie, kỹ thuật nén fratal cho tỉ số nén là 30 trên 1 [6] .

Tỉ lệ nén là tham số quan trọng đánh giá khả năng nén của hệ thống.

 

NÉN DỮ LIỆU ẢNH

Page 32: KĨ THUẬT NÉN ẢNH SỐ

Phân loại phương pháp nén:

1. Cách thứ nhất dựa vào nguyên lý nén. Cách này phân các phương pháp nén thành hai họ lớn:

o Nén chính xác hay nén không mất thông tin: gồm các phương pháp nén mà sau khi nén ta thu được chính xác dữ liệu gốc.

o Nén co mất thông tin hay nén có tổn hao: gồm các phương pháp mà sau khi nén ta không thu được dữ liệu như bản gốc, phương pháp này lợi dụng tính chất của mắt người, chấp nhận một số vặn xoắn trong ảnh khi khôi phục lại.

2. Cách thứ hai dựa vào cách thức thực hiện nén.

3. Dựa vào triết lý của sự mã hóa, bao gồm:o Các phương pháp nén thế hệ thứ nhất.o Các phương pháp nén thế hệ thứ hai: dựa vào độ bão hòa của tỉ lệ nén.

 

NÉN DỮ LIỆU ẢNH

Page 33: KĨ THUẬT NÉN ẢNH SỐ

Các phương pháp nén thế hệ thứ nhất:

1. Phương pháp mã hóa loạt dài ( Run Length Coding )o Phương pháp mã hóa loạt dài lúc đầu được phát triển dành cho ảnh số 2

mức: mức đen (1), và mức trắng (0) như các văn bản trên nền trắng, trang in, các bản vẽ kỹ thuật.

o Nguyên tắc của phương pháp là phát hiện một loạt các bít lặp lại, thí dụ như một loạt các bít 0 nằm giữa hai bít 1, hay ngược lại, một loạt bít 1 nằm giữa hai bít 0. Phương pháp này chỉ có hiệu quả khi chiều dài dãy lặp lớn hơn một ngưỡng nào đó. Dãy các bít lặp gọi là loạt hay mạch (run). Tiếp theo, thay thế chuỗi đó bởi một chuỗi mới gồm 2 thông tin: chiều dài chuỗi và bít lặp ký tự lặp). Như vậy, chuỗi thay thế sẽ có chiều dài ngắn hơn chuỗi cần thay.

NÉN DỮ LIỆU ẢNH

Page 34: KĨ THUẬT NÉN ẢNH SỐ

o Cần lưu ý rằng, đối với ảnh, chiều dài của chuỗi lặp có thể lớn hơn 255. Nếu ta dùng 1 byte để mã hóa thí sẽ không đủ. Giải pháp được dùng là tách các chuỗi đó thành hai chuỗi: một chuỗi có chiều dài 255, chuỗi kia là số bít còn lại. Phương pháp RLC được sử dụng trong việc mã hóa lưu trữ các ảnh Bitmap theo dạng PCX, BMP.

2. Phương pháp mã hóa Huffman:o Phương pháp mã hóa Huffman là phương pháp dựa vào mô hình thông kê. Dựa vào dữ

liệu gốc, người ta tính tần suất xuất hiện của các ký tự. Việc tính tần suất được thực hiện bởi cách duyệt tuần tự tệp gốc từ đầu đến cuối. Việc xử lý ở đây tính theo bit. Trong phương pháp này người ta gán cho các ký tự có tần suất cao một từ mã ngắn, các ký tự có tần suất thấp từ mã dài. Nói một cách khác, các ký tự có tần suất càng cao được gán mã càng ngắn và ngược lại. Rõ ràng với cách thức này, ta đã làm giảm chiều dài trung bình của từ mã hóa bằng cách dùng chiều dài biến đổi. Tuy nhiên, trong một số tình huống khi tần suất là rất thấp, ta có thể không được lợi một chút nào, thậm chí còn bị thiệt một ít bit.

NÉN DỮ LIỆU ẢNH

Page 35: KĨ THUẬT NÉN ẢNH SỐ

3. Phương pháp LZWo Phương pháp nén từ điển dựa trên việc xây dựng từ điển lưu các

chuỗi ký tự có tần suất lặp lại cao và thay thế bằng từ mã tương ứng mỗi khi gặp lại chúng. Giải thuật LZW hay hơn các giải thuật trước nó ở kỹ thuật tổ chức từ điển cho phép nâng cao tỉ lệ nén.

o Giải thuật nén LZW được sử dụng cho tất cả các loại file nhị phân. Nó thường được dùng để nén các loại văn bản, ảnh đen trắng, ảnh màu, ảnh đa mức xám… và là chuẩn nén cho các dạng ảnh GIF và TIFF. Mức độ hiệu quả của LZW không phụ thuộc vào số bít màu của ảnh.

NÉN DỮ LIỆU ẢNH

Page 36: KĨ THUẬT NÉN ẢNH SỐ

Các phương pháp nén dựa trên các biến đổi

1. Mã hóa dùng biến đổi 2 chiều: KL ,biến đổi Hadamard, biến đồi FT, biến đổi sin, cosin….

2. Mã hóa dùng biến đổi Cosine: Cosine một chiều, Cosine nhanh, Cosine ngược.

o Phép biến đổi Cosine một chiều: được ứng dụng rất rộng rãi trong nhiều phương pháp mã hóa ảnh khác nhau nhờ hiệu suất gần như tối ưu của nó đối với các ảnh có độ tương quan cao giữa các điểm ảnh lân cận. Biến đổi Cosine rời rạc được sử dụng trong chuẩn ảnh nén JPEG và định dạng phim MPEG.

o Phép biến đổi Cosin rời rạc một chiều được định nghĩa bởi:

NÉN DỮ LIỆU ẢNH

Page 37: KĨ THUẬT NÉN ẢNH SỐ

o Khi dãy đầu vào x(n) là thực thì dãy các hệ số X(k) cũng là số thực. Tính toán trên trường số thực giảm đi một nửa thời gian so với biến đổi Fourier. Để đạt được tốc độ biến đổi thỏa mãn yêu cầu của các ứng dụng thực tế, người ta đã cải tiến kĩ thuật tính toán và đưa ra nhiều thuật toán biến đổi nhanh Cosine.

NÉN DỮ LIỆU ẢNH

Page 38: KĨ THUẬT NÉN ẢNH SỐ

o Phép biến đổi Cosine rời rạc hai chiều.o Phép biến đổi Cosin rời rạc hai chiều được định nghĩa bởi:

o Phép biến đổi ngược được định nghĩa bởi công thức:

NÉN DỮ LIỆU ẢNH

Page 39: KĨ THUẬT NÉN ẢNH SỐ

o Để nâng cao tốc độ biến đổi người ta đã phát triển các giải thuật biến đổi nhanh Cosin hai chiều. Cách làm phổ biến nhất là tận dụng phép biến đổi nhanh Cosin một chiều. Ta biến đổi công thức (7.21) về dạng:

NÉN DỮ LIỆU ẢNH

Page 40: KĨ THUẬT NÉN ẢNH SỐ

o Công thức (7.24) là phép biến đổi Cosin rời rạc một chiều của x(n1, n2 ) , trong đó n2 là biến số, còn n1 đóng vai trò là tham số thu được kết quả trung gian X’(n1,k2). Công thức (7.25) là phép biến đổi Cosin rời rạc của X’(n1,k2) với n1 là biến số còn k2 là tham số.

o Chuẩn nén JPEG: JPEG là viết tắt của Joint Photographic Expert Group ( nhóm các chuyên gia phát triển ảnh này). Chuẩn JPEG được công nhận là chuẩn ảnh quốc tế năm 1990 phục vụ các ứng dụng truyền ảnh cho các lĩnh vực như y học, khoa học, kỹ thuật, ảnh nghệ thuật…

NÉN DỮ LIỆU ẢNH

Page 41: KĨ THUẬT NÉN ẢNH SỐ

o Chuẩn JPEG được sử dụng để mã hóa ảnh đa mức xám, ảnh màu. Chuẩn JPEG cung cấp giải thuật cho cả hai loại nén là nén không mất mát thông tin và nén mất mát thông tin. Sơ đồ thuật toán và giải nén:

NÉN DỮ LIỆU ẢNH

Page 42: KĨ THUẬT NÉN ẢNH SỐ

o Quá trình giải nén sẽ được làm ngược lại, người ta giải mã từng phần ảnh nén tương ứng với phương pháp nén đã sử dụng trong phần nén nhờ các thông tin liên quan ghi trong phần header của file nén. Kết quả thu được là hệ số đã lượng tử. Các hệ số này được khôi phục về giá trị trước khi lượng tử hóa bằng bộ tương tự hóa. Tiếp đó đem biến đổi Cosin ngược ta được ảnh ban đầu với độ trung thực nhất định.

NÉN DỮ LIỆU ẢNH

Page 43: KĨ THUẬT NÉN ẢNH SỐ

o Sơ đồ thuật toán giải nén:

NÉN DỮ LIỆU ẢNH

Page 44: KĨ THUẬT NÉN ẢNH SỐ

Các tham số tiêu chuẩn của chuẩn nén JPEG

NÉN DỮ LIỆU ẢNH

Page 45: KĨ THUẬT NÉN ẢNH SỐ

o Nén JPEG lũy tiến:• Giải pháp nén JPEG lũy tiến được cải tiến từ JPEG tuần tự nên

nhìn chung chúng có nhiều điểm tương đồng. Khi ảnh được nén theo chuẩn JPEG tuần tự, ở bộ giải nén, các block ảnh sẽ được khôi phục theo trình tự từ trái sang phải từ trên xuống dưới. Như vậy, toàn bộ ảnh chỉ được hiển thị lên trên màn hình sau khi nhận được tất cả các gói tin từ phía phát. Trong một số trường hợp, đặc biệt khi truyền ảnh số chất lượng cao qua mạng băng thông hẹp, thời gian truyền ảnh có thể tương đối lâu và người xem phải chờ một thời gian dài.

NÉN DỮ LIỆU ẢNH

Page 46: KĨ THUẬT NÉN ẢNH SỐ

Trên hình vẽ 3.3.18 là các ảnh cho thấy sự khác nhau trong quá trình giải nén JPEG lũy tiến và JPEG tuần tự.

NÉN DỮ LIỆU ẢNH

Page 47: KĨ THUẬT NÉN ẢNH SỐ

Chuẩn nén MPEG: Chuẩn MPEG (Moving Picture Experts Group) là phương pháp nén ảnh động không những làm giảm

dư thừa trong không gian mà còn làm giảm dư thừa giữa các khung ảnh (frame), đây cũng là khác biệt cơ bản so với JPEG là chuẩn nén ảnh tĩnh chỉ làm giảm dư thừa không gian trong một khung ảnh.

Kỹ thuật xử lý tín hiệu trong MPEG: Kỹ thuật bù chuyển động Vì tần số ảnh trong tín hiệu video tương đối cao (25 hoặc 30 ảnh/giây) nên trong các frames nằm gần

nhau thường có nhiều vùng ảnh tương đối giống nhau. Nguyên lý bù chuyển động là tìm ra các vùng ảnh giống nhau hoặc gần giống nhau giữa hai ảnh kế tiếp (gọi là ảnh tham khảo và ảnh dự đoán).

Thông tin về ảnh dự đoán sẽ được truyền đi dưới dạng vector chuyển động tức vector xác định vị trí mới của vùng ảnh thuộc ảnh tham khảo có mặt trong ảnh dự đoán. Quá trình tìm ra vector chuyển động gọi là quá trình xấp xỉ chuyển động (motion estimation), quá trình khôi phục ảnh dựa trên vector này gọi là quá trình bù chuyển động (motion compensation).

Ví dụ kỹ thuật xấp xỉ và bù chuyển động:

Page 48: KĨ THUẬT NÉN ẢNH SỐ
Page 49: KĨ THUẬT NÉN ẢNH SỐ

VD: một ảnh trong chuỗi ảnh MPEG sau khi được bù chuyển động dựa trên các vector chuyển động (các đường thẳng màu xanh). Chỉ tiết ảnh có tốc độ dịch chuyển nhanh (cánh tay vận động viên) sẽ tạo ra các vector chuyển động có độ dài lớn hơn các vector chuyển động trong vùng ảnh nền.

Page 50: KĨ THUẬT NÉN ẢNH SỐ

Mã hóa MPEG: Sơ đồ khối của bộ mã hóa MPEG được trình bày trên hình

Page 51: KĨ THUẬT NÉN ẢNH SỐ

Giải mã MPEG:

Page 52: KĨ THUẬT NÉN ẢNH SỐ

1. CÁC CHUẨN NÉN ẢNH ĐỘNG o Chuẩn H.261• H.261 được phát triển để nén tín hiệu hình ảnh cho dịch vụ truyền

hình hội nghị và video phone qua đường truyền ISDN ở tốc độ px64kbps (p=1..30). Trên đường truyền 64kbps, luồng 48kbps dùng để truyền tín hiệu video, 16kbps – dành cho audio. Kỹ thuật nén ảnh được sử dụng trong chuẩn H.261 sẽ làm nền tảng cho các chuẩn nén sau này như MPEG 1, 2. Trong chuẩn nén H.261 có sử dụng các kỹ thuật nén trong ảnh dựa trên biến đổi DCT, nén liên ảnh với bộ bù chuyển động. H.261 hỗ trợ hai độ phân giải CIF (Common Intermediate Format) và QCIF (Quarter Common Intermediate Format)

CÁC CHUẨN NÉN ẢNH SỐ

Page 53: KĨ THUẬT NÉN ẢNH SỐ

o Chuẩn H.263• Đây là chuẩn nén được cải tiến từ H.261 tạo ra luồng

video tốc độ thấp, có thể truyền trên mạng điện thoại công cộng PSTN. Chuẩn nén H.263 được công nhận năm 1996.

• Giống như H.261, H.263 sử dụng biến đổi DCT cho quá trình nén trong ảnh và ảnh sai số (là hiệu của ảnh gốc và ảnh nén). Chuẩn H.263 hỗ trợ các độ phân giải SQCIF, QCIF, CIF, 4 CIF và 16CIF.

CÁC CHUẨN NÉN ẢNH SỐ

Page 54: KĨ THUẬT NÉN ẢNH SỐ

2. CÁC CHUẨN NÉN ẢNH TĨNH VÀ VIDEOo Chuẩn H.261:• Chuẩn H.261 là chuẩn mã hóa tín hiệu video số đầu tiên được áp

dụng trong thực tế. Việc thiết kế chuẩn H.261 là một nỗ lực tiên phong, các chuẩn mã hóa video toàn cầu sau này (MPEG- 1, MPEG-2/H.262, H.263, và ngay cả H.264) cũng chủ yếu dựa trên chuẩn này.

• Chuẩn H.261 không chỉ định rõ phương pháp mã hóa video (ví dụ: phương pháp dò tìm vector chuyển động). Các nhà thiết kế bộ mã hóa được tự do trong việc đưa ra các giải thuật mã hóa của riêng họ.

CÁC CHUẨN NÉN ẢNH SỐ

Page 55: KĨ THUẬT NÉN ẢNH SỐ

o Chuẩn H.262:• Chuẩn H.262 là một chuẩn mã hóa video số ITU-T. Chuẩn này liên quan đến phần

video của chuẩn ISO/IEC MPEG-2 (được biết dưới cái tên ISO/IEC 13818-2). Chuẩn này được phát triển do sự hợp tác của ITU-T và các tổ chức ISO/IEC JTC 1, và trở thành chuẩn chung cho cả hai tổ chức này. ITU-T Recommendation H.262 và ISO/IEC 13818-2 được phát triển và phát hành dưới dạng là chuẩn quốc tế. Hai tài liệu này mô tả hầu hết tất cả các khía cạnh của chuẩn.

o Chuẩn H.263:• Chuẩn H.263 là chuẩn mã hóa ITU-T thiết kế vào năm 1995/1996 dùng cho giải

pháp mã hóa nén tốc độ truyền thấp cho các dịch vụ hội nghị truyền hình. • Chuẩn H.263 được phát triển như là một phiên bản nâng cấp dựa trên

chuẩn H.261, và chuẩn MPEG-1, MPEG-2.

CÁC CHUẨN NÉN ẢNH SỐ

Page 56: KĨ THUẬT NÉN ẢNH SỐ

o Chuẩn H.264:• Chuẩn H.264, MPEG-4 Part 10, hay AVC (dùng cho Advanced

Video Coding), là một chuẩn mã hóa video số với độ nén cực cao, là kết quả của ITU-T Video Coding Experts Group (VCEG) kết hợp với ISO/IEC Moving Picture Experts Group (MPEG), được xem là sản phẩm thương mại Joint Video Team (JVT). Chuẩn ITU-T H.264 và ISO/IEC MPEG-4 Part 10(ISO/IEC 14496-10) ứng dụng các công nghệ nén ảnh tiên tiến. Phiên bản nháp đầu tiên được hoàn thành vào tháng 05 năm 2003.

• Chuẩn còn được gọi bằng các tên khác H.264/AVC, AVC/H.264, H.264/MPEG-4 AVC, MPEG-4/H.264 AVC nhằm nhấn mạnh tính kế thừa.

o Chuẩn JVT:

CÁC CHUẨN NÉN ẢNH SỐ

Page 57: KĨ THUẬT NÉN ẢNH SỐ

• Chuẩn JVT đã hoàn thành việc nâng cấp, phát triển một số tính năng mở rộng so với chuẩn nguyên thuỷ, được biết dưới tên là Fidelity Range Extensions (FRExt). Các phiên bản mở rộng hỗ trợ mã hóa video với độ trung thực cao bằng cách thức gia tăng độ chính xác lấy mẫu (bao gồm hóa 10-bit và 12-bit) với thông tin màu độ phân gải cao (gồm các cấu trúc lấy mẫu như YUV 4:2:2 và YUV 4:4:4).

CÁC CHUẨN NÉN ẢNH SỐ

Page 58: KĨ THUẬT NÉN ẢNH SỐ

NHÓM 1

1. Nguyễn Duy Hiên

2. Đặng Văn Hiến

3. Nguyễn Minh Hồng

4. Vũ Văn Giang