TRUYỀN THÔNG ĐA PHƯƠNG TIỆN(Multimedia Communication)
1
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TP.HCM
Chương 3: Nguyên ly, ky thuât va chuân nén….
Giảng viên: Ths. Trân Đăc Tôt – Khoa CNTT
Email: [email protected]
Website: www.oktot.com
Facebook: https://www.facebook.com/oktotcom/
MÔN HỌC: TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
2Chương 3: Nguyên ly, ky thuât va chuân nén….
Chương 1: Tổng quan đa phương tiện
Chương 2: Đặc tính yêu cầu của dữ liệu đa phương tiện
Chương 3: Nguyên ly, ky thuât va chuân nén Audio, hinhanh, video
Chương 4: Truyên dữ liệu đa phương tiện trên mang máytính
Chương 5: Môt sô ưng dung truyên thông đa phương tiện
3
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hình anh.
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
4
Muc đich:
Giới thiệu nguyên lý,
Ky thuât và các chuân nén dữ liệu: âm thanh, hình anh và Video
ky thuât sô.
Yêu cầu: Sinh viên nắm vững
Các nguyên lý nén dữ liệu đa phương tiện.
Các ky thuât nén dữ liệu đa phương tiện.
Các chuân nén dữ liệu âm thanh, hình anh và video ky thuât sô
MỤC ĐÍCH – YÊU CẦU
Chương 3: Nguyên ly, ky thuât va chuân nén….
5
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hinh anh
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
6
Giới thiệu
Tại sao phải nén dữ liệu?
Các File Multimedia có dung lượng rất lớn vì thế để có thể lưu trữ haytruyên đi… thì cần thiết phai làm giam dung lượng các File đến mưc cóthể.
Các File Text hay môt sô File khác cũng cần được nén lai để đáp ưng choviệc gửi Mail hay trong các ưng dung khác.
Vấn đê Băng thông mang
Cac vân đê cân giải quyêt
Các nguyên lý cơ ban trong nén dữ liệu, làm sao để đo lường hiệu suấtnén và xếp loai các ky thuât nén ?
Các ky thuât nao có thể nén tôt cho dữ liệu đa phương tiện ?
Dữ liệu gôc có thể được lấy lai chính xác sau khi nén ?
Chuân nén âm thanh, hình anh và video ?
Chương 3: Nguyên ly, ky thuât va chuân nén….
7
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hinh anh
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
8
Nguyên lý nén dữ liệu
Mong muốn nén âm thanh, hình ảnh và video số là để tốc độ bit và
yêu câu lưu trữ có thể quản lý được. Chúng ta nén được dữ liệu nhờ
vào việc khai thác hai nhân tố chính:
Sự dư thừa dữ liệu trong âm thanh, hình anh và video sô.
Đặc tính các giác quan của con người.
1. Sự dư thừa dữ liệu
Âm thanh sô là chuỗi các giá trị lấy mẫu. Môt hình anh là môt mang haichiêu các giá trị lấy mẫu, và video là môt chuỗi hình anh phát ra theo môttôc đô nào đó.
Các giá trị lấy mẫu âm thanh hay hình anh không hoàn toàn đôc lâp. Cácgiá trị lấy mẫu lân cân ít nhiêu có tương quan với nhau. Sự tương quan nàygọi là sự dư thừa.
Loai bỏ sự dư thừa không làm thay đổi ý nghĩa của dữ liệu.
Chương 3: Nguyên ly, ky thuât va chuân nén….
9
Nguyên lý nén dữ liệu
1. Sự dư thừa dữ liệu
Sự dư thừa trong âm thanh sô
Trong hầu hết các trường hợp, các giá tri lấy mẫu âm thanh lân cân thì
tương tự như nhau.
Môt giá trị mẫu kế tiếp có thể được dự đoán ở môt mưc đô nhất định
trên cơ sở giá trị lấy mẫu hiện tai.
Ky thuât nén dùng đặc điểm này được gọi là mã hoá dự đoán
(predictive coding).
Chương 3: Nguyên ly, ky thuât va chuân nén….
10
Nguyên lý nén dữ liệu
1. Sự dư thừa dữ liệu
Sự dư thừa trong âm thanh sô
Trong tiếng nói sô, ta có môt kiểu khác của dư thừa:
Trong đam thoai/lời nói bình thường, chúng ta chỉ phát ra tiếng nói
trong môt tỷ lệ phần trăm rất thấp theo thời gian. Giữa những tiếng
nói phát ra là khoang im lặng.
Các mẫu ưng với các khoang im lặng có thể được loai bỏ mà không
anh hưởng tới ý nghĩa của câu nói.
Ky thuât nén sử dung đặc điểm này được gọi là loai bỏ khoang im
lặng (silence removal).Chương 3: Nguyên ly, ky thuât va chuân nén….
11
Nguyên lý nén dữ liệu
1. Sự dư thừa dữ liệu
Sự dư thừa trong hình ảnh số: Trong hình anh sô, các mẫu lân cân trênmôt dòng quét bình thường là như nhau. Các mẫu lân cân trên nhữngđường quét gần kế nhau thì cũng tương tự nhau.
Sự tương tự này gọi là dư thừa không gian (spacial redundancy).
Dư thừa không gian được loai bỏ bằng ky thuât mã hoá dự đoán và cácky thuât khác (như là mã hoá biến đổi).
Sự dư thừa trong video ảnh số: Video sô là môt chuỗi các hình anh, nhưvây nó cũng có các dư thừa không gian.
Các hình anh lân cân nhau trong môt chuỗi video bình thường là nhưnhau.
Sự tương tự này gọi là dư thừa thời gian (temporal redundancy) và có thểbị loai bỏ bởi ưng dung ky thuât dự đoán giữa các hình anh.
Chương 3: Nguyên ly, ky thuât va chuân nén….
12
Nguyên lý nén dữ liệu
2. Đặc tính của giác quan
Đầu cuôi sử dung audio, hình anh và video là con người.
Con người có thể chịu được môt sô lỗi / mất thông tin mà không anhhưởng đến hiệu qua truyên thông.
Theo nghĩa này các phiên ban nén không cần biểu diễn các mẫu thông tingôc môt cách chính xác.
Điêu này trái với dữ liệu chữ sô, ở đó môt sô dữ liệu mất / lỗi là khôngđược phép.
Môt cách tổng quát, tri giác con người không nhay khi môt sô ít dữ liệu bịmất/lỗi trong audio, hình anh và video.
Đô nhay tri giác khác nhau đôi với các khuôn mẫu tín hiệu khác nhau. Môtsô thông tin quan trọng đôi với nhân thưc của con người hơn những cáikhác.
Từ các đặc tính nhân thưc =>“thông tin đôc lâp trung bình”Chương 3: Nguyên ly, ky thuât va chuân nén….
13
Nguyên lý nén dữ liệu
3. Phân loại các kỹ thuật nén
Có nhiêu ky thuât dùng để nén thông tin đa phương tiện, nó được phân loaitheo nhiêu cách. Nếu phân loai trên cơ sở kết qua của ky thuât nén => Haikiểu phân loai:
Dữ liệu gôc có thể tái tao môt cách chính xác sau khi nén.
Tôc đô bít có thể là hằng sô ở ngo ra của hệ thông nén.
Kỹ thuật nén không mât dữ liệu và nén bị mât dữ liệu (losslessversus, lossy Compression techniques):
Ky thuât nén không mất dữ liệu được dùng để nén các chương trình máytính, hồ sơ pháp lý và bệnh án, theo đó không có lỗi/mất dữ liệu sau nén.Ky thuât này chỉ sử dung các thông kê dữ liệu (data redundance).
Ky thuât nén bị mất dữ liệu dùng để nén audio, hình anh và video, ở đómôt sô lỗi/mất dữ liệu có thể chấp nhân được. Ky thuât này sử dung cácthông kê dữ liệu và đặc tính nhân thưc của con người.
Chương 3: Nguyên ly, ky thuât va chuân nén….
14
Nguyên lý nén dữ liệu
3. Phân loại các kỹ thuật nén
Ky thuât nén tôc đô bit không đổi và nén tôc đô bit thay đổi (CBR: Constant
Bit Rate coding - VBR: Variable Bit Rate coding)
Trong sô hoá audio/video, các mẫu được lấy trong các thời khoang bằng
nhau và biểu diễn với môt sô bit như nhau.
Khi giai nén audio/video thành các dòng bit tôc đô không đổi: Ta gọi ky
thuât mã hoá tôc đô bit không đổi (CBR).
Môt sô ky thuât nén sẽ làm giam tôc đô bit của các dòng, và ta gọi là ky
thuât mã hoá tôc đô bit thay đổi (VBR).
Chương 3: Nguyên ly, ky thuât va chuân nén….
15
Nguyên lý nén dữ liệu
3. Phân loại các kỹ thuật nén
Ky thuât nén tôc đô bit không đổi và nén tôc đô bit thay đổi (CBR: ConstantBit Rate coding - VBR: Variable Bit Rate coding)
Rất quan trọng khi xếp loai môt ky thuât nén là CBR/VBR:
Trước tiên, nôi dung phương tiện thay đổi theo thời gian: Nếu phưctap, nhiêu dữ liệu được sử dung để biểu diễn. Nếu đơn gian, ít dữliệu được sử dung. Ky thuât VBR hiệu qua và cho chất lượng cao ởcùng hệ sô nén.
Thư hai, VBR khó đặc ta và mô hình hóa, khó hỗ trợ bởi hệ thôngtruyên thông đa phương tiện.
Hai nhân tô này dùng trong mô ta khi thiết kế và phát triển hệthông đa phương tiện.
Chương 3: Nguyên ly, ky thuât va chuân nén….
16
Nguyên lý nén dữ liệu
4. Đo lường hiệu năng nén
Hiệu năng của môt ky thuât nén đo bằng môt tâp các tham sô.
Hệ sô nén (compression ratio): là tỷ sô giữa sô lượng dữ liệu gôc và sôlượng dữ liệu sau khi nén.
Chất lượng tái tao phương tiện (reconstructed media quality): Khi sử dungky thuât nén bị mất dữ liệu ta lưu ý: khi hệ sô nén cao thì chất lượng táitao phương tiện thấp.
Đô phưc tap trong cài đặt (Implementation complexity): Càng đơn giantrong cài đặt càng tôt.
Tôc đô nén (compression speed): Nhanh là tôt.
Tôc đô giai nén (decompression speed): Nhanh là tôt.
Khi tôc đô nén và giai nén bằng nhau ta có ky thuât nén đôi xưng(symmetric compression techniques), ngược lai ta có ky thuât nén khôngđôi xưng (asymmetric compression techniques).
Chương 3: Nguyên ly, ky thuât va chuân nén….
17
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hinh anh
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
18
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
Ky thuât nén không mất dữ liệu (Lossness)
Dữ liệu gôc có thể phuc hồi lai hoàn toàn
Tỷ lệ nén thông thường có thể đat được từ 2:1 đến 50:1
Nén không mất dữ liệu được sử dung để nén các chương trình máy tính,
các văn ban luât pháp và các bệnh án. Nó cũng được sử dung kết hợp với
ky thuât nén mất dữ liệu để đat các hệ sô nén cao trong thông tin đa
phương tiện.
Các ky thuât nén không mất dữ liệu khai thác “tính dư thừa thông kê”
(statisticals redundancies) trong dữ liệu được nén.
Chương 3: Nguyên ly, ky thuât va chuân nén….
19
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
Ky thuât nén mất dữ liệu (Lossy)
Có sự khác biệt giữa dữ liệu gôc và dữ liệu được phuc hồi lai sau khi nén
Có sử dung các đặc điểm tâm sinh lý của thính giác và thị giác của con
người trong việc nghiên cưu cho các giai thuât nén.
Tỷ lệ nén đat cao hơn so với các giai thuât nén không tổn hao (từ 100:1)
Các giai thuât nén điển hình: JPEG, MPEG
Nén MP3, Photograph Image, Video
Chương 3: Nguyên ly, ky thuât va chuân nén….
20
Ta dùng thuât ngữ “ký hiệu” (symbol) hoặc “ký tự” (charactere) để chỉ cácký tự văn ban (text characteres), giá trị sô (numbers), giá trị mẫu (samplevalues).
Các giai thuât nén điển hình:
Mã hóa entropy (entropy coding – Huffman code)
Mã hóa đô dài run (run-length coding)
Mã hóa Lempel-Ziv-Welch (LZW coding)
Ma sô học
…
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
21
1. Mã hoá Entropy
Đo lường thông tin
Các ký hiệu khác nhau chuyển tai môt lượng thông tin khác nhau phuthuôc vào xác suất xuất hiện của nó.
Ký hiệu với xác suất xuất hiện cao tai môt lượng thông tin nhỏ.
Ký hiệu với xác suất xuất hiện thấp tai môt lượng thông tin lớn.
Lượng thông tin I được tai trong môt ký hiệu với xác suất xuất hiện pđược định nghĩa bởi: I = log(1/p)
Đơn vị của thông tin là bit, xác suất là các sô thực giữa 0 và 1.
Nếu xác suất p=1 thì log2(1/p)=0. Điêu đó có nghĩa là ký hiệu có xácsuất xuất hiện bằng 1, không mang bất kỳ thông tin mới nào.
Nếu xác xuất rất nhỏ thì log2(1/p) trở nên rất lớn. Như vây, các kýhiệu ít khi xuất hiện sẽ mang môt lượng rất lớn thông tin.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
22
1. Mã hoá Entropy
Đo lường thông tin
Khái niệm này của thông tin hết sưc quan trọng trong nén dữ liệu. Chiêudài mã nén lý tưởng của môt ký hiệu trong nén không mất dữ liệu bằngvới sô bit thông tin của ký hiệu. Các ky thuât nén nhắm tới muc tiêu này.
Thông tin trung bình của mỗi ký hiệu trong môt tâp tin được gọi làentropy H và được định nghĩa bởi công thưc:
Vơi si : Ký hiệu phân biệt thứ i
p(si): Xác suất xuất hiện ký hiệu si
N : Sô các ký hiệu phân biệt trong file
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
23
1. Mã hoá Entropy
Đo lường thông tin
Entropy là giới han dưới cho nén không mất dữ liệu: Khi xác suất xuất
hiện của mỗi ký hiệu là cô định, mỗi ký hiệu sẽ được biểu diễn với trung
bình tôi thiểu là H bit. Các bit được nén gần với entropy H cho hiệu qua
nén tôt hơn (với ky thuât nén không mất).
Ky thuât mã hóa dựa trên “đô dài mã hóa của các ký hiệu khác nhau thay
đổi theo lượng thông tin mà nó tai” được gọi là mã hóa entropy.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
24
Mã hóa Huffman (Huffman Coding)
Hầu hết mã hoá entropy thường được dùng là mã hoá Huffman. Nó gánmôt sô ít bit cho các ký hiệu xuất hiện nhiêu và nhiêu bit cho các ký hiệu ítxuất hiện. Nó có hiệu qua khi các xác suất xuất hiện của các ký hiệu khácnhau rất nhiêu và thường được dùng kết hợp với kế hoach mã hoá.
Gia sử môt file gồm 1000 ký tự, các ký tự trong file là e, t, x, và z xác suấtxuất hiện của chúng trong file lần lượt là 0.8, 0.16, 0.02, và 0.02.
Biểu diễn bình thường (8 bits/ký tự): Như vây ta cần 8000 bit để biểudiễn toàn bô file.
Trong mã hoá Huffman, ta dùng sô lượng
bit khác nhau để biểu diễn các ký tự.
Tổng sô bit yêu cầu là:
1000(1*0.8+2*0.16+3*0.02+3*0.02)=1240 bit
Chương 3: Nguyên ly, ky thuât va chuân nén….
Symbol Probability Code
e 0.8 1
t 0.16 01
x 0.02 001
z 0.02 000
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
25
Mã hóa Huffman (Huffman Coding)
Minh Họa thuât toán ma hóa Huffman:
1. Đặt tất ca các ký hiệu cùng với dòng xác suất xuất hiện theo thư tự nhỏ ởdưới và lớn ở trên.
2. Chọn hai nút có xác suất xuất hiện nhỏ nhất, tao nút cha của chúng với hainhánh gán nhãn là 0 và 1.
3. Nút cha “đai diện” cho hai nút con với xác suất xuất hiện là tổng xác suấtcủa hai con.
4. Lâp lai bước 2. và bước 3. cho tới khi tất ca các ký hiệu nược nôi vào cây.Nút cuôi cùng tao ra gọi là nút gôc (root node)
5. Bắt đầu từ nút gôc, gán bit 1 cho nhánh trên và bit 0 cho nhánh dưới chotất ca các nút.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
26
6. Mã của mỗi ký hiệu cóđược bằng kết hợp các mã từnút gôc qua các nhánh đếnký hiệu.
Trong ví du trên, tổng xácsuất của hai ký hiệu có xácsuất nhỏ nhất luôn nhỏhơn xác suất của ký hiệukế tiếp.
Tuy nhiên khi xác suấtkhác biệt giữa các ký hiệukhông đủ lớn, mã Huffmancó thể giông như mã hoáđồng dang.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
27
Mã hóa Huffman (Huffman Coding)
Mã hoá Huffman có hai thuôc tính quan trọng:
Mã hoá Huffman tao ra các mã chặt (compact codes). Không tìm được
môt mã sô nguyên nào cho hiệu qua hơn mã chặt này.
Chuỗi ký hiệu được mã hoá Huffman luôn được giai mã duy nhất.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
28
Mã hóa Huffman (Huffman Coding)
Giai ma Huffman
1. Đọc vào dòng các bit môt cách tuần tự và chuyển sang cây mã đến khi
môt nút lá được tìm thấy.
2. Khi môt nút lá được xác định, đưa ra ký tự tương ưng đa được mã hoá.
3. Khi đọc vào bit kế tiếp, bắt đầu trở lai với gôc của cây mã.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
29
2. Mã hóa độ dài run (Run-Length Coding)
Mã hoá run-length là phương pháp nén dữ liệu dùng để rút gọn môt cách tựnhiên môt chuỗi ký tự lâp lai bất kỳ.
Dãy xuất hiện lặp lai của môt ký tự gọi là môt run.
Sô ký tự lặp lai gọi là đô dài run (run-length)
Môt run được mã hóa bởi bô ba: với
Sc: Ký tự đặc biệt chỉ mã hoá run-legth được dùng.
X : Ký tự được lâp lai trong run, C : Sô ký tự lâp lai/chiêu dài run (run-length)
Ví du: eeeeeeetnnnnnnnn được mã hóa đô dài run là: @e7t@n8
Sô ký tự “file gôc” = 16; sô ký tự “file nén” = 7.
Lưu ý khi ký tự chỉ xuất hiện 1 lần thì không cần ký tự đặc biệt ‘@’ và đôdài run-length (chỉ xuất hiện chính ký tự đó).
Chương 3: Nguyên ly, ky thuât va chuân nén….
Sc X C
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
30
ZLC (Zero Length Code)
Nếu trong môt thông điệp xuất hiện các chuỗi ký tự 0, có thể thay thế bởimôt ký tự và tần suất xuất hiện.
Cần phai có môt mã dành riêng để biểu thị rằng khi nào chuỗi được thaythế xuất hiện.
Ví du: Cho chuỗi ký tự sau
894000000000000000000000000000000
Code: F – 0
Kết qua: 894F30
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
31
ZLC (Zero Length Code)
Đôi tượng của ZLC
Âm câm (Silence), khoang dừng hôi thoai trong trong nén âm thanh
Bitmaps
Khoang trông trong văn ban, chương trình nguồn
Backgrounds của anh (Image)
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
32
3. Mã hóa Lempel-Ziv-Welch (LZW coding)
• Được Jacob Braham Ziv đưa ra lần đầu tiên năm 1977, sau đó phát
triển thành một họ giải thuật nén từ điển là LZ.
• Năm 1984, Terry Welch cải tiến giải thuật LZ thành một giải thuật
tốt hơn: LZW
• Dùng để giảm dư thừa trong pixel
• Không cần biết trước xác suất phân bố của các pixel
• Thường được dùng để nén các loại văn bản, ảnh đen trắng, ảnh màu,
ảnh đa mức xám... Và là chuẩn nén cho các dạng ảnh GIF và TIFF.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
33
3. Mã hóa Lempel-Ziv-Welch (LZW coding)
Mã hoá LZW làm việc bằng cách xây dựng tự điển (dictionary) của các câu
(nhóm của môt hoặc nhiêu ký tự) từ dòng dữ liệu đầu vào.
Khi môt câu (phrase) xuất hiện, phương tiện nén kiểm tra xem nó đa có
trong tự điển hay chưa ?
Nếu môt câu đa tồn tai trong tự điển, nó đưa ra thẻ bài (token) chỉ
thư tự tự điển của câu và thay thế câu bởi token.
Nếu chưa, câu đó được thêm vào tự điển và môt thẻ bài (token) mới
được tao và đưa ra thay thế câu đó bởi thẻ bài.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
34
3. Mã hóa Lempel-Ziv-Welch (LZW coding)
LZW làm việc rất tôt trên dữ liệu có sự lâp lai của nhóm các ký tự như các
file văn ban. Môt trong các nhân tô tác đông đến hiệu qua nén LZW là
chiêu dài của token. Chiêu dài token lớn sẽ áp dung tôt cho file lớn và
ngược lai.
Ví du: Môt văn ban có 10.000 ký tự (80.000 bit), trong file có 2.000 từ/câu,
trong đó 500 từ / câu khác nhau (cần 9 bit cho mỗi token của tự điển)
=> File sau nén dùng mã hoá LZW = 18.000 bit.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
35
3. Mã hóa Lempel-Ziv-Welch (LZW coding)
Phương pháp trong nén LZW
Từ điển được xây dựng song song với quá trình đọc dữ liệu vào.
Đô dài cho phép của từ mã : 12bits (4096).
0..255: mã hoá ký tự trong bang mã ASCII.
256: mã xoá
257: mã kết thúc (EOI)
258..4096: mã cho mẫu lặp.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
36
3. Mã hóa Lempel-Ziv-Welch (LZW coding)
Đôi tượng của LZW
Nén các loai văn ban
Nén anh đơn mưc xám
Nén anh đa mưc xám
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
37
4. Ma số hoc (Arithmatic Code)
Tai sao phai dùng Mã sô học ?
Mô ta chính xác tần suất xuất hiện của ký tự.
Mô ta thông điệp bởi môt dấu chấm đông trong [0,1].
Dấu chấm đông ngắn nhất được lựa chọn.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
38
4. Ma số hoc (Arithmatic Code)
Giai thuât Mã sô học
1. Bắt đầu với ký tự đầu tiên của dòng dữ liệu vào, với khoang giá trị hiện
thời của chính ký tự này là [0,1].
2. Đọc ký tự tiếp theo, chia khoang giá trị hiện thời theo tần suất xuất hiện
của ký tự này.
3. Nếu chuỗi dữ liệu kết thúc, chuyển sang bước 4. Ngược lai quay lai bước 2
4. Tai khoang giá trị kết thúc, chọn sô dấu chấm đông nhỏ nhất (cân dưới) là
giá trị mã hoá của chuỗi ký tự
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va cac nguyên tắc cơ bản của nén dữ liệu
39
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hình anh.
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
40
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hinh anh.
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
41
Chuẩn nén audio
MP3: ra đời năm 1980 từ viện nghiên cưu Fraunhoufer Institute (Đưc).
– MP3 là nhóm MPEG-1 lớp 3 cung cấp chất lượng audio gần giống
với chất lượng CD ở tốc độ bit thấp
– MP3 hỗ trợ các tần số lấy mẫu khác nhau như: 32kHz; 44,1kHz;
48kHz; tốc độ bit có thể thay đổi từ 32 đến 448kbps
ACC: Ra đời năm 1997 từ Fraunhofer Institue (Đưc) kết hợp với môt sô
công ty như AT&T, Sony, Dolby, là định dang cai tiến của MP3.
OGG: Là định dang nguồn mở được Xiph.org Foundation đê xuất năm
1993, nén tôt và có chất lượng ở tôc đô bit thấp.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va chuẩn nén âm thanh
42
Chuẩn nén audio
WMA: Định dang âm thanh của Microsoft, ra mắt năm 1999, trên lý
thuyết có thể nén 96 kbps với chất lượng của MP3 128 kbps. WMA cũng
phổ biến trong thế giới âm thanh phát trực tuyến.
Realaudio: Định dang của công ty RealNetworks, chủ yếu dùng cho phát
nhac trực tuyến, định dang đầu tiên ra đời năm 1995, đến nay đa có
RealAudio 10
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va chuẩn nén âm thanh
43
MPEG-1
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va chuẩn nén âm thanh
44
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hinh anh.
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
45
Cac kỹ thuật nén ảnh không tổn thât phổ biên
WinZip: Dựa trên thuât toán Lempel-Ziv được phát minh cách đây 30
năm.
GIF (Graphic Interchange Format): Dựa trên thuât toán LZ nâng cao, tao
ra bởi Welch năm 1983.
PNG (Portable Network Graphics)
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va chuẩn nén hình ảnh
Bộ chuyển
đổi
Bộ lượng
tử hóa
Tín hiệu
nén
Bộ mã
hóa
Tín hiệu
gôc
46
Cac tiêu chuẩn nén ảnh
JPEG (The Joint Photographic Expert Group): dung cho nén anh tĩnh, phát
triển bởi sự kết hợp giữa ITU-TS (the International Telecommunications
Union-Telecommunication Sector) va ISO (International Standards
Organization)
MPEG-1, MPEG-2, MPEG-4, MPEG-7: do Uy ban ISO IEC/JTC1/SC29-
/WG11 phát triển cho ma hoá kết hợp giữa video va audio.
H.261: do Nhóm nghiên cưu XI phát triển va được biết rông rai như tiêu
chuân ma hoá video cho các dịch vu nghe nhin tôc đô nx 64Kbps.
ITU-TS H.263 cho các ưng dung điện thoai thấy hinh tôc đô dưới 64Kbps.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Kỹ thuật va chuẩn nén hình ảnh
TỔNG QUAN JPEG 2000
• Ảnh số hóa ngày càng phổ biến và yêu cầu chất
lượng ngày càng cao, ngoài ra còn có các nhu cầu
về xử lí ảnh kéo theo
• Nén hình ảnh không chỉ làm giảm dung lượng mà
còn phải cho phép tách ghép để sắp xếp xử lí và
đáp ứng các nhu cầu trên các thiết bị cụ thể
• Yêu cầu về hiệu suất nén với tỉ số nén cao
SỰ PHÁT TRIỂN CỦA JPEG 2000 LÀ TẤT YẾU
JPEG-2000 có tỉ lệxuyên âm thấp hơn
hẳn công nghệJPEG truyền thống
Cho phép tách cácphân giải khácnhau, các miền
quan tâm và đưa rađược một dòng bit
nén đơn
JPEG-2000 sửdụng kĩ thuật mãhóa dạng sóng rờirạc DWT-Discrete Wavelet Transform
TỔNG QUAN JPEG 2000
ƯU ĐIỂM CỦA JPEG2000 SO VỚI JPEG
Sử dụngđược vơi
truyền dẫn vàhiển thị lũytiến về chấtlượng, độ
phân giải, cácthành phânmàu có tính
định vị khônggian
Sử dụng mộtcơ chế nén
ảnh cho cả 2 dạng thứnén(có tổn thất
và không tổnthất)
JPEG2000 cóthể đưa ra tỷlệ nén cao
hơn nhiều so vơi JPEG. Tỷlệ nén có thểlên tơi 200:1
Có khả năngmã hóa ảnhvơi tỉ lệ néntheo từngvùng khácnhau (ROI)
Chuẩn JPEG2000 và nén ảnh màu
• JPEG2K sử dụng phép biến đổi wavelet và các phương pháp
đặc biệt để có được ảnh nén tối ưu nhất
• Cho chất lượng tốt nhất khi sử dụng nén ảnh tĩnh
• Sử dụng được với truyền dẫn và hiển thị lũy tiến về chất
lượng, độ phân giải.
• Truy cập và giải nén tại mọi thời điểm trong khi nhận dữ liệu
• Giải nén từng vùng ảnh mà không giải nén toàn bộ ảnh
CHUẨN JPEG2K
Các bước nén ảnh trong JPEG 2000
Sơ đồ nén và giải nén trong jpeg 2000
CHUẨN JPEG2000 VÀ NÉN ẢNH MÀU
Xử lý
trước biến
đổi
Mã hóa
Biến đổi liên
thành phầnBiến đổi riêng
thành phầnLượng tử
hóa
Ảnh
nén
• Các bước thực hiện nén ảnh theo chuẩn JPEG2K
Các bước nén ảnh trong JPEG 2000
BƯỚC 1: Xử lý trước biến đổi
Xử lý trước biến đổi chính là giai đoạn đảm bảo dữ liệuđưa vào nén ảnh có dạng đối xứng qua 0
Các bước nén ảnh trong JPEG 2000
Bước 2: biến đổi liên thành phần
Loại bỏ tính tươngquan giữa các thành
phần của ảnh
Chuyển từ RGB sang YCrBr sử dụng
ICT và RCT
Làm tăng hiệu quảnén
Các bước nén ảnh trong JPEG 2000
Bươc 3: Biến đổi riêng thành phân (biến đổi Wavelet)
Sử dụng biến đổi wavelet. Chia tín hiệu thành các băng
con và mỗi băng sẽ đượcmã hóa riêng rẽ
Thường sử dụng hàmwavelet Daubechies
Các bước nén ảnh trong JPEG 2000
BƯỚC 4 : Lượng tử hóa
Cho phép đạt tỉ lệ nén cao hơnbằng cách thể hiện các giá trị
biến đổi với độ chính xác tươngứng cần thiết với mức chi tiết
của ảnh cần nén.
Các hệ số biến đổi sẽ đượclượng tử hoá theo phép lượng
tử hoá vô hướng
Các bước nén ảnh trong JPEG 2000
Bước 5 : Mã hóa
JPEG-2000 cho phép sử dụngnhiều phương pháp mã hóa
khác nhau
Trong thực tế sử dụng 2 phương pháp phổ biến là
SPIHT và EZW
Các bước nén ảnh trong JPEG 2000
SPIHT
Là viết tăt của Set Partitioning in
Hierarchical Trees
-phương pháp mã hoá phân cấp theo
phân vùng
SPIHT được thiết kế tôi ưu cho truyền
dẫn luy tiến
Sử dụng ky thuât embedded coding
- Có nghĩa là: một ảnh saunén vơi kích cỡ (lưu trữ) lơn
(tỷ lệ nén thấp) sẽ chứa chínhdữ liệu sau nén của ảnh cókích cỡ (lưu trữ) nhỏ (tỷ lệ
nén cao)
Các bước nén ảnh trong JPEG 2000
EZW
Viết tăt củaEmbedded
Zerotree Wavelet Encoder
Cũng dựa trênphương pháp mã
hóa lũy tiến
Phương pháp nàychủ yếu dựa trênkhái niệm về câyzero (zerotree).
CHUẨN JPEG2000 VÀ NÉN ẢNH MÀU
Xử lý sau
biến đổi
Giải mãBiến đổi
ngược liên
thành phần
Biến đổi
ngược riêng
thành phần
Gải lượng
tử hóa
Ảnh
nén
• Giải nén: Làm ngược lại các bước trên
Các chuẩn nén ảnh hiện nay
Các định dạng ảnh và tỉ lệ nén:
1600x1200 5760KB
BMP 5626KB
TGA 5626KB
PGM 5626KB
PBM 5626KB
TIF 5565KB
PNP 4405KB
XPM 3759KB
GIF 1802KB
JPEG 754KB
Ưu điểm của chuẩn nén JPEG2k
JPEG và JPEG2k
JPEG và JPEG2k
66
CHƯƠNG 3: NGUYÊN LY, KY THUÂT VA CHUẨN NÉN AUDIO, HINH ANH, VIDEO
Giới thiệu.
Nguyên ly nén dữ liệu.
Ky thuât va các nguyên tắc cơ ban của nén dữ liệu.
Ky thuât va chuân nén âm thanh.
Ky thuât va chuân nén hinh anh.
Ky thuât va chuân nén Video.
Chương 3: Nguyên ly, ky thuât va chuân nén….
Các chuẩn nén video
MPEG
• MPEG-1 ~ 1-1.5Mbps (early 90s)– For compression of 320x240 full-motion video at rates around
1.15Mb/s
– Applications: video storage (VCD)
• MPEG-2 ~ 2-80Mbps (mid 90s)– For higher resolutions
– Support interlaced video formats and a number of features for HDTV
– Address scalable video coding
– Also used in DVD
• MPEG-4 ~ 9-40kbps (later 90s)
– For very low bit rate video and audio coding
– Applications: interactive multimedia and video telephony
• MPEG-21 ~ ongoing
MPEG
70
MPEG-7
• To serve the need of audiovisual content-based retrieval (or audiovisual object
retrieval) in applications such as digital libraries.
• The formal name Multimedia Content Description Interface.
71
MPEG-7 and Multimedia Content Description
• MPEG-7 has developed Descriptors (D), Description Schemes (DS) and Description
Definition Language (DDL). The following are some of the important terms:
– Feature - characteristic of the data.
– Description - a set of instantiated Ds and DSs that describes the structural and
conceptual information of the content, the storage and usage of the content, etc.
– D - definition (syntax and semantics) of the feature.
– DS - specification of the structure and relationship between Ds and between DSs.
– DDL - syntactic rules to express and combine DSs and Ds.
• The scope of MPEG-7 is to standardize the Ds, DSs and DDL for descriptions. The
mechanism and process of producing and consuming the descriptions are beyond the
scope of MPEG-7.
• Tiêu chuẩn MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh.
• Phương pháp nén có tổn hao dựa trên sự biến đổi DCT
• Bu chuyển động.
• MPEG dung biểu diên màu bằng YCrCb.
MPEG
74
1. Giai thích tai sao ta có thể nén file văn ban không mất bất kỳ thông tin
nào.
2. Giai thích tai sao ta có thể nén âm thanh và video sô với hệ sô nén cao
hơn các tài liệu dang văn ban.
3. Ky thuât nén mất và không mất là gì? Các ưng dung nào sẽ được sử
dung? Tai sao?
4. Chúng ta đánh giá hiệu qua môt ky thuât nén như thế nào? Các đặc tính
được dùng để chọn ky thuât nén trong các ưng dung videophony ở tôc đô 64
Kbit/s.
5. Nguyên tắt mã hoá Huffman là gì?
CÂU HỎI BAI TÂP
Chương 3: Nguyên ly, ky thuât va chuân nén….
75
Chúng ta đa giới thiệu nhiêu ky thuât nén hình anh và âm thanh. Vì videoyêu cầu nhiêu băng thông, các ky thuât nén hình anh và video được nhấnmanh. Để có được môt hệ sô nén cao tai môt vài chất lượng hình anh, môttổ hợp của các ky thuât này đa được ưng dung trong các hệ thông thựchành. Việc chọn môt phương pháp nào đó phu thuôc rất nhiêu vào ưngdung. Năm chuân nén quôc tế cho mã hóa nghe nhìn đa được đê nghị chocác ưng dung khác nhau. Kha năng và ưng dung chính có thể tóm tắt nhưsau:
JPEG: Nén anh tỉnh, màu, trắng đen, video chuyển đông.
H.261: Nén video trong Videophony, videoconferencing.
MPEG-1: VHS-quality video (1.5 Mbps), video storage applications – MPEG-2: Studio-quality video (4 Mbps), HDTV (20 Mbps).
MPEG-4: very-low-bit-rate video applications, personal videophony.
MPEG AUDIO (MPEG-1, 2, 4): Nén âm thanh CD-quality.
H.263: Nén video cho videophony (64 Kbps) mobile communication.
JBIG: Nén anh nhị phân (bilevel image) facsimile transmission.
TÓM LƯỢC BAI HỌC
Chương 3: Nguyên ly, ky thuât va chuân nén….
CAM ƠN
76
Một số nội dung môn hoc được tham khảo từ:
Jerry D. Gibson, Multimedia Communications, Academic Press, 2001.
Bai giang Truyên thông đa phương tiện, ĐH Cần Thơ.
Bai giang Truyên thông đa phương tiện, Học Viện KTQS.
77
Câu hỏi ?
Ý kiên ?
Đê xuât ?