I. SỐ HÓA HÌNH ẢNH
a) Rời rạc hóa hình ảnh và các điểm ảnh
- Người ta dùng lưới ô vuông để chia hình ảnh thành nhiều ô vuông rất nhỏ, mỗi ô vuông gọi là một phần tử ảnh.
Có thể coi một phần tử ảnh là một ô vuông đồng màu duy nhất, thuật ngữ tin học là pixel, hay thông dụng hằng ngày là điểm ảnh.
Điểm ảnh và độ phân giải
- Độ phân giải điểm ảnh thể hiện bằng cặp hai số đếm điểm ảnh theo chiều ngang và chiều cao. Tích hai số này là tổng số điểm ảnh làm nên hình ảnh.
- Cùng một kích thước, số điểm ảnh càng cao thì ảnh càng mịn, ta nói ảnh có độ phân giải cao.
b) Hệ màu và rời rạc hóa màu
Hệ màu RGB
- Ba màu cơ sở: đỏ, xanh lục, xanh lam trộn chúng với nhau theo những tỉ lệ khác nhau sẽ tạo ra đủ các màu sắc.
- Hệ màu RGB dành một byte để thể hiện cường độ của mỗi màu trong tổ hợp.
+ Mỗi giá trị cường độ của mỗi màu biến thiên từ 0 đến 255.
+ hệ màu RGB có số lượng màu là 16 777 216 .
- Rời rạc hóa màu: cho tương ứng mỗi màu với một dãy bit nhất định gọi là mã nhị phân của màu, màu khác nhau thì mã nhị phân khác nhau.
- Độ sâu màu: độ dài dãy bit để rời rạc hóa màu.
Hoạt động 1:
1) Khi chọn More Colors thì hộp thoại Colors như hình bên hiển thị nhiều màu hơn bảng Theme Colors cho người dùng chọn.
Khi nháy chuột vào bất cứ điểm nào trong hình vuông ta nhận được một màu cụ thể.
2) Chỉ cần nháy chuột vào hình vuông, mã màu RGB tự động xuất hiện.
c) Số hóa hình ảnh
Sau khi rời rạc hóa hình ảnh, sắp xếp mã nhị phân màu của các điểm ảnh nối tiếp nhau từ trái sang phải, từ trên xuống dưới, ta sẽ nhận được dãy bit biểu diễn ảnh số.
II. SỐ HÓA ÂM THANH
a) Tín hiệu âm thanh
Hoạt động 2:
Hình 2 minh họa sóng âm thành truyền qua không khí đến tai người nghe.
Kết luận:
Tai người nghe được âm thanh là do sóng âm truyền qua môi trường làm rung màng nhĩ. Đồ thị biểu diễn của sóng âm có dạng một đường cong liên tục, lên xuống nhấp nhô. Đồ thị này là dữ liệu dạng tương tự mang thông tin âm thanh.
b) Lấy mẫu tín hiệu âm thanh theo thời gian
- Các điểm ảnh biến đổi về màu sắc trên mặt phẳng hai chiều. Một đoạn âm thanh biến đổi cao độ (trầm hay bổng), cường độ (mạnh hay yếu) theo thời gian. Đồ thị dạng hình sóng thể hiện những biến đổi này theo thời gian.
- Người ta rời rạc hóa đồ thị liên tục dạng hình sóng thành nhiều mẫu (đoạn) rất ngắn nối tiếp nhau theo trục thời gian (trục hoành).
- Vì mỗi mẫu rất ngắn nên có thể coi là một đoạn thẳng nằm ngang. Dãy các đoạn thẳng nằm ngang sẽ xấp xỉ đường cong đồ thị ban đầu.
c) Lượng tử hóa
- Quá trình chuyển đổi giá trị mẫu liên tục thành các giá trị rời rạc được gọi là lượng tử hóa.
- Có nhiều kĩ thuật lượng tử hóa, trong đó có chia giải biên độ tín hiệu thành khoảng cố định bằng nhau và được gán một con số được gọi là hiệu khoảng.
- Mỗi mẫu âm thanh thu được ở bước trên sẽ thuộc một trong những khoảng biên độ và nó được gán số hiệu khoảng.
d) Biểu diễn nhị phân
Biểu diễn số hiệu khoảng thành số nhị phân, xếp các dãy bit liên tục theo thời gian, ta sẽ nhận được dãy bit là dữ liệu âm thanh số.
III. MÃ KÍ TỰ, BỘ KÍ TỰ VÀ MÃ NHỊ PHÂN
Từ các kí tự cho đến mã nhị phân của nó được chia làm hai bước:
- Bước thứ nhất: Cho tương ứng mỗi kí tự với một mã kí tự duy nhất, là một dãy kí số.
+ Gán một điểm mã duy nhất cho mỗi kí tự, kí hiệu, biểu tượng,… được dùng trong tất cả các ngôn ngữ khác nhau trên thế giới. Mỗi điểm mã có một tên gọi.
+ Không gian mã Unicode chia thành các khối, một khối mã sẽ được dành riêng cho một ngôn ngữ cụ thể.
Ví dụ: Với từ “Việt Nam” ta có các điểm mã Unicode
- Bước thứ hai: mã hóa. Kết quả bước này là một dãy bit. Đây là mã nhị phân của kí tự.
+ Có nhiều cách thực hiện khác nhau.
+ Các bộ kí tự UTF-8, UTF-16, UTF-32 được hiểu là các thực thi khác nhau chuyển mã kí tự Unicode.
IV. DỮ LIỆU VĂN BẢN VÀ SỐ HÓA VĂN BẢN
Hoạt động 2:
1)
a) Tệp có kích thước 30 byte.
b) Mỗi kí tự là 1 byte.
2)
a) Tệp có kích thước chắc chắn hơn 30 byte.
b) Vì đã thêm các kí tự xuống dòng, các thông tin về màu sắc,...
Văn bản thuần chữ
- Chỉ gồm các kí tự gõ nhập từ bàn phím khi soạn thảo văn bản. Văn bản thuần chữ là một dãy các kí tự xếp liên tiếp từ trái sang phải, từ trên xuống dưới. Mỗi kí tự là dãy bit.
Dữ liệu văn bản:
Dữ liệu văn bản trong máy tính là một dãy bit biểu diễn các kí tự có kiểu dáng, màu sắc và các thông tin định dạng khác.
V. KÍ TỰ TIẾNG VIỆT TRONG DỮ LIỆU VĂN BẢN
- Hiện nay tiêu chuẩn Việt Nam đã thống nhất dùng bảng mã kí tự Unicode.
Hoạt động 3:
TCVN3: bảng mã tiêu chuẩn cũ của Việt Nam.
+ Có thể sử dụng bộ gõ tiếng Việt Unikey để chuyển đổi các văn bản theo tiêu chuẩn cũ sang dùng Unicode để phù hợp tiêu chuẩn mới.