Xử lý dữ liệu ảnh: Một số kiến thức căn bản – Công ty cổ phần VinBigData

Học sâu đã có tác động to lớn đến nhiều lĩnh vực công nghệ khác nhau trong vài năm qua. Một trong những chủ đề nóng nhất được bàn tán sôi nổi trong ngành công nghiệp này là thị giác máy tính, với khả năng của máy có thể tự hiểu hình ảnh và video. Xe tự lái, sinh trắc học và nhận dạng khuôn mặt đều dựa vào thị giác máy tính để hoạt động. Và cốt lõi của thị giác máy tính không gì khác ngoài xử lý hình ảnh. Nếu là một “newbie” trong ngành này, bài viết dưới đây sẽ là một gợi mở hữu ích, giúp bạn nắm được các khái niệm căn bản về xử lý dữ liệu hình ảnh.

Dữ liệu hình ảnh là gì?

Một hình ảnh được định nghĩa là một hàm hai chiều, F (x, y), trong đó x và y là các tọa độ không gian, và biên độ của F tại bất kỳ cặp tọa độ (x, y) nào được gọi là cường độ của hình ảnh tại điểm đó. Khi các giá trị x, y và biên độ của F là hữu hạn, ta gọi nó là hình ảnh số hóa (digital image). Nói cách khác, một hình ảnh có thể được xác định bởi một mảng hai chiều, sắp xếp cụ thể theo hàng và cột.

Hình ảnh số hóa bao gồm một số lượng hữu hạn các phần tử, mỗi phần tử có một giá trị cụ thể tại một vị trí cụ thể. Các phần tử này được gọi là phần tử hình ảnh (picture elements, image elements hay pixel, trong đó pixel là thuật ngữ thông dụng nhất).

Hình ảnh được biểu thị bằng kích thước (chiều cao và chiều rộng) dựa trên số lượng pixel. Ví dụ: nếu kích thước của hình ảnh là 500 x 400 (chiều rộng x chiều cao), thì tổng số pixel trong hình ảnh là 200000.

Các loại hình ảnh

  • Ảnh nhị phân: Đúng như tên gọi, ảnh nhị phân chỉ chứa những pixel có giá trị 0 hoặc 1 trong đó 0 chỉ màu đen và 1 chỉ màu trắng. Hình ảnh này còn được gọi là Đơn sắc.
  • Ảnh đen-trắng
  • Ảnh màu 8 bit: Đây là định dạng hình ảnh nổi tiếng nhất, có 256 sắc thái màu khác nhau và thường được gọi là hình ảnh thang độ xám. Trong định dạng này, 0 chỉ màu đen, và 255 chỉ màu trắng, và 127 chỉ màu xám.
  • Ảnh màu 16 bit: Đây là định dạng ảnh màu có 65.536 màu sắc khác nhau, nó còn được gọi là định dạng màu cao. Ở định dạng này, sự phân bố màu sắc không giống như hình ảnh Thang độ xám mà thường được chia thành 3 kênh màu Đỏ, Xanh lục và Xanh lam.

Xử lý ảnh là gì?

Xử lý ảnh là quá trình chuyển đổi một hình ảnh sang dạng kỹ thuật số và thực hiện các thao tác nhất định để nhận được một số thông tin hữu ích từ hình ảnh đó. Hệ thống xử lý hình ảnh thường coi tất cả các hình ảnh là tín hiệu 2D khi áp dụng một số phương pháp xử lý tín hiệu đã xác định trước.

Các loại xử lý hình ảnh chính:

  • Nhận diện – Phân biệt hoặc phát hiện các đối tượng trong hình ảnh
  • Làm sắc nét và phục hồi – Tạo hình ảnh nâng cao từ hình ảnh gốc
  • Nhận dạng mẫu – Đo các mẫu khác nhau xung quanh các đối tượng trong hình ảnh
  • Truy xuất – Duyệt và tìm kiếm hình ảnh từ một cơ sở dữ liệu lớn gồm các hình ảnh kỹ thuật số tương tự như hình ảnh gốc

Các bước xử lý hình ảnh cơ bản

  • Thu thập ảnh: Thu thập hình ảnh là bước đầu tiên trong quá trình xử lý hình ảnh, hay còn được gọi là tiền xử lý. Nó liên quan đến việc lấy hình ảnh từ một nguồn, thường là nguồn dựa trên phần cứng.
  • Tăng cường hình ảnh: Tăng cường hình ảnh là quá trình làm nổi bật các đặc điểm trong hình ảnh đã bị che khuất, bằng cách thay đổi độ sáng, độ tương phản, v.v.
  • Phục hồi hình ảnh: Phục hồi hình ảnh là quá trình cải thiện hình ảnh, sử dụng các mô hình toán học hoặc xác suất nhất định.
  • Xử lý hình ảnh màu: Xử lý ảnh màu bao gồm một số kỹ thuật tạo mô hình màu trong miền kỹ thuật số.
  • Wavelets và xử lý đa phân giải: Wavelet được sử dụng để biểu diễn hình ảnh ở nhiều mức độ phân giải khác nhau.
  • Nén: Nén là một quá trình được sử dụng để giảm dung lượng lưu trữ hoặc băng thông cần thiết để truyền tải hình ảnh đó.
  • Xử lý hình thái: Xử lý hình thái liên quan đến các kỹ thuật trích xuất thành phần của ảnh nhằm phục vụ việc biểu diễn và mô tả hình dạng.
  • Phân đoạn: Phân đoạn là một trong những bước xử lý ảnh khó nhất, liên quan đến việc phân vùng một hình ảnh thành các phần hoặc đối tượng cấu thành của nó.
  • Trình bày và mô tả: Sau khi một hình ảnh được phân đoạn thành các vùng, mỗi vùng được đại diện và mô tả ở dạng phù hợp cho quá trình xử lý tiếp theo. Phần trình bày liên quan đến đặc điểm của hình ảnh và thuộc tính vùng. Mô tả đề cập đến việc trích xuất thông tin định lượng giúp phân biệt một lớp đối tượng với lớp khác.
  • Nhận dạng: Nhận dạng gán nhãn cho một đối tượng dựa trên mô tả của nó.