[Cẩm nang AI] Artificial Neural Network là gì? Cấu trúc, cách hoạt động và ứng dụng của mô hình này
Trong phần hướng dẫn về ANN (Artificial Neural Network) này, chúng ta sẽ cùng tìm hiểu về mạng nơ ron nhân tạo. Cụ thể, chúng ta sẽ nghiên cứu qua cách làm việc và các loại cấu trúc, phân loại cũng như ứng dụng của ANN. Cuối cùng, chúng ta sẽ tìm hiểu về mạng Bayesian (Bayesian Network) trong trí tuệ nhân tạo AI.
Tìm hiểu về Artificial Neural Network
Mạng lưới nơron trong trí tuệ nhân tạo (ANN) là gì?
ANN là viết tắt của Artificial Neural Networks. Về cơ bản, đây là một mô hình tính toán, chúng được xây dựng dựa trên cấu trúc và chức năng của mạng lưới nơ ron trong Sinh học (mặc dù cấu trúc của ANN sẽ bị ảnh hưởng bởi một luồng thông tin). Do đó, mạng nơ ron này sẽ thay đổi, chúng phụ thuộc vào đầu vào và đầu ra.
Chúng ta có thể coi ANN là dữ liệu thống kê phi tuyến. Điều này đồng nghĩa với một mối quan hệ phức tạp, được xác định giữa đầu vào và đầu ra. Kết quả là chúng tôi sẽ có nhiều mẫu khác nhau.
Cấu trúc của mạng nơron nhân tạo
ANN lấy ý tưởng từ cách hoạt động của bộ não con người – tạo ra các kết nối phù hợp. Do đó, ANN đã sử dụng các silicon và dây điện để làm nơ ron và đuôi gai sống cho mình.
Trong cơ thể con người, 1 phần não đã bao gồm 86 tỉ tế bào thần kinh và chúng được kết nối với hàng nghìn tế bào khác thông qua Axons. Bởi vì con người có rất nhiều đầu vào thông tin khác nhau từ các giác quan, nên cơ thể cũng có nhiều đuôi gai để giúp truyền thông tin này.
Chúng sẽ tạo ra xung điện để di chuyển, truyền thông tin trong mạng lưới nơ ron thần kinh này. Và điều này cũng tương tự cho mạng nơ ron nhân tạo ANN – Khi cần xử lý các vấn đề khác nhau, nơ-ron sẽ gửi một thông điệp đến một nơ-ron khác.
Cấu trúc cơ bản của mạng nơ ron nhân tạo ANN
Do đó, chúng ta có thể nói rằng ANN sẽ bao gồm nhiều nút bên trong, chúng bắt chước các tế bào thần kinh sinh học bên trong não người. Các mạng ANN sẽ kết nối các nơ-ron này bằng các liên kết và chúng có tương tác với nhau.
Các nút trong ANN được sử dụng để lấy dữ liệu đầu vào. Hơn nữa, việc thực hiện các thao tác trên dữ liệu cũng rất đơn giản. Sau khi thực hiện những thao tác với dữ liệu, các hoạt động này được chuyển cho các tế bào thần kinh khác. Đầu ra tại mỗi nút được gọi là giá trị kích hoạt hoặc giá trị nút của nó.
Mỗi liên kết trong mạng ANN đều có liên quan với trọng lượng. Ngoài ra, chúng có khả năng học hỏi. Điều đó sẽ diễn ra bằng cách thay đổi các giá trị trọng lượng. Dưới đây là một hình minh họa về một ANN đơn giản:
Mô hình ANN đơn giản
Các loại mạng thần kinh nhân tạo ANN
Hiện nay đang có hai loại ANN là FeedForward và Feedback.
I. FeedForward ANN
Mạng FeedForward ANN có luồng thông tin một chiều. Một đơn vị sẽ được sử dụng để gửi thông tin cho một đơn vị khác mà không nhận được bất kỳ thông tin nào. Ngoài ra, chúng sẽ không xuất hiện vòng phản hồi (gửi ngược thông tin về lại). Mô hình này thường được sử dụng để nhận dạng một mẫu cụ thể, vì chúng chứa các đầu vào và đầu ra cố định.
II. FeedBack ANN
Trong mạng Nơron nhân tạo này, chúng sẽ cho phép các vòng lặp phản hồi. Chúng ta thường sử dụng mô hình này trong các bộ nhớ có thể giải quyết nội dung.
Mô hình Feedback ANN
Cách hoạt động của mạng Nơ ron nhân tạo ANN
Bạn có thể quan sát các sơ đồ cấu trúc liên kết chi tiết của mạng Nơron nhân tạo ANN. Trong sơ đồ này, mỗi mũi tên sẽ đại diện cho 1 kết nối giữa 2 tế bào thần kinh. Ngoài ra, chúng còn có thể sử dụng để mô tả con đường cho các luồng thông tin. Như bạn nhận thấy, mỗi liên kết đều có một trọng số là số nguyên, chúng ta sử dụng chúng để điều khiển tín hiệu giữa 2 tế bào thần kinh.
Nếu như đầu ra của ANN tốt, chúng ta không cần điều chỉnh trọng số. Ngược lại, nếu đầu ra không tốt như mong đợi, hệ thống sẽ cần phải thay đổi trọng lượng để cải thiện kết quả.
Học máy trong ANN
Hiện nay, có rất nhiều chiến lược máy học:
I. Học tập có giám sát
Trong việc học này sẽ có một giáo viên hiện diện để giảng dạy. Giáo viên đó phải nhận thức được ANN.
Ví dụ: Giáo viên chỉ cung cấp dữ liệu mẫu và đồng thời, giáo viên phải đã biết câu trả lời.
II. Học tập không giám sát
Nếu không có tập dữ liệu mẫu, chúng ta sẽ cần đến kỹ thuật học tập này.
III. Học tăng cường (Reinforcement Learning)
Kỹ thuật máy học này được phát triển dựa trên sự quan sát. Nếu kỹ thuật này trả về kết quả không như mong đợi, các mạng ANN cần phải điều chỉnh trọng số của nó.
Thuật toán lan truyền ngược (Back Propagation Algorithm)
Nói chung, chúng ta có thể gọi nó là thuật toán đào tạo và học tập, vì những mạng này là lựa chọn lý tưởng cho các nhiệm vụ liên quan đến ánh xạ và nhận dạng các mẫu đơn giản.
Mạng Bayesian (BN)
Về cơ bản, chúng ta có thể gọi nó là cấu trúc đồ họa. Thông thường, chúng ta sử dụng mạng này để đại diện cho xác suất, gồm một tập hợp các biến ngẫu nhiên. Mạng này còn có những tên gọi khác là mạng Belief hoặc Bayes Nets.
Trong các mạng này, mỗi nút đại diện cho một biến ngẫu nhiên với các mệnh đề cụ thể.
Vòng cung hạn chế duy nhất này hiện diện trong BN. Do đó, bạn không cần phải trả về nút bằng cách đi theo các cung có hướng.
Chúng ta có thể nói BN được gọi là đồ thị vòng quay có hướng (Directed Acyclic Graphs – DAG). Thường thì ta sẽ sử dụng BN để xử lý đồng thời các biến đa giá trị.
Các biến trong BN bao gồm hai chiều:
– Phạm vi giới từ
– Xác suất gán cho mỗi giới từ.
Ứng dụng của mạng thần kinh nhân tạo ANN
Mạng thần kinh nhân tạo ANN được sử dụng để thực hiện nhiều nhiệm vụ khác nhau. Các nhiệm vụ này có thể khó thực hiện với con người nhưng sẽ phù hợp hơn đối với máy móc.
I. Không gian vũ trụ
Chúng ta có thể sử dụng ANN cho các máy bay lái tự động. Chúng được sử dụng để phát hiện những lỗi còn sót trong máy bay.
II. Quân sự
Chúng ta có thể sử dụng ANN trong quân đội theo nhiều cách khác nhau, chẳng hạn như định hướng và sử dụng vũ khí, theo dõi mục tiêu.
III. Thiết bị điện tử
Về cơ bản, chúng ta sẽ sử dụng mạng nơ-ron nhân tạo ANN trong điện tử theo nhiều cách, ví dụ như dự đoán chuỗi mã, cách bố trí chip IC và phân tích lỗi chip.
IV. Y khoa
Ngành y tế có quá nhiều máy móc, và do đó, chúng ta có thể sử dụng ANN theo nhiều cách khác nhau, chẳng hạn như phân tích tế bào ung thư, điện não đồ và phân tích điện tâm đồ.
V. Giọng nói
Chúng ta có thể sử dụng ANN trong nhận dạng giọng nói và phân loại giọng nói.
VI. Viễn thông
Nói chung, trong ngành viễn thông thì có nhiều ứng dụng khác nhau. Do đó, chúng ta sẽ sử dụng mạng nơron nhân tạo ANN theo nhiều cách, chẳng hạn như nén hình ảnh và dữ liệu, các dịch vụ thông tin tự động.
VII. Vận tải
Nói chung, chúng ta sẽ sử dụng mạng nơ-ron nhân tạo trong giao thông vận tải theo nhiều cách, ví dụ như làm một hệ thống chẩn đoán phanh xe tải hoặc hệ thống lập lịch trình cho xe di chuyển, hệ thống định tuyến.
VII. Phần mềm
Chúng ta cũng sử dụng ANN trong nhận dạng mẫu, chẳng hạn như nhận dạng khuôn mặt, nhận dạng ký tự quang học,…
VII. Dự đoán chuỗi thời gian
Chúng ta sẽ sử dụng mạng nơ-ron nhân tạo ANN để dự đoán thời gian hoặc là để đưa ra dự đoán về thiên tai.
Phần kết luận
Vậy là trong cẩm nang AI này, chúng ta đã cùng nghiên cứu về mạng Nơ ron trong trí tuệ nhân tạo AI. Bên cạnh đó, bạn cũng đã tìm hiểu về các cấu trúc, phân loại cũng như nguyên tắc hoạt động của các mạng này. Hy vọng qua cẩm nang AI này của Viettel IDC, bạn đã hiểu hơn về khái niệm mạng nơ ron nhân tạo.
>> Xem tiếp: Bài 16: Hệ thống Logic mờ (Fuzzy Logic) là gì?
>> Xem lại: Bài 14: Các thuật toán tìm kiếm phổ biến trong AI
Để tìm hiểu thêm về giải pháp Giám sát & Ứng dụng AI, vui lòng liên hệ đến Viettel IDC:
– Hotline: 1800.8088 (miễn phí cước gọi)
– Fanpage: https://www.facebook.com/viettelidc
– Website: https://viettelidc.com.vn