Fully Connected Layer Là Gì

  -  

Bài này đang reviews về convolutional neural network, sẽ tiến hành cần sử dụng Khi đầu vào của neural network là ảnh. Mọi người đề xuất hiểu trước bài xích neural network và giải pháp xử lý ảnh trước khi bước đầu bài bác này.

Bạn đang xem: Fully connected layer là gì


Thiết lập bài xích toán

Gần phía trên Việc kiểm tra mã captphụ thân nhằm xác minc không hẳn robot của google bị chính robot thừa qua


*
Mô hình neural network.

Mỗi hidden layer được Gọi là fully connected layer, tên gọi theo như đúng chân thành và ý nghĩa, từng node vào hidden layer được liên kết với tất cả những node trong layer trước. Cả quy mô được hotline là fully connected neural network (FCN).

Vấn đề của fully connected neural network với xử lý ảnh

Nlỗi bài xích trước về cách xử lý hình họa, thì ảnh màu sắc 64*64 được biểu diễn dưới dạng 1 tensor 64*64*3. Nên để thể hiện hết ngôn từ của tấm hình thì nên truyền vào input đầu vào layer tất cả các pixel (64*64*3 = 12288). Nghĩa là đầu vào layer giờ có 12288 nodes.


*

Tuy nhiên hình họa color gồm tới 3 channels red, green, blue nên những lúc màn trình diễn hình ảnh bên dưới dạng tensor 3 chiều. Nên ta cũng biến thành khái niệm kernel là 1 trong tensor 3D kích thước k*k*3.

Xem thêm: Take The Form Of Là Gì - Take The Form Of Sb/ Sth Có Nghĩa Là Gì


*
Sau pooling layer (2*2).Source: http://cs231n.github.io/convolutional-networks/

Có 2 loại pooling layer thông dụng là: max pooling và average pooling.


*
lấy một ví dụ mô hình convolutional neural network. Source: https://www.easy-tensorflow.com/tf-tutorials/convolutional-neural-nets-cnns

cũng có thể xem chi tiết vào từng layer ở đây.


Mạng VGG 16

VGG16 là mạng convolutional neural network được đề xuất vì chưng K. Simonyan và A. Zisserman, University of Oxford. Model sau thời điểm train vày mạng VGG16 đạt độ chính xác 92.7% top-5 kiểm tra vào dữ liệu ImageNet bao gồm 14 triệu hình hình ảnh trực thuộc 1000 lớp không giống nhau. Giờ vận dụng kiến thức ngơi nghỉ bên trên để phân tích mạng VGG 16.


Phân tích:

Convolutional layer: kích thước 3*3, padding=1, stride=1. Tại sao ko ghi stride, padding nhưng mà vẫn biết? Vì khoác định đã là stride=1 và padding làm cho output thuộc width cùng height cùng với input.Pool/2 : max pooling layer với form size 2*23*3 conv, 64: thì 64 là số kernel vận dụng trong layer đấy, hay depth của output của layer đấy.Càng các convolutional layer sau thì kích cỡ width, height càng bớt mà lại depth càng tăng.Sau không ít convolutional layer với pooling layer thì tài liệu được flatten và cho vào fully connected layer.

Xem thêm: ∩ Là Gì ? Intersection

Bài sau mình vẫn giới thiệu về keras với gợi ý sử dụng keras để áp dụng convolutional neural vào các vận dụng nhỏng thừa nhận diện số viết, dự đân oán góc di chuyển vào xe hơi trường đoản cú lái.



Search for:

Bài viết ngay sát đây


Mục bài xích viết


Deep Learning cơ phiên bản ©2022. All Rights Reserved. Powered by WordPress.Theme by Phoenix Web Solutions