CONFUSION MATRIX LÀ GÌ

  -  

Các bài toán thù về ML thì việc chọn metric để đánh giá tính kết quả của Mã Sản Phẩm là hết sức quan trọng. Với mỗi bài tân oán khác nhau, họ yêu cầu áp dụng các metric không giống nhau. Tại trên đây tôi đã ra mắt các định nghĩa cơ phiên bản tương quan mang đến Accuracy, Precision, ReHotline và F1.

Bạn đang xem: Confusion matrix là gì

Đang xem: Confusion matrix là gì

Trước hết, chúng ta hãy quan sát vào confusion matrix sau và xác định đâu là độ đúng mực của mô hình:

*

Rất đơn giản dễ dàng bạn sẽ nói rằng độ đúng mực của Mã Sản Phẩm này rất không nhỏ, đạt mức 99.9%. Vâng đây là 1 sự lầm lẫn hơi phệ đối với chúng ta mới bước đi vào nghành nghề ML. Trước tê tôi cũng đã từng như vậy ^^.

Nhưng trường hợp như hiệu quả dự đoán thù ở trên vận dụng cho một bài bác toán dự đoán thù bệnh ung thư mang lại 1000 tín đồ vào test thì phân phát hiện ra 999 người không bị ung thỏng và 1 bạn bị ung thư. Nhưng thực tế thì gồm cho tới 2 fan bị ung thư. Vấn đề bây chừ trở phải cực kỳ rất lớn là bọn họ đang quăng quật sang một bệnh nhân bị ung tlỗi.

Xem thêm: Viết Đoạn Văn Nghị Luận Về Hi Vọng Là Gì, Nghĩa Của Từ Hy Vọng Trong Tiếng Việt

Precision cùng Recall

Đối với bài tân oán trên tôi đã reviews 2 metric new là Precision cùng Rehotline (Ở đây xin được cho phép bản thân ko dịch sang giờ Việt vì chưng lừng chừng cần dịch làm sao cho đúng). Công thức tính của 2 metric nàhệt như sau:

Precision

*

(extPrecision = fracextTrue PositiveextTrue Positive + False Positive)

Đối với bài xích toán thù ví dụ trên ta đang thấy

(extPreecision=frac10+1=100ext%)

Ngay chớp nhoáng bạn có thể thấy rằng Precision miêu tả độ đúng mực của việc dự đoán những mẫu positive.

*

Precision là 1 metric nhằm xác định lúc cơ mà bài toán dự đoán thù không nên những mẫu mã Positive là khôn xiết nguy hại. lấy một ví dụ đối với bài bác tân oán khẳng định spam tin nhắn. Với bài xích tân oán này chủng loại positive đã là spam mail, vậy false positive sầu đang là câu hỏi dự đân oán 1 gmail chưa phải spam bị đưa vào cỗ áo mail spam. Việc này đang ảnh hưởng không hề ít tới người sử dụng.

Xem thêm: Khái Toán Là Gì ? Cách Tính Khái Toán Trong Xây Dựng Bạn Cần Biết!

Recall

(extRecall = fracextTrue PositiveextTrue Positive+extFalse Negative)

*

Đối với metric này fan ta sẽ thấy nó diễn đạt rằng bao nhiêu mẫu mã positive thực tế được khẳng định đúng. Metric này dùng làm nhận xét 1 Model Lúc mà Việc dự đoán thù không nên 1 mẫu positive thực tiễn là khôn xiết nguy khốn. Nhỏng việc dự đoán thù các bệnh nhân bệnh tật.

Đối với bài xích tân oán ví dụ bên trên ta đang thấy

(extRecall=frac11+1=50 ext% )

F1 Score

Tại phía trên tôi đang reviews bạn thêm một metric nữa đấy là F1. Công thức của chính nó có liên quan tới Precision cùng ReĐiện thoại tư vấn nhỏng sau:

(extF1= 2 fracextPrecision * RecallextPrecision+extRecall)

F1 score sẽ được thực hiện khi bạn đề nghị 1 metric nhằm thăng bằng được giữa Precision và ReCall.

Vậy sự khác biệt giữa F1 Score cùng Accuracy là gì? Nhỏng ở ví dụ trên chúng ta đã xét, nếu 1 bài bác toán thù bị tác động vì chưng quá nhiều chủng loại negative sầu thì Accuracy đã không còn đúng chuẩn nữa.