https://ndquy.github.io/
Quy's blog
Chia sẻ kiến thức công nghệ lập trình và ứng dụng machine learning, khai phá dữ liệu, kỹ thuật lập trình.
2021-09-13T11:07:38+08:00
Nguyễn Đình Quý
https://ndquy.github.io/
Jekyll
© 2021 Nguyễn Đình Quý
/assets/img/favicons/favicon.ico
/assets/img/favicons/favicon-96x96.png
Tản mạn - Đánh giá độ chính xác các bộ kit xét nghiệm thế nào?
2021-09-09T11:48:00+08:00
2021-09-09T16:41:18+08:00
https://ndquy.github.io/posts/danh-gia-xet-nghiem-covid-19/
Nguyễn Đình Quý
Hôm trước có chủ tịch tên là NTQ của một tập đoàn công nghệ nào đấy là BK** (Mình lhoong tiện nói tên) phát triển công nghệ giúp tìm ra người nhiễm Covid-19 thông qua dung dịch nước muối sinh lý bảo là: “Kết quả ban đầu được ghi nhận là khả quan với tỷ lệ nhận diện trên 90%”. Mà không nói rõ tỷ lệ này là tỷ lệ gì. Hôm nay mọi người cùng tìm hiểu thử độ chính xác của các bộ kit xét nghiệm được x...
15. Thuật toán phân cụm K-Means
2021-09-09T11:47:00+08:00
2021-09-09T16:52:10+08:00
https://ndquy.github.io/posts/thuat-toan-phan-cum-kmeans/
Nguyễn Đình Quý
Thuật toán phân cụm K-Means là một trong những thuật toán phân cụm dữ liệu dựa trên học không giám sát được sử dụng nhiều trong các học máy nói chung và trong khai phá dữ liệu nói riêng.
Nhắc lại về học có giám sát và không giám sát
Học có giám sát
Trong học máy, lớp các thuật toán học có giám sát Supervised learning là việc học các xác định hàm y = f(x) từ tập dữ liệu huấn luyện gồm $\{\{x_1, ...
14. Kỹ thuật data augmentation trong NLP với Tiếng Việt
2021-05-08T16:47:00+08:00
2021-05-09T14:12:56+08:00
https://ndquy.github.io/posts/ky-thuat-tang-cuong-du-lieu-nlp/
Nguyễn Đình Quý
Tăng cường dữ liệu (Data Augmentation) là một khái niệm khá phổ biến trong deep learning mà chắc hẳn ai đang nghiên cứu cũng đã từng nghe hoặc sử dụng đến.
Nói đơn giản hơn, Data Augmentation là kỹ thuật tạo ra thêm dữ liệu để bổ sung cho tập dữ liệu để giúp mô hình khái quát tốt hơn.
Các kỹ thuật data augmentation được sử dụng nhiều trong thị giác máy tính, thuật toán supervised learning… Tuy ...
13. Xác định ý định câu hỏi trong hệ thống hỏi đáp
2021-04-14T16:47:00+08:00
2021-05-09T14:02:26+08:00
https://ndquy.github.io/posts/intent-classification/
Nguyễn Đình Quý
Mục tiêu bài viết
Phân tích câu hỏi là pha đầu tiên trong kiến trúc chung của một hệ thống hỏi đáp, có
nhiệm vụ tìm ra các thông tin cần thiết làm đầu vào cho quá trình xử lý của các pha sau
(trích chọn tài liệu, trích xuất câu trả lời, …). Vì vậy phân tích câu hỏi có vai trò hết sức
quan trọng, ảnh hưởng trực tiếp đến hoạt động của toàn bộ hệ thống. Nếu phân tích câu hỏi không tốt thì sẽ khôn...
12. Các phương pháp đánh giá mô hình phân lớp phần 1
2021-04-10T16:47:00+08:00
2021-04-10T16:47:00+08:00
https://ndquy.github.io/posts/Phan-lop-danh-gia-he-thong-phan-lop/
Nguyễn Đình Quý
Trong bài viết này mình sẽ nói đến bài toán phân lớp và các phương pháp đánh giá 1 mô hình phân lớp.
Bài toán phân lớp
Mình sẽ sử dụng bộ dữ liệu MNIST, gồm 70.000 ảnh nhỏ của các số viết tay bởi người ở US. Mỗi ảnh được đánh nhãn với số tương ứng. Tập dữ liệu này được dùng cực kì phổ biến trong huấn luyện các thuật toán và thường được gọi là bộ dữ liệu “Hello World” trong Machine learning. N...