Posts
Quy's blog
Cancel

Tản mạn - Đánh giá độ chính xác các bộ kit xét nghiệm thế nào?

Hôm trước có chủ tịch tên là NTQ của một tập đoàn công nghệ nào đấy là BK** (Mình lhoong tiện nói tên) phát triển công nghệ giúp tìm ra người nhiễm Covid-19 thông qua dung dịch nước muối sinh lý bả...

15. Thuật toán phân cụm K-Means

Thuật toán phân cụm K-Means là một trong những thuật toán phân cụm dữ liệu dựa trên học không giám sát được sử dụng nhiều trong các học máy nói chung và trong khai phá dữ liệu nói riêng. Nhắc lại v...

14. Kỹ thuật data augmentation trong NLP với Tiếng Việt

Tăng cường dữ liệu (Data Augmentation) là một khái niệm khá phổ biến trong deep learning mà chắc hẳn ai đang nghiên cứu cũng đã từng nghe hoặc sử dụng đến. Nói đơn giản hơn, Data Augmentation là kỹ...

13. Xác định ý định câu hỏi trong hệ thống hỏi đáp

Mục tiêu bài viết Phân tích câu hỏi là pha đầu tiên trong kiến trúc chung của một hệ thống hỏi đáp, có nhiệm vụ tìm ra các thông tin cần thiết làm đầu vào cho quá trình xử lý của các pha sau (tríc...

12. Các phương pháp đánh giá mô hình phân lớp phần 1

Trong bài viết này mình sẽ nói đến bài toán phân lớp và các phương pháp đánh giá 1 mô hình phân lớp. Bài toán phân lớp Mình sẽ sử dụng bộ dữ liệu MNIST, gồm 70.000 ảnh nhỏ của các số viết tay bởi...

11. Các phương pháp scale dữ liệu trong machine learning

Trong các thuật toán machine learning nói chung, và trong deep learning nói riêng, các mô hình học cách dự đoán đầu ra từ đầu vào thông qua các ví dụ trong tập dữ liệu huấn luyện. Các điểm dữ liệu...

10. Áp dụng Okapi BM25 vào tìm kiếm thông tin dựa trên Tiếng Việt

Trong tìm kiếm thông tin, để xếp hạng các văn bản phù hợp với truy vấn của người dùng, người ta thường sử dụng thuật toán Okapi BM25. Thuật toán này dựa trên mô hình xác suất , được phát minh ra và...

Triển khai hàng đợi xử lý bằng python với Redis

Hàng đợi queue là gì? Các hệ thống chuyên ghi với cường độ lớn (như log, tracking,…). Đẩy vào xử lý queue và background job sẽ giảm nguy cơ quá tải cho database. Các hệ thống chu...

9. Loss function P3 - hàm mất mát cho bài toán multi-class classification

Phân đa lớp là những bài toán mà mô hình dự đoán trong đó các đầu vào được chỉ định là một trong nhiều hơn hai lớp. Mô hình dự đoán một giá trị số nguyên, trong đó mỗi lớp được gán một giá trị số ...

8. Loss function P2 - hàm mất mát cho bài toán binary classification

Phân lớp nhị phân là bài toán mà biến đầu ra (y) chỉ nhận một trong hai giá trị là 1 trong 2 nhãn. Bài toán thường dưới dạng bài toán dự đoán giá trị 0 hoặc 1 cho lớp đầu tiên hoặc lớp thứ hai và ...