Hãy quên Python, Machine Learning, Deep Learning, etc đi. Giờ hãy nghĩ về Data trước. Câu hỏi đặt ra ở đây là: cho bạn một đống dữ liệu - bạn sẽ làm được gì?
Theo như bài giảng Data Science For Beginners - thông thường sẽ có 5 loại câu hỏi mà thôi:
- Classification
- Anomaly Detection
- Regression
- Clustering
- Reinforcement Learning
- Classification
- Anomaly Detection
- Regression
- Clustering
- Reinforcement Learning
(Xem video trong Comment)
Nếu chỉ chọn một câu hỏi để đi sâu vào thì câu hỏi đó là gì? - Classification
Để xem các bài toán/ứng dụng của Classification, có thể xem trên Kaggle: https://github.com/ShuaiW/kaggle-classification. Các bài toán Classification có thể diễn đạt dưới các thuật ngữ khác nhau như phân loại, tiên đoán, etc.
Ví dụ
1. Hãy tiên đoán một người có khả năng sống sót hay không trong thảm hoạ tàu Titanic?
2. Hãy tiên đoán một ảnh chẩn đoán y khoa để xem người bệnh có bị ung thư/tiểu đường hay không?
3. Hãy tiên đoán khách hàng của Airbnb sẽ book phòng ở nước nào đầu tiên?
Hãy nhìn vào dữ liệu quanh bạn và tìm cách đặt câu hỏi dưới dạng bài toán Classification nhé
Link: https://www.facebook.com/bigdata.deeplearning.uit/posts/2052863431697433
Link: https://www.facebook.com/bigdata.deeplearning.uit/posts/2052863431697433