
Sơ lược về Data Preparation trong Machine Learning
Những dự án machine learning predictive modeling, chẳng hạn như phân loại và hồi quy, luôn đòi hỏi một số hình thức data preparation trước khi có thể đưa dữ liệu vào train model.
Hi, mình là Phan Duy Lưu, hiện tại đang là AI engineer tại TMA solutions. Blog này là nơi tổng hợp 1 số bài viết thú vị trên mạng và những mẹo vặt mình tổng hợp lại trong quá trình làm việc, hi vọng có thể hữu ích với mọi người. Thân <3!
Những dự án machine learning predictive modeling, chẳng hạn như phân loại và hồi quy, luôn đòi hỏi một số hình thức data preparation trước khi có thể đưa dữ liệu vào train model.
Khi bạn bắt đầu với machine learning, bạn nhìn vào dữ liệu, huấn luyện model. Có bao giờ bạn tự hỏi rằng, tại sao mình không thể train một model với tất cả dữ liệu và đánh giá nó trên cùng một tập dữ liệu? Tại sao phải chia train/ test khi mà có thể tận dụng được nhiều dữ liệu hơn bằng việc lấy hết tất cả?
**Tôi, giờ đây, vẫn là chàng họa sĩ cặm cụi tìm kiếm nàng thơ cho bức tranh tình yêu của mình**. Nhưng tôi mong bức tranh nào có em trong đó cũng sẽ thật đẹp.
**Em hay cười, tôi thích em vì điều đó, nhưng tôi nhìn thấy nỗi buồn trong mắt em**.
GANs là một thuật toán học không giám sát (Unsupersived Learning) giải quyết các bài toán như Image Super Resolution, Image Translation,...