
Code Python Phân tích dữ liệu chứng khoán Stock Analysis sử dụng PCA, KMeans
by Tien Lein Python , Scripts & Code on August 5, 2024Choose Your Desired Option(s)
Become a SourceCodec member for full access. Your first 7 days are free.
Code Python Phân tích dữ liệu chứng khoán Stock Analysis sử dụng PCA, KMeans
Nghiên cứu và Phân tích Dữ liệu Chứng khoán
Việc nghiên cứu và phân tích dữ liệu chứng khoán là một ứng dụng quan trọng trong lĩnh vực tài chính và khoa học dữ liệu. Bằng cách sử dụng PCA để lọc feature và KMeans để tìm nhóm cổ phiếu có chung pattern, chúng ta có thể dễ dàng trực quan hóa và phân loại các cổ phiếu.

Các bước thực hiện dự án
Load dữ liệu gốc:
- Dữ liệu gốc được cung cấp dưới dạng file pickle (.pkl).
Clean data:
- Xử lý dữ liệu thiếu, không hợp lệ để đảm bảo chất lượng dữ liệu.
Feature Engineering:
- Scale và chuẩn hóa lại dữ liệu để chuẩn bị cho quá trình phân tích.
PCA dữ liệu:
- Sử dụng Principal Component Analysis (PCA) để giảm số chiều dữ liệu và lọc các feature quan trọng.
KMeans – Silhouette score:
- Áp dụng thuật toán KMeans để phân nhóm các cổ phiếu có chung pattern và sử dụng Silhouette score để đánh giá hiệu quả của việc phân nhóm.
Chi tiết về project này, các bạn có thể xem trong file stock_analysis.ipynb. Ngôn ngữ lập trình được sử dụng là Python.
Đây là đường link google drive dẫn đến raw data gốc df_merged.pkl. Các bạn có thể tải về và chạy thử, khuyến khích các bạn chạy code trên google colab.
| Download Category | Python, Scripts & Code |
| Product Homepage URL→ | |
| Product Version | |
| File Type | ipynb, dat, . . . |
| File Size | 534 KB |
| Developer | |
| Documentation |





