Subscribe to Continue Downloading

Redirecting...
dataset cover 副本 - Code Python hệ thống phát hiện gian lận thẻ tín dụng ằng cách sử dụng máy học Machine Learning

Code Python hệ thống phát hiện gian lận thẻ tín dụng ằng cách sử dụng máy học Machine Learning

by Mạnh ITin , on November 9, 2024

Choose Your Desired Option(s)

Code Python hệ thống phát hiện gian lận thẻ tín dụng ằng cách sử dụng máy học Machine Learning

Dự án này hướng đến việc xây dựng một hệ thống phát hiện gian lận thẻ tín dụng bằng cách sử dụng các mô hình học máy như Logistic Regression và Random Forest. Hệ thống sẽ bao gồm các chức năng chính như: tiền xử lý dữ liệu nhằm làm sạch và chuẩn hóa dữ liệu, huấn luyện mô hình để tối ưu hóa khả năng phát hiện gian lận, đánh giá hiệu suất mô hình dựa trên các chỉ số như độ chính xác và độ nhạy, và dự đoán gian lận trên các dữ liệu mới. Mục tiêu là cung cấp một công cụ hỗ trợ phát hiện và ngăn ngừa gian lận hiệu quả, giúp bảo vệ tài sản và thông tin của khách hàng.

 

dataset cover 副本 - Code Python hệ thống phát hiện gian lận thẻ tín dụng ằng cách sử dụng máy học Machine Learning

 

Hướng dẫn cài đặt

Yêu cầu

  • Python >= 3.7
  • Các thư viện được liệt kê trong requirements.txt

Cài đặt

  1. Tạo môi trường ảo:

    python -m venv venv
     
  2. Kích hoạt môi trường ảo:

    • Windows: venv\Scripts\activate
    • MacOS/Linux: source venv/bin/activate
  3. Cài đặt các thư viện:

    pip install -r requirements.txt
     

Chạy dự án

python main.py
 

Các chức năng chính

  1. Preprocess Data: Tiền xử lý dữ liệu từ tập gốc, bao gồm chuẩn hóa và mã hóa biến phân loại. Dữ liệu sau khi tiền xử lý sẽ được lưu vào thư mục dataset/processed/.

  2. Train Model: Huấn luyện mô hình Logistic Regression và Random Forest trên dữ liệu đã tiền xử lý. Các mô hình sẽ được lưu trong thư mục models/.

  3. Evaluate Model: Đánh giá hiệu suất của mô hình trên tập kiểm tra, bao gồm các chỉ số: Accuracy, Precision, Recall, F1-Score, ROC AUC, và Confusion Matrix, Outlier Detection, ROC Curve.

  4. Generate Random Data for Inference:

    • Sử dụng generate_random_data.py trong src/ để tạo dữ liệu mẫu ngẫu nhiên từ dữ liệu gốc.
    • Tệp dữ liệu mẫu (new_transactions.csv) sẽ được lưu trong thư mục dataset/new_data/ để dùng cho suy luận.
  5. Make Inference on New Data: Dự đoán trên dữ liệu mới trong thư mục dataset/new_data/. Kết quả dự đoán sẽ được lưu vào predictions.csv trong cùng thư mục.

  6. Show Fraud Statistics: Hiển thị thông tin thống kê và trực quan hóa về các mẫu gian lận.

  7. Exit: Thoát chương trình.

Download Category ,
Product Version
File Type Py
File Size 16.5 MB
Developer
Documentation

Release Information

  • Released
    :

    November 9, 2024

  • Last Updated
    :

    November 9, 2024

  • Categories
    :
  • File Included
    :

    Py

  • File Size
    :

    16.5 MB

Share Your Valuable Opinions

You must log in to submit a review.

  • Sign up
Password Strength Very Weak
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
We do not share your personal details with anyone.

Please wait a moment...

(Don't refresh or go back)