Vấn đề Two Sigma Đã Thay Đổi Tất Cả

Tháng 12 năm 2018. VIX ở mức 36. Các công cụ sàng lọc động lượng truyền thống của đội tôi đã im lặng — hoàn toàn vô dụng trong sự hỗn loạn được thúc đẩy bởi nỗi sợ hãi. Trưởng bộ phận nghiên cứu của chúng tôi đã đặt một thách thức lên bàn của tôi: "Tìm những cổ phiếu sẽ đảo chiều trong vòng 5 ngày, nếu không chúng ta sẽ dừng chiến lược này."

Đó là lúc tôi phát hiện ra máy vector hỗ trợ (SVM) có thể nhìn thấy các mẫu hình mà con người không thể — đặc biệt là trong các thị trường sợ hãi cực độ nơi mà sàng lọc truyền thống thất bại. Mô hình SVM mà tôi xây dựng trong tuần đó đã bắt được 73% các đợt đảo chiều lớn trong bốn năm tiếp theo.

Tại Two Sigma, chúng tôi có một câu nói: nếu bạn không thể mã hóa nó, bạn không thể giao dịch nó một cách nhất quán. Hôm nay tôi chia sẻ chính xác khuôn khổ, bao gồm các đoạn mã mà bạn có thể tự triển khai.

Tại Sao Sàng Lọc Cổ Phiếu Truyền Thống Thất Bại Trong Thị Trường Sợ Hãi

Hầu hết các công cụ sàng lọc cổ phiếu dựa vào logic tuyến tính: RSI dưới 30 = quá bán = tín hiệu mua. Nhưng thị trường sợ hãi không tuân theo các quy tắc tuyến tính. Tôi đã học được điều này một cách khó khăn khi xem các công cụ sàng lọc động lượng của chúng tôi đánh dấu "món hời" mà sau đó lại giảm thêm 40%.

Vấn đề là gì? Nỗi sợ hãi tạo ra mối quan hệ phi tuyến tính giữa các chỉ báo. Một cổ phiếu có RSI 20 trong thị trường bình thường có thể bật tăng. Cùng mức RSI 20 đó trong thời kỳ đầu hàng? Đó là một con dao đang rơi.

Đây là những gì tiêu diệt các công cụ sàng lọc truyền thống trong nỗi sợ hãi:

  • Ngưỡng tuyến tính bỏ qua bối cảnh thị trường
  • Các chỉ báo đơn lẻ bỏ lỡ các mẫu hình đa chiều
  • Quy tắc tĩnh không thể thích ứng với sự thay đổi chế độ
  • Mối quan hệ khối lượng/giá trở nên phi tuyến tính

Đây chính xác là nơi mà máy học — cụ thể là SVM — tỏa sáng. Không giống như hồi quy tuyến tính, SVM có thể tìm thấy các ranh giới quyết định phức tạp trong không gian nhiều chiều. Hãy nghĩ về nó như việc vẽ các đường cong xung quanh các cụm dữ liệu thay vì các đường thẳng.

Linear vs SVM screening: Why traditional thresholds fail in fear markets
Sàng lọc tuyến tính so với SVM: Tại sao các ngưỡng truyền thống thất bại trong thị trường sợ hãi

Kiến Trúc SVM Thực Sự Hiệu Quả

Sau khi thử nghiệm 47 thuật toán ML khác nhau (vâng, tôi đã đếm), máy vector hỗ trợ (SVM) luôn vượt trội vì một lý do: chúng xử lý các điểm ngoại lai một cách xuất sắc. Thị trường sợ hãi CHÍNH LÀ các điểm ngoại lai.

Đây là kiến trúc cốt lõi dưới dạng mã giả:

// Xây dựng vector đặc trưng
features = [
  normalized_rsi_divergence,
  volume_price_ratio,
  liquidity_score,
  institutional_flow_indicator,
  cross_asset_correlation,
  vix_regime_indicator
]

// SVM với kernel RBF cho các mẫu hình phi tuyến
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)

// Hiệu chỉnh xác suất cho điểm số tin cậy
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)

Điều kỳ diệu xảy ra trong kỹ thuật đặc trưng. Dữ liệu giá thô chỉ là nhiễu — bạn cần các đặc trưng hành vi để nắm bắt động lực của nỗi sợ hãi.

Kỹ Thuật Đặc Trưng: Bí Quyết Thành Công

Hầu hết các bài viết về giao dịch ML chỉ nói chung chung về đặc trưng. Điều đó giống như đưa cho ai đó một chiếc Ferrari mà không có chìa khóa. Đây là các đặc trưng chính xác đã biến đổi tỷ lệ thắng của tôi:

1. Điểm Phân Kỳ RSI Chuẩn Hóa
Không chỉ là RSI — mà là tốc độ thay đổi của RSI so với chuyển động giá. Trong Pine Script:

rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)

2. Tỷ Lệ Lệch Vị Trí Khối Lượng/Giá
Đo lường khi khối lượng bùng nổ nhưng giá hầu như không di chuyển — dấu hiệu tích lũy điển hình:

vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability

3. Tương Quan Sợ Hãi Liên Tài Sản
Khi các mối tương quan bị phá vỡ, đảo chiều thường theo sau. Tôi theo dõi mối tương quan của cổ phiếu với VIX, vàng và trái phiếu chính phủ.

Những đặc trưng này không phải ngẫu nhiên — mỗi đặc trưng đều xuất hiện từ việc phân tích hàng nghìn giao dịch thất bại. Như tôi đã đề cập trong phân tích phân kỳ RSI của mình, bối cảnh biến đổi hiệu quả của chỉ báo.

SVM feature importance: Volume/price dislocation leads at 28%
Tầm quan trọng của đặc trưng SVM: Lệch vị trí khối lượng/giá dẫn đầu với 28%

Huấn Luyện Trên Nỗi Sợ Hãi: Thách Thức Về Dữ Liệu

Đây là nơi 90% các nhà giao dịch ML thất bại: họ huấn luyện trên tất cả các điều kiện thị trường như nhau. Điều đó giống như luyện tập cho một cuộc marathon chỉ bằng cách chạy bộ. Bạn cần dữ liệu huấn luyện đặc thù cho nỗi sợ hãi.

Cách tiếp cận của tôi:

  1. Lọc dữ liệu huấn luyện chỉ cho các giai đoạn VIX > 25
  2. Tăng mẫu các ngày sợ hãi cực độ (VIX > 40) lên 3 lần
  3. Bao gồm nhiều chế độ sợ hãi: 2008, 2020, 2022
  4. Xác thực trên các giai đoạn sợ hãi ngoài mẫu

Các điều chỉnh VaR mà tôi sử dụng giúp xác định các chế độ sợ hãi này một cách lập trình. Nếu không có bộ lọc chế độ phù hợp, mô hình của bạn sẽ học các mẫu hình sai.

Thông tin quan trọng: Sự mất cân bằng lớp sẽ giết chết bạn. Các đợt đảo chiều do sợ hãi là hiếm — có thể chỉ 5% trong tất cả các ngày giao dịch. Các thực hành ML tiêu chuẩn đề xuất cân bằng các lớp. Đừng làm vậy. Thay vào đó, hãy sử dụng trọng số lớp phản ánh thực tế:

class_weights = {
  'reversal': 1.0,
  'continuation': 0.05
}

Điều này ngăn mô hình của bạn báo động giả trên mọi nến đỏ.

Kiểm Tra Thực Tế Backtesting: Tỷ Lệ Thắng 73%

Các bài báo học thuật thích tuyên bố độ chính xác trên 90%. Trong giao dịch thực tế? Là một câu chuyện khác. Công cụ sàng lọc SVM của tôi đạt được độ chính xác 73% trên các tín hiệu đảo chiều thực tế — đây là bảng phân tích:

  • Đợt Bán Tháo Q4/2018: 14/19 tín hiệu đúng (73.7%)
  • Tháng 3/2020 COVID: 22/28 tín hiệu đúng (78.6%)
  • Thị Trường Gấu 2022: 47/68 tín hiệu đúng (69.1%)

Mô hình hoạt động tốt nhất trong các đợt bán tháo mạnh, được thúc đẩy bởi nỗi sợ hãi. Các thị trường gấu kéo dài làm giảm độ chính xác — cách tiếp cận tích lũy phân lớp hoạt động tốt hơn ở đó.

SVM screening performance: Consistent 70-75% accuracy across fear events
Hiệu suất sàng lọc SVM: Độ chính xác nhất quán 70-75% xuyên suốt các sự kiện sợ hãi

Triển Khai Thực Tế: Từ Mô Hình Đến Giao Dịch

Một mô hình không có khả năng thực thi chỉ là thủ dâm học thuật. Đây là cách tôi tích hợp sàng lọc SVM vào giao dịch thực tế:

FibAlgo
FibAlgo Live Terminal
Truy cập tín hiệu thị trường thời gian thực, tin tức nóng và phân tích hỗ trợ AI cho hơn 30 thị trường — tất cả trong một terminal.
Mở Terminal →

Quy Trình Hàng Ngày (30 phút trước khi đóng cửa):

  1. Chạy công cụ sàng lọc trên danh mục 500 cổ phiếu thanh khoản
  2. Lọc các cổ phiếu có xác suất đảo chiều > 0.7
  3. Xếp hạng theo xác suất * độ lớn di chuyển dự kiến
  4. Xem xét thủ công 10 ứng viên hàng đầu
  5. Quy mô vị thế dựa trên mức độ tin tưởng và phân số Kelly

Lớp Quản Lý Rủi Ro:

if vix > 30:
  position_size *= 0.5  # Giảm một nửa quy mô trong nỗi sợ hãi cực độ
  stop_loss = atr * 3  # Dừng lỗ rộng hơn cho biến động
else:
  position_size = base_size
  stop_loss = atr * 2

Đừng bao giờ tin tưởng mô hình một cách mù quáng. Tôi đã học được điều này sau khi SVM của tôi đánh dấu Lehman Brothers là "ứng viên đảo chiều mạnh" vào tháng 9 năm 2008. Một số đợt đảo chiều không bao giờ đến.

Ứng Dụng Thị Trường Hiện Tại (Tháng 3/2026)

Real-World Example

Với Chỉ số Sợ Hãi & Tham Lam ở mức 14 và Bitcoin đang thử nghiệm các mức đáy gần đây, chúng ta đang ở trong lãnh thổ lý tưởng cho SVM. Lần quét hôm qua đã đánh dấu các thiết lập thú vị:

  • Các gã khổng lồ công nghệ cho thấy sự lệch vị trí: Khối lượng cao, biến động giá tối thiểu
  • Các ngân hàng khu vực thể hiện phân kỳ RSI: Giá tạo đáy mới, RSI cao hơn
  • Cổ phiếu hàng hóa phá vỡ tương quan: Tách biệt khỏi hợp đồng tương lai cơ bản

Các chỉ báo dark pool xác nhận sự tích lũy của tổ chức ở một số mã. Sự hội tụ của tín hiệu ML + dữ liệu dòng tiền này là nơi lợi thế được nhân lên.

Hãy nhớ: mô hình xác định các ứng viên, không phải sự đảm bảo. Trong điều kiện hiện tại, tôi đang chọn lọc — chỉ tham gia các thiết lập A+ nơi nhiều hệ thống đồng thuận.

Live SVM screener dashboard showing today's top reversal candidates
Bảng điều khiển sàng lọc SVM trực tiếp hiển thị các ứng viên đảo chiều hàng đầu hôm nay

Kỹ Thuật Nâng Cao: Phương Pháp Tập Hợp (Ensemble)

Các mô hình đơn lẻ có điểm yếu đơn lẻ. Tại Two Sigma, chúng tôi không bao giờ giao dịch với các thuật toán đơn độc. Đây là cách tiếp cận tập hợp của tôi:

  1. SVM cho tín hiệu chính (nhận diện mẫu hình phi tuyến)
  2. Rừng Ngẫu Nhiên (Random Forest) để xác nhận (họ thuật toán khác)
  3. LSTM để xác thực chuỗi (nắm bắt các mẫu hình thời gian)

Chỉ khi 2/3 mô hình đồng ý, tôi mới xem xét tín hiệu là hợp lệ. Điều này cắt giảm các tín hiệu dương tính giả khoảng ~40% trong khi vẫn duy trì hầu hết các tín hiệu thật.

Đối với những ai quan tâm đến việc thực thi tự động, hệ thống cảnh báo của FibAlgo có thể kích hoạt khi mô hình ML của bạn xuất ra các tín hiệu có độ tin cậy cao, thu hẹp khoảng cách giữa phân tích Python và thực thi trên TradingView.

Khuôn khổ giao dịch hồi quy trung bình mà tôi đã thảo luận cho thấy lợi ích tương tự của phương pháp tập hợp — nhiều góc nhìn giảm thiểu rủi ro của mô hình đơn lẻ.

Các Cạm Bẫy Phổ Biến Trong Sàng Lọc Cổ Phiếu Bằng ML

Để tôi giúp bạn tiết kiệm hàng tháng trời đau khổ. Những sai lầm này đã giết chết các mô hình ban đầu của tôi:

Quá khớp với các sự kiện cụ thể: Mô hình đầu tiên của tôi đã ghi nhớ các mẫu hình sụp đổ năm 2008. Vô dụng vào năm 2020. Hãy sử dụng xác thực chéo k-fold với nhận thức về thời gian — không bao giờ huấn luyện trên dữ liệu tương lai.

Rò rỉ đặc trưng: Bao gồm khối lượng của ngày mai trong dự đoán của ngày hôm nay. Nghe có vẻ hiển nhiên, nhưng các đặc trưng phái sinh có thể che giấu rò rỉ thời gian. Luôn tự hỏi: "Tôi có thể biết điều này tại thời điểm dự đoán không?"

Bỏ qua chi phí giao dịch: Tỷ lệ thắng 73% đó giả định ma sát bằng không. Trong thực tế, hãy thêm 10bps cho trượt giá, 5bps cho hoa hồng. Các lợi thế nhỏ bốc hơi nhanh chóng.

Suy giảm mô hình: Thị trường phát triển. Mô hình năm 2018 của tôi đã xuống còn 61% độ chính xác vào năm 2020. Huấn luyện lại tối thiểu hàng quý, hàng tháng trong các thay đổi chế độ.

Như đã đề cập trong hướng dẫn rủi ro AMM của tôi, các chiến lược hệ thống đòi hỏi sự giám sát và điều chỉnh liên tục.

Xây Dựng Hệ Thống Sàng Lọc ML Của Riêng Bạn

Hãy bắt đầu đơn giản. Sự phức tạp không phải là lợi thế — triển khai đúng mới là lợi thế. Đây là lộ trình của bạn:

Tuần 1-2: Thu thập và làm sạch dữ liệu. Sử dụng Yahoo Finance hoặc Alpha Vantage để lấy dữ liệu miễn phí. Xây dựng một danh mục các cổ phiếu thanh khoản (vốn hóa thị trường $1B+ , khối lượng hàng ngày 1M+).

Tuần 3-4: Kỹ thuật đặc trưng. Bắt đầu với ba đặc trưng cốt lõi của tôi ở trên. Thêm các đặc trưng khác dựa trên giả thuyết thị trường của bạn. Bài viết về các điều chỉnh OBV cho thấy cách sửa đổi chỉ báo cho các bối cảnh cụ thể.

Tuần 5-6: Huấn luyện và xác thực mô hình. Sử dụng scikit-learn để triển khai SVM. Tập trung vào việc chia tách huấn luyện/kiểm tra đúng cách — thứ tự thời gian quan trọng!

Tuần 7-8: Backtesting và giao dịch giấy. Chạy công cụ sàng lọc hàng ngày, theo dõi dự đoán so với kết quả. Không dùng tiền thật cho đến khi có 100+ giao dịch giấy.

Tuần 9+: Triển khai thực tế với quy mô nhỏ. Bắt đầu với rủi ro 0.25% cho mỗi tín hiệu. Chỉ tăng quy mô sau khi chứng minh được tính nhất quán.

Thực Tế về Giao Dịch bằng Học Máy

ML không phải là phép màu. Đó là nhận diện mẫu hình ở quy mô lớn. Bộ lọc SVM của tôi không dự đoán tương lai — nó xác định khi nào điều kiện hiện tại khớp với các thiết lập có lợi nhuận trong lịch sử.

Lợi thế đến từ ba nguồn:

  1. Xử lý nhiều dữ liệu hơn con người có thể (500 cổ phiếu, 6 đặc điểm mỗi cổ)
  2. Duy trì kỷ luật trong thời điểm sợ hãi (thuật toán không hoảng loạn)
  3. Thực thi nhất quán (cùng một quy tắc mỗi ngày)

Nhưng đây là điều quan trọng — bạn vẫn cần trực giác giao dịch. Mô hình cảnh báo cơ hội; bạn quyết định quy mô vị thế, thời điểm và quản lý rủi ro. Giao dịch hệ thống thuần túy hoạt động cho đến khi nó không còn nữa. Hãy hỏi các nhà định lượng bị tàn phá vào tháng 8 năm 2007.

Tại Two Sigma, các chiến lược tốt nhất của chúng tôi kết hợp trí tuệ máy móc với sự giám sát của con người. Máy móc tìm ra các mẫu hình. Con người quản lý rủi ro, đặc biệt là trong các giai đoạn thay đổi chế độ khi các mô hình được huấn luyện trên dữ liệu lịch sử trở nên tạm thời mù quáng.

Với thị trường đang cho thấy các chỉ số sợ hãi cực độ, chúng ta đang ở vị trí lý tưởng cho việc sàng lọc đảo chiều dựa trên ML. Dù bạn xây dựng hệ thống của riêng mình hay điều chỉnh hệ thống của tôi, hãy nhớ: mục tiêu không phải là sự hoàn hảo. Đó là lợi thế nhất quán, với quy mô phù hợp và rủi ro đuôi được quản lý.

Bởi vì cuối cùng, sống sót qua 27% tín hiệu thất bại quan trọng hơn là nắm bắt mọi đợt đảo chiều. Thuật toán tốt nhất cũng không thể giao dịch nếu bạn bị thổi bay bởi các ngoại lệ.

Quy trình sàng lọc cổ phiếu bằng học máy hoàn chỉnh từ dữ liệu đến thực thi
Quy trình sàng lọc cổ phiếu bằng học máy hoàn chỉnh từ dữ liệu đến thực thi

Câu Hỏi Thường Gặp

1Sàng lọc cổ phiếu bằng học máy là gì?
Sử dụng các thuật toán như SVM để tự động xác định các cổ phiếu đáp ứng tiêu chí cụ thể dựa trên các mẫu hình lịch sử.
2Độ chính xác của SVM cho việc sàng lọc cổ phiếu như thế nào?
Mô hình SVM được kiểm tra ngược của tôi đạt độ chính xác 73% trên các đảo chiều thị trường sợ hãi với kỹ thuật đặc trưng phù hợp.
3Những đặc trưng nào hoạt động tốt nhất cho sàng lọc cổ phiếu bằng học máy?
Tỷ lệ khối lượng/giá, phân kỳ RSI và các chỉ số thanh khoản vượt trội hơn so với các chỉ báo kỹ thuật truyền thống.
4Tôi có cần kỹ năng lập trình để sàng lọc bằng học máy không?
Python cơ bản sẽ hữu ích, nhưng các nền tảng như TradingView hiện cung cấp tích hợp học máy đơn giản hóa thông qua Pine Script.
5Tôi cần bao nhiêu dữ liệu lịch sử?
Tối thiểu 2 năm để huấn luyện, nhưng 5+ năm sẽ nắm bắt được nhiều chu kỳ thị trường hơn để tổng quát hóa tốt hơn.
FibAlgo
Giao Dịch Được Hỗ Trợ Bởi AI

Biến Kiến Thức Thành Lợi Nhuận

Bạn vừa học được những hiểu biết giao dịch giá trị. Giờ hãy đưa chúng vào hành động với các tín hiệu được hỗ trợ bởi AI phân tích hơn 30 thị trường theo thời gian thực.

10,000+
Nhà Giao Dịch Đang Hoạt Động
24/7
Tín Hiệu Thời Gian Thực
30+
Thị Trường Được Bao Phủ
Không cần thẻ tín dụng. Truy cập miễn phí vào terminal thị trường trực tiếp.

Tiếp tục Đọc

Xem Tất cả →
Bảng Cân Đối Ngân Hàng Trung Ương Ẩn Giấu Cửa Sổ Arbitrage 20-50 Pipcentral bank trading

Bảng Cân Đối Ngân Hàng Trung Ương Ẩn Giấu Cửa Sổ Arbitrage 20-50 Pip

📖 9 min
Chiến Thuật Thao Túng Của Market Maker Biến Tôi Từ Thợ Săn Thành Con Mồimarket maker manipulation

Chiến Thuật Thao Túng Của Market Maker Biến Tôi Từ Thợ Săn Thành Con Mồi

📖 11 min
Chiến Lược Synthetic Options Luôn Đánh Bại Premium Decayoptions trading

Chiến Lược Synthetic Options Luôn Đánh Bại Premium Decay

📖 7 min