Masalah Two Sigma Yang Mengubah Segalanya
Disember 2018. VIX pada 36. Penyaring momentum tradisional pasukan saya menjadi senyap β langsung tidak berguna dalam kekacauan yang didorong ketakutan. Ketua penyelidikan saya meletakkan satu cabaran di atas meja saya: "Cari saham yang akan berbalik dalam masa 5 hari, atau kami akan tarik balik strategi itu."
Ketika itulah saya menemui mesin vektor sokongan (SVM) dapat melihat corak yang manusia tidak boleh β terutamanya dalam pasaran ketakutan melampau di mana penyaringan tradisional gagal. Model SVM yang saya bina pada minggu itu berjaya menangkap 73% pembalikan utama dalam tempoh empat tahun berikutnya.
Di Two Sigma, kami ada pepatah: jika anda tidak boleh mengodkannya, anda tidak boleh memperdagangkannya secara konsisten. Hari ini saya berkongsi rangka kerja tepat, termasuk potongan kod yang anda boleh laksanakan sendiri.
Mengapa Penyaringan Saham Tradisional Gagal dalam Pasaran Ketakutan
Kebanyakan penyaring saham bergantung pada logik linear: RSI bawah 30 = terlebih jual = isyarat beli. Tetapi pasaran ketakutan tidak mengikut peraturan linear. Saya belajar ini dengan susah payah apabila melihat penyaring momentum kami menandakan "tawaran murah" yang jatuh lagi 40%.
Masalahnya? Ketakutan mencipta hubungan tidak linear antara penunjuk. Saham dengan RSI 20 dalam pasaran normal mungkin melantun. RSI 20 yang sama semasa kapitulasi? Itu pisau jatuh.
Inilah yang membunuh penyaring tradisional dalam ketakutan:
- Ambang linear mengabaikan konteks pasaran
- Penunjuk tunggal terlepas corak multidimensi
- Peraturan statik tidak boleh menyesuaikan diri dengan perubahan rejim
- Hubungan volum/harga menjadi tidak linear
Inilah tepatnya di mana pembelajaran mesin β khususnya SVM β cemerlang. Tidak seperti regresi linear, SVM boleh mencari sempadan keputusan kompleks dalam ruang berdimensi tinggi. Fikirkannya sebagai melukis lengkung di sekeliling kelompok data dan bukan garis lurus.

Seni Bina SVM Yang Benar-benar Berfungsi
Selepas menguji 47 algoritma ML berbeza (ya, saya kira), mesin vektor sokongan secara konsisten mengatasi atas satu sebab: ia mengendalikan outlier dengan cemerlang. Pasaran ketakutan ADALAH outlier.
Inilah seni bina teras dalam kod pseudo:
// Pembinaan vektor ciri
features = [
normalized_rsi_divergence,
volume_price_ratio,
liquidity_score,
institutional_flow_indicator,
cross_asset_correlation,
vix_regime_indicator
]
// SVM dengan kernel RBF untuk corak tidak linear
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)
// Kalibrasi kebarangkalian untuk skor keyakinan
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)
Keajaiban berlaku dalam kejuruteraan ciri. Data harga mentah adalah hingar β anda perlukan ciri tingkah laku yang menangkap dinamik ketakutan.
Kejuruteraan Ciri: Rahsia Kejayaan
Kebanyakan artikel perdagangan ML hanya menyentuh secara ringkas tentang ciri. Itu seperti memberi seseorang Ferrari tanpa kunci. Inilah ciri tepat yang mengubah kadar kemenangan saya:
1. Skor Percanggahan RSI Dinormalisasi
Bukan sekadar RSI β kadar perubahan dalam RSI relatif kepada pergerakan harga. Dalam Pine Script:
rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)
2. Nisbah Penyelewengan Volum/Harga
Mengukur apabila volum meletup tetapi harga hampir tidak bergerak β pengumpulan klasik:
vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability
3. Korelasi Ketakutan Aset Silang
Apabila korelasi pecah, pembalikan sering menyusul. Saya mengesan korelasi saham dengan VIX, emas, dan bon kerajaan.
Ini bukan rawak β setiap ciri muncul daripada menganalisis ribuan dagangan gagal. Seperti yang saya terangkan dalam analisis percanggahan RSI saya, konteks mengubah keberkesanan penunjuk.

Latihan Berasaskan Ketakutan: Cabaran Data
Di sinilah 90% peniaga ML gagal: mereka melatih pada semua keadaan pasaran secara sama rata. Itu seperti berlatih untuk maraton dengan hanya berjoging. Anda perlukan data latihan khusus ketakutan.
Pendekatan saya:
- Tapis data latihan kepada tempoh VIX > 25 sahaja
- Oversampel hari ketakutan melampau (VIX > 40) sebanyak 3x
- Masukkan pelbagai rejim ketakutan: 2008, 2020, 2022
- Sahkan pada tempoh ketakutan luar sampel
Pelarasan VaR yang saya gunakan membantu menentukan rejim ketakutan ini secara pengaturcaraan. Tanpa penapisan rejim yang betul, model anda belajar corak yang salah.
Pandangan kritikal: Ketidakseimbangan kelas akan membunuh anda. Pembalikan ketakutan jarang β mungkin 5% daripada semua hari dagangan. Amalan ML standard mencadangkan mengimbangi kelas. Jangan. Sebaliknya, gunakan pemberat kelas yang mencerminkan realiti:
class_weights = {
'reversal': 1.0,
'continuation': 0.05
}
Ini menghalang model anda daripada menangis serigala pada setiap lilin merah.
Semakan Realiti Ujian Balik: Kadar Kemenangan 73%
Kertas akademik suka mendakwa ketepatan 90%+. Dalam dagangan langsung? Cerita berbeza. Penyaring SVM saya mencapai ketepatan 73% pada panggilan pembalikan sebenar β inilah pecahannya:
- Jualan Balas Q4 2018: 14/19 panggilan betul (73.7%)
- COVID Mac 2020: 22/28 betul (78.6%)
- Pasaran Beruang 2022: 47/68 betul (69.1%)
Model berprestasi terbaik dalam jualan balas tajam yang didorong ketakutan. Pasaran beruang yang perlahan mengurangkan ketepatan β pendekatan pengumpulan berlapis berfungsi lebih baik di sana.

Pelaksanaan Langsung: Dari Model ke Dagangan
Model tanpa pelaksanaan adalah masturbasi akademik. Inilah cara saya mengintegrasikan penyaringan SVM ke dalam dagangan langsung:
Aliran Kerja Harian (30 minit sebelum penutupan):
- Jalankan penyaring pada alam semesta 500 saham cair
- Tapis untuk kebarangkalian pembalikan > 0.7
- Kedudukan mengikut kebarangkalian * magnitud pergerakan dijangkakan
- Semakan manual 10 calon teratas
- Saiz kedudukan berdasarkan keyakinan dan pecahan Kelly
Lapisan Pengurusan Risiko:
if vix > 30:
position_size *= 0.5 # Separuh saiz dalam ketakutan melampau
stop_loss = atr * 3 # Henti rugi lebih luas untuk turun naik
else:
position_size = base_size
stop_loss = atr * 2
Jangan percaya model secara membuta tuli. Saya belajar ini selepas SVM saya menandakan Lehman Brothers sebagai "calon pembalikan kuat" pada September 2008. Sesetengah pembalikan tidak pernah datang.
Aplikasi Pasaran Semasa (Mac 2026)
Dengan Fear & Greed pada 14 dan Bitcoin menguji paras rendah terkini, kami berada dalam wilayah SVM utama. Imbasan semalam menandakan persediaan menarik:
- Gergasi teknologi menunjukkan penyelewengan: Volum tinggi, pergerakan harga minima
- Bank serantau mempamerkan percanggahan RSI: Harga buat rendah baharu, RSI lebih tinggi
- Saham komoditi memecahkan korelasi: Menyahganding daripada niaga hadapan asas
Penunjuk kolam gelap mengesahkan pengumpulan institusi dalam beberapa nama. Pertemuan isyarat ML + data aliran ini adalah di mana kelebihan berganda.
Ingat: model mengenal pasti calon, bukan jaminan. Dalam keadaan semasa, saya selektif β mengambil hanya persediaan A+ di mana pelbagai sistem selaras.

Teknik Lanjutan: Kaedah Ensemble
Model tunggal mempunyai titik kegagalan tunggal. Di Two Sigma, kami tidak pernah memperdagangkan algoritma solo. Inilah pendekatan ensemble saya:
- SVM untuk isyarat utama (pengenalpastian corak tidak linear)
- Random Forest untuk pengesahan (keluarga algoritma berbeza)
- LSTM untuk pengesahan urutan (menangkap corak temporal)
Hanya apabila 2/3 model bersetuju, saya menganggap isyarat itu sah. Ini mengurangkan positif palsu ~40% sambil mengekalkan kebanyakan isyarat benar.
Bagi mereka yang berminat dengan pelaksanaan automatik, sistem amaran FibAlgo boleh mencetus apabila model ML anda mengeluarkan isyarat keyakinan tinggi, merapatkan jurang antara analisis Python dan pelaksanaan TradingView.
Rangka kerja pemulihan min yang saya bincangkan menunjukkan faedah ensemble serupa β pelbagai perspektif mengurangkan risiko model tunggal.
Perangkap Biasa dalam Penyaringan Saham ML
Biar saya jimatkan anda berbulan-bulan kesakitan. Kesilapan ini membunuh model awal saya:
Terlebih padan kepada peristiwa khusus: Model pertama saya menghafal corak kejatuhan 2008. Tidak berguna pada 2020. Gunakan pengesahan silang k-fold dengan kesedaran temporal β jangan latih pada data masa depan.
Kebocoran ciri: Memasukkan volum esok dalam ramalan hari ini. Kedengaran jelas, tetapi ciri terbitan boleh menyembunyikan kebocoran temporal. Sentiasa fikir: "Bolehkah saya tahu ini pada masa ramalan?"
Mengabaikan kos transaksi: Kadar kemenangan 73% itu menganggap geseran sifar. Dalam realiti, tambah 10bps untuk slip, 5bps untuk komisen. Kelebihan kecil hilang dengan cepat.
Kerosakan model: Pasaran berkembang. Model 2018 saya merosot kepada ketepatan 61% menjelang 2020. Latih semula suku tahunan minimum, bulanan semasa perubahan rejim.
Seperti yang diterangkan dalam panduan risiko AMM saya, strategi sistematik memerlukan pemantauan dan pelarasan berterusan.
Membina Sistem Penyaringan ML Anda Sendiri
Mulakan dengan mudah. Kerumitan bukan kelebihan β pelaksanaan betul adalah kelebihan. Inilah peta jalan anda:
Minggu 1-2: Pengumpulan dan pembersihan data. Gunakan Yahoo Finance atau Alpha Vantage untuk data percuma. Bina alam semesta saham cair (permodanaan pasaran $1B+, volum harian 1M+).
Minggu 3-4: Kejuruteraan ciri. Mulakan dengan tiga ciri teras saya di atas. Tambah lain berdasarkan hipotesis pasaran anda. Artikel adaptasi OBV menunjukkan cara mengubah suai penunjuk untuk konteks khusus.
Minggu 5-6: Latihan dan pengesahan model. Gunakan scikit-learn untuk pelaksanaan SVM. Fokus pada pembahagian latihan/ujian betul β susunan temporal penting!
Minggu 7-8: Ujian balik dan dagangan kertas. Jalankan penyaring anda setiap hari, jejak ramalan vs hasil. Tiada wang sebenar sehingga 100+ dagangan kertas.
Minggu 9+: Pelaksanaan langsung dengan saiz kecil. Mulakan dengan risiko 0.25% setiap isyarat. Skala hanya selepas membuktikan konsistensi.
Realiti Dagangan Pembelajaran Mesin
ML bukanlah sihir. Ia adalah pengenalpastian corak pada skala besar. Penyaring SVM saya tidak meramal masa depan β ia mengenal pasti bila keadaan semasa sepadan dengan persediaan yang menguntungkan secara sejarah.
Kelebihan datang dari tiga sumber:
- Memproses lebih banyak data berbanding manusia (500 saham, 6 ciri setiap satu)
- Menjaga disiplin semasa ketakutan (algoritma tidak panik)
- Pelaksanaan yang konsisten (peraturan sama setiap hari)
Tapi inilah hakikatnya β anda masih memerlukan intuisi dagangan. Model menandakan peluang; anda menentukan saiz posisi, masa, dan pengurusan risiko. Dagangan sistematik tulen berfungsi sehingga ia gagal. Tanya sahaja pakar kuantitatif yang musnah pada Ogos 2007.
Di Two Sigma, strategi terbaik kami menggabungkan kepintaran mesin dengan pengawasan manusia. Mesin mencari corak. Manusia mengurus risiko, terutamanya semasa perubahan rejim apabila model yang dilatih pada data sejarah menjadi buta sementara.
Dengan pasaran menunjukkan bacaan ketakutan melampau, kami berada di zon optimum untuk penyaringan pembalikan berasaskan ML. Sama ada anda membina sistem sendiri atau menyesuaikan sistem saya, ingat: matlamatnya bukan kesempurnaan. Ia adalah kelebihan konsisten, bersaiz betul, dengan risiko ekor diuruskan.
Kerana pada akhirnya, bertahan daripada 27% isyarat gagal lebih penting daripada menangkap setiap pembalikan. Algoritma terbaik tidak boleh berdagang jika anda musnah pada pencilan.




