Masalah Two Sigma yang Mengubah Segalanya

Desember 2018. VIX di level 36. Penyaring momentum tradisional tim saya sudah diam β€” sama sekali tidak berguna dalam kekacauan yang digerakkan ketakutan. Kepala penelitian saya melemparkan tantangan di meja saya: "Temukan saham yang akan berbalik arah dalam 5 hari, atau kami hentikan strateginya."

Saat itulah saya menemukan support vector machines bisa melihat pola yang tidak bisa dilihat manusia β€” terutama di pasar ketakutan ekstrem di mana penyaringan tradisional gagal. Model SVM yang saya buat minggu itu kemudian berhasil menangkap 73% dari pembalikan arah besar selama empat tahun berikutnya.

Di Two Sigma, kami punya pepatah: jika Anda tidak bisa mengkodenya, Anda tidak bisa memperdagangkannya secara konsisten. Hari ini saya berbagi kerangka kerja persisnya, termasuk potongan kode yang bisa Anda implementasikan sendiri.

Mengapa Penyaringan Saham Tradisional Rusak di Pasar Ketakutan

Kebanyakan penyaring saham mengandalkan logika linear: RSI di bawah 30 = oversold = sinyal beli. Tapi pasar ketakutan tidak mengikuti aturan linear. Saya belajar ini dengan susah payah saat melihat penyaring momentum kami menandai "barang murah" yang kemudian jatuh lagi 40%.

Masalahnya? Ketakutan menciptakan hubungan non-linear antar indikator. Saham dengan RSI 20 di pasar normal mungkin memantul. RSI 20 yang sama selama kapitulasi? Itu pisau jatuh.

Inilah yang membunuh penyaring tradisional dalam ketakutan:

  • Ambang batas linear mengabaikan konteks pasar
  • Indikator tunggal melewatkan pola multidimensi
  • Aturan statis tidak bisa beradaptasi dengan perubahan rezim
  • Hubungan volume/harga menjadi non-linear

Ini persis di mana machine learning β€” khususnya SVM β€” unggul. Tidak seperti regresi linear, SVM dapat menemukan batas keputusan kompleks di ruang berdimensi tinggi. Anggap saja seperti menggambar kurva di sekitar kluster data alih-alih garis lurus.

Linear vs SVM screening: Why traditional thresholds fail in fear markets
Penyaringan Linear vs SVM: Mengapa ambang batas tradisional gagal di pasar ketakutan
✦

Arsitektur SVM yang Benar-Benar Berfungsi

Setelah menguji 47 algoritma ML berbeda (ya, saya hitung), support vector machines secara konsisten lebih unggul karena satu alasan: mereka menangani outlier dengan brilian. Pasar ketakutan ADALAH outlier.

Ini arsitektur intinya dalam kode semu:

// Konstruksi vektor fitur
features = [
  normalized_rsi_divergence,
  volume_price_ratio,
  liquidity_score,
  institutional_flow_indicator,
  cross_asset_correlation,
  vix_regime_indicator
]

// SVM dengan kernel RBF untuk pola non-linear
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)

// Kalibrasi probabilitas untuk skor keyakinan
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)

Keajaiban terjadi dalam rekayasa fitur. Data harga mentah adalah noise β€” Anda butuh fitur perilaku yang menangkap dinamika ketakutan.

Rekayasa Fitur: Rahasia Sukses

Kebanyakan artikel trading ML mengabaikan fitur. Itu seperti memberi seseorang Ferrari tanpa kuncinya. Ini fitur tepat yang mengubah tingkat kemenangan saya:

1. Skor Divergensi RSI yang Dinormalisasi
Bukan hanya RSI β€” tingkat perubahan dalam RSI relatif terhadap pergerakan harga. Dalam Pine Script:

rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)

2. Rasio Dislokasi Volume/Harga
Mengukur saat volume meledak tapi harga hampir tidak bergerak β€” akumulasi klasik:

vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability

3. Korelasi Ketakutan Lintas Aset
Saat korelasi rusak, pembalikan arah sering menyusul. Saya lacak korelasi saham terhadap VIX, emas, dan surat utang.

Ini bukan acak β€” setiap fitur muncul dari analisis ribuan perdagangan gagal. Seperti yang saya bahas dalam analisis divergensi RSI saya, konteks mengubah efektivitas indikator.

SVM feature importance: Volume/price dislocation leads at 28%
Pentingnya Fitur SVM: Dislokasi volume/harga memimpin di 28%

Melatih pada Ketakutan: Tantangan Data

Di sinilah 90% trader ML gagal: mereka melatih pada semua kondisi pasar secara setara. Itu seperti berlatih maraton hanya dengan jogging. Anda butuh data pelatihan spesifik ketakutan.

Pendekatan saya:

  1. Saring data pelatihan hanya ke periode VIX > 25
  2. Oversample hari ketakutan ekstrem (VIX > 40) sebanyak 3x
  3. Sertakan beberapa rezim ketakutan: 2008, 2020, 2022
  4. Validasi pada periode ketakutan di luar sampel

Penyesuaian VaR yang saya gunakan membantu mendefinisikan rezim ketakutan ini secara terprogram. Tanpa penyaringan rezim yang tepat, model Anda belajar pola yang salah.

Wawasan kritis: Ketidakseimbangan kelas akan membunuh Anda. Pembalikan ketakutan langka β€” mungkin 5% dari semua hari perdagangan. Praktik ML standar menyarankan menyeimbangkan kelas. Jangan. Sebagai gantinya, gunakan bobot kelas yang mencerminkan realitas:

class_weights = {
  'reversal': 1.0,
  'continuation': 0.05
}

Ini mencegah model Anda meneriakkan serigala pada setiap lilin merah.

✦

Pengecekan Realitas Backtesting: Tingkat Kemenangan 73%

Makalah akademis suka mengklaim akurasi 90%+. Dalam perdagangan langsung? Cerita berbeda. Penyaring SVM saya mencapai akurasi 73% pada panggilan pembalikan aktual β€” ini rinciannya:

  • Penjualan Q4 2018: 14/19 panggilan benar (73.7%)
  • COVID Maret 2020: 22/28 benar (78.6%)
  • Pasar Bear 2022: 47/68 benar (69.1%)

Model berkinerja terbaik dalam penjualan tajam yang digerakkan ketakutan. Pasar bear yang lambat mengurangi akurasi β€” pendekatan akumulasi berlapis bekerja lebih baik di sana.

SVM screening performance: Consistent 70-75% accuracy across fear events
Kinerja Penyaringan SVM: Akurasi konsisten 70-75% di berbagai peristiwa ketakutan

Implementasi Langsung: Dari Model ke Trading

Model tanpa eksekusi adalah masturbasi akademis. Begini cara saya mengintegrasikan penyaringan SVM ke perdagangan langsung:

FibAlgo
Terminal Langsung FibAlgo
Akses sinyal pasar real-time, berita terkini & analisis berbasis AI untuk 30+ pasar β€” semuanya dalam satu terminal.
Buka Terminal β†’

Alur Kerja Harian (30 menit sebelum tutup):

  1. Jalankan penyaring pada alam semesta 500 saham likuid
  2. Saring untuk probabilitas pembalikan > 0.7
  3. Peringkat berdasarkan probabilitas * besaran pergerakan yang diharapkan
  4. Tinjau manual 10 kandidat teratas
  5. Ukuran posisi berdasarkan keyakinan dan fraksi Kelly

Lapisan Manajemen Risiko:

if vix > 30:
  position_size *= 0.5  # Setengah ukuran dalam ketakutan ekstrem
  stop_loss = atr * 3  # Stop loss lebih lebar untuk volatilitas
else:
  position_size = base_size
  stop_loss = atr * 2

Jangan pernah percaya model secara membabi buta. Saya belajar ini setelah SVM saya menandai Lehman Brothers sebagai "kandidat pembalikan kuat" di September 2008. Beberapa pembalikan tidak pernah datang.

Aplikasi Pasar Saat Ini (Maret 2026)

Real-World Example

Dengan Fear & Greed di 14 dan Bitcoin menguji terendah baru-baru ini, kita berada di wilayah utama SVM. Pemindaian kemarin menandai setup menarik:

  • Raksasa teknologi menunjukkan dislokasi: Volume tinggi, pergerakan harga minimal
  • Bank regional menampilkan divergensi RSI: Harga membuat terendah baru, RSI lebih tinggi
  • Saham komoditas merusak korelasi: Memisahkan dari futures dasar

Indikator dark pool mengkonfirmasi akumulasi institusional di beberapa nama. Pertemuan sinyal ML + data aliran ini adalah di mana edge berlipat ganda.

Ingat: model mengidentifikasi kandidat, bukan jaminan. Dalam kondisi saat ini, saya selektif β€” hanya mengambil setup A+ di mana beberapa sistem selaras.

Live SVM screener dashboard showing today's top reversal candidates
Dasbor penyaring SVM langsung menunjukkan kandidat pembalikan teratas hari ini
✦

Teknik Lanjutan: Metode Ensemble

Model tunggal memiliki titik kegagalan tunggal. Di Two Sigma, kami tidak pernah memperdagangkan algoritma solo. Ini pendekatan ensemble saya:

  1. SVM untuk sinyal primer (pengenalan pola non-linear)
  2. Random Forest untuk konfirmasi (keluarga algoritma berbeda)
  3. LSTM untuk validasi urutan (menangkap pola temporal)

Hanya ketika 2/3 model setuju saya anggap sinyal valid. Ini mengurangi false positive ~40% sambil mempertahankan sebagian besar sinyal benar.

Bagi yang tertarik eksekusi otomatis, sistem alert FibAlgo dapat memicu ketika model ML Anda mengeluarkan sinyal keyakinan tinggi, menjembatani kesenjangan antara analisis Python dan eksekusi TradingView.

Kerangka kerja mean reversion yang saya diskusikan menunjukkan manfaat ensemble serupa β€” banyak perspektif mengurangi risiko model tunggal.

Jebakan Umum dalam Penyaringan Saham ML

Izinkan saya menghemat Anda berbulan-bulan penderitaan. Kesalahan ini membunuh model awal saya:

Overfitting ke peristiwa spesifik: Model pertama saya menghafal pola crash 2008. Tidak berguna di 2020. Gunakan validasi silang k-fold dengan kesadaran temporal β€” jangan pernah latih pada data masa depan.

Kebocoran fitur: Menyertakan volume besok dalam prediksi hari ini. Kedengarannya jelas, tapi fitur turunan dapat menyembunyikan kebocoran temporal. Selalu pikirkan: "Bisakah saya tahu ini pada waktu prediksi?"

Mengabaikan biaya transaksi: Tingkat kemenangan 73% itu mengasumsikan nol friksi. Pada kenyataannya, tambahkan 10bps untuk slippage, 5bps untuk komisi. Edge kecil menguap dengan cepat.

Pembusukan model: Pasar berevolusi. Model 2018 saya terdegradasi ke akurasi 61% pada 2020. Latih ulang minimal triwulanan, bulanan selama perubahan rezim.

Seperti dibahas dalam panduan risiko AMM saya, strategi sistematis membutuhkan pemantauan dan penyesuaian konstan.

Membangun Sistem Penyaringan ML Anda Sendiri

Mulailah sederhana. Kompleksitas bukan edge β€” implementasi yang tepat adalah edge. Ini peta jalan Anda:

Minggu 1-2: Pengumpulan dan pembersihan data. Gunakan Yahoo Finance atau Alpha Vantage untuk data gratis. Bangun alam semesta saham likuid (kapitalisasi pasar $1B+, volume harian 1M+).

Minggu 3-4: Rekayasa fitur. Mulai dengan tiga fitur inti saya di atas. Tambahkan lainnya berdasarkan hipotesis pasar Anda. Artikel adaptasi OBV menunjukkan cara memodifikasi indikator untuk konteks spesifik.

Minggu 5-6: Pelatihan dan validasi model. Gunakan scikit-learn untuk implementasi SVM. Fokus pada pembagian train/test yang tepat β€” urutan temporal penting!

Minggu 7-8: Backtesting dan paper trading. Jalankan penyaring Anda setiap hari, lacak prediksi vs hasil. Tidak ada uang nyata sampai 100+ perdagangan kertas.

Minggu 9+: Implementasi langsung dengan ukuran kecil. Mulai dengan risiko 0.25% per sinyal. Skala hanya setelah membuktikan konsistensi.

✦

Realitas Trading dengan Machine Learning

ML bukanlah sihir. Ini adalah pengenalan pola dalam skala besar. Screener SVM saya tidak memprediksi masa depan β€” ia mengidentifikasi saat kondisi saat ini cocok dengan pola yang menguntungkan secara historis.

Keunggulan berasal dari tiga hal:

  1. Memproses lebih banyak data daripada yang bisa dilakukan manusia (500 saham, masing-masing 6 fitur)
  2. Mempertahankan disiplin saat ketakutan (algoritma tidak panik)
  3. Eksekusi yang konsisten (aturan yang sama setiap hari)

Tapi inilah faktanya β€” Anda tetap membutuhkan intuisi trading. Model menandai peluang; Anda yang memutuskan ukuran posisi, waktu, dan manajemen risiko. Trading sistematis murni berhasil sampai suatu saat tidak. Tanyakan saja pada para quant yang hancur pada Agustus 2007.

Di Two Sigma, strategi terbaik kami menggabungkan kecerdasan mesin dengan pengawasan manusia. Mesin menemukan pola. Manusia mengelola risiko, terutama selama perubahan rezim ketika model yang dilatih pada data historis menjadi buta sementara.

Dengan pasar menunjukkan pembacaan ketakutan ekstrem, kita berada di titik optimal untuk screening pembalikan berbasis ML. Baik Anda membangun sistem sendiri atau mengadaptasi milik saya, ingat: tujuannya bukan kesempurnaan. Ini tentang keunggulan konsisten, dengan ukuran yang tepat, dan risiko ekstrem yang dikelola.

Karena pada akhirnya, bertahan dari 27% sinyal yang gagal lebih penting daripada menangkap setiap pembalikan. Algoritma terbaik pun tidak bisa trading jika Anda hancur karena outlier.

Alur kerja lengkap screening saham machine learning dari data hingga eksekusi
Alur kerja lengkap screening saham machine learning dari data hingga eksekusi

❓Pertanyaan yang Sering Diajukan

1Apa itu penyaringan saham dengan pembelajaran mesin?
Menggunakan algoritma seperti SVM untuk secara otomatis mengidentifikasi saham yang memenuhi kriteria tertentu berdasarkan pola historis.
2Seberapa akurat SVM untuk penyaringan saham?
Model SVM yang saya uji kembali mencapai akurasi 73% pada pembalikan pasar ketakutan dengan rekayasa fitur yang tepat.
3Fitur apa yang paling baik untuk penyaringan saham ML?
Rasio volume/harga, divergensi RSI, dan metrik likuiditas mengungguli indikator teknis tradisional.
4Apakah saya perlu keterampilan pemrograman untuk penyaringan ML?
Python dasar membantu, tetapi platform seperti TradingView kini menawarkan integrasi ML yang disederhanakan melalui Pine Script.
5Berapa banyak data historis yang saya perlukan?
Minimal 2 tahun untuk pelatihan, tetapi 5+ tahun menangkap beberapa siklus pasar untuk generalisasi yang lebih baik.
FibAlgo
Trading Berbasis AI

Ubah Pengetahuan Jadi Profit

Anda baru saja mempelajari wawasan trading berharga. Sekarang terapkan dengan sinyal berbasis AI yang menganalisis 30+ pasar secara real-time.

10,000+
Trader Aktif
24/7
Sinyal Real-Time
30+
Pasar yang Dicakup
Tidak perlu kartu kredit. Akses gratis ke terminal pasar live.

Lanjutkan Membaca

Lihat Semua β†’
Neraca Bank Sentral Sembunyikan Peluang Arbitrase 20-50 Pipcentral bank trading

Neraca Bank Sentral Sembunyikan Peluang Arbitrase 20-50 Pip

πŸ“– 9 min
Pola Manipulasi Market Maker Mengubah Saya dari Pemburu Menjadi Yang Diburumarket maker manipulation

Pola Manipulasi Market Maker Mengubah Saya dari Pemburu Menjadi Yang Diburu

πŸ“– 11 min
Synthetic Options Mengalahkan Premium Decay Setiap Kalioptions trading

Synthetic Options Mengalahkan Premium Decay Setiap Kali

πŸ“– 7 min