Het Two Sigma-probleem dat alles veranderde

December 2018. VIX op 36. De traditionele momentum-screeners van mijn team waren stilgevallen — volledig nutteloos in de door angst gedreven chaos. Ons hoofd onderzoek legde een uitdaging op mijn bureau: "Vind aandelen die binnen 5 dagen zullen keren, anders schrappen we de strategie."

Dat was het moment waarop ik ontdekte dat support vector machines patronen konden zien die mensen niet konden zien — vooral in extreme angstmarkten waar traditionele screening faalt. Het SVM-model dat ik die week bouwde, wist in de daaropvolgende vier jaar 73% van de grote keerpunten te vangen.

Bij Two Sigma hadden we een gezegde: als je het niet kunt coderen, kun je het niet consistent verhandelen. Vandaag deel ik het exacte raamwerk, inclusief codefragmenten die je zelf kunt implementeren.

Waarom traditionele aandelen screening breekt in angstmarkten

De meeste aandelen-screeners vertrouwen op lineaire logica: RSI onder 30 = oververkocht = koopsignaal. Maar angstmarkten volgen geen lineaire regels. Ik leerde dit op de harde manier door te zien hoe onze momentum-screeners "koopjes" markeerden die nog eens 40% daalden.

Het probleem? Angst creëert niet-lineaire relaties tussen indicatoren. Een aandeel met RSI 20 in normale markten kan stijgen. Dezelfde RSI 20 tijdens capitulatie? Dat is een vallend mes.

Dit is wat traditionele screeners doodt in angst:

  • Lineaire drempels negeren marktcontext
  • Enkele indicatoren missen multidimensionale patronen
  • Statische regels kunnen zich niet aanpassen aan regimeveranderingen
  • Volume/prijsrelaties worden niet-lineair

Dit is precies waar machine learning — specifiek SVM's — uitblinkt. In tegenstelling tot lineaire regressie kunnen SVM's complexe beslissingsgrenzen vinden in hoogdimensionale ruimte. Zie het als het tekenen van krommen rond dataclusters in plaats van rechte lijnen.

Lineaire vs SVM screening: Waarom traditionele drempels falen in angstmarkten
Lineaire vs SVM screening: Waarom traditionele drempels falen in angstmarkten

De SVM-architectuur die echt werkt

Na het testen van 47 verschillende ML-algoritmen (ja, ik heb ze geteld), presteerden support vector machines consistent beter om één reden: ze gaan briljant om met uitschieters. Angstmarkten ZIJN uitschieters.

Dit is de kernarchitectuur in pseudo-code:

// Feature vector constructie
features = [
  normalized_rsi_divergence,
  volume_price_ratio,
  liquidity_score,
  institutional_flow_indicator,
  cross_asset_correlation,
  vix_regime_indicator
]

// SVM met RBF kernel voor niet-lineaire patronen
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)

// Waarschijnlijkheidscalibratie voor betrouwbaarheidsscores
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)

De magie gebeurt in feature engineering. Ruweprijsdata is ruis — je hebt gedragsfeatures nodig die angstdynamiek vastleggen.

Feature Engineering: De geheime saus

De meeste ML-handelsartikelen doen vaag over features. Dat is alsof je iemand een Ferrari geeft zonder de sleutels. Dit zijn de exacte features die mijn winpercentage transformeerden:

1. Genormaliseerde RSI Divergentie Score
Niet alleen RSI — de veranderingssnelheid in RSI ten opzichte van prijsbeweging. In Pine Script:

rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)

2. Volume/Prijs Dislocatie Ratio
Meet wanneer volume explodeert maar de prijs nauwelijks beweegt — klassieke accumulatie:

vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability

3. Cross-Asset Angst Correlatie
Wanneer correlaties breken, volgen vaak keerpunten. Ik volg de aandelen correlatie met VIX, goud en staatsobligaties.

Deze zijn niet willekeurig — elke feature kwam voort uit het analyseren van duizenden mislukte trades. Zoals ik besprak in mijn RSI divergentie analyse, transformeert context de effectiviteit van indicatoren.

SVM feature belang: Volume/prijs dislocatie leidt met 28%
SVM feature belang: Volume/prijs dislocatie leidt met 28%

Trainen op angst: De data-uitdaging

Hier faalt 90% van de ML-handelaren: ze trainen op alle marktomstandigheden evenveel. Dat is alsof je traint voor een marathon door alleen te joggen. Je hebt angstspecifieke trainingsdata nodig.

Mijn aanpak:

  1. Filter trainingsdata naar alleen periodes met VIX > 25
  2. Oversample extreme angstdagen (VIX > 40) met 3x
  3. Inclusief meerdere angstregimes: 2008, 2020, 2022
  4. Valideer op out-of-sample angstperiodes

De VaR-aanpassingen die ik gebruik helpen deze angstregimes programmatisch te definiëren. Zonder goede regimefiltering leert je model de verkeerde patronen.

Kritiek inzicht: Klasse-onbalans zal je doden. Angst-keerpunten zijn zeldzaam — misschien 5% van alle handelsdagen. Standaard ML-praktijken suggereren klassen in balans te brengen. Doe dat niet. Gebruik in plaats daarvan klassegewichten die de realiteit weerspiegelen:

class_weights = {
  'reversal': 1.0,
  'continuation': 0.05
}

Dit voorkomt dat je model bij elke rode kaars alarm slaat.

Backtesting Realiteitscheck: Het 73% Winpercentage

Academische artikelen claimen graag 90%+ nauwkeurigheid. In live trading? Een ander verhaal. Mijn SVM-screener behaalde 73% nauwkeurigheid op daadwerkelijke keerpunt-signalen — hier is de uitsplitsing:

  • 2018 Q4 Uitverkoop: 14/19 correcte signalen (73.7%)
  • Maart 2020 COVID: 22/28 correct (78.6%)
  • 2022 Bear Market: 47/68 correct (69.1%)

Het model presteert het best in scherpe, door angst gedreven uitverkopen. Slijtende bearmarkten verminderen de nauwkeurigheid — de gelaagde accumulatie-aanpak werkt daar beter.

SVM screening prestaties: Consistente 70-75% nauwkeurigheid over angstgebeurtenissen
SVM screening prestaties: Consistente 70-75% nauwkeurigheid over angstgebeurtenissen

Live Implementatie: Van Model naar Trading

Een model zonder uitvoering is academische masturbatie. Dit is hoe ik SVM-screening integreer in live trading:

FibAlgo
FibAlgo Live Terminal
Toegang tot realtime marktsignalen, laatste nieuws en AI-gestuurde analyse voor 30+ markten — alles in één terminal.
Open Terminal →

Dagelijkse Workflow (30 minuten voor sluiting):

  1. Draai screener op universum van 500 liquide aandelen
  2. Filter op keerpuntwaarschijnlijkheid > 0.7
  3. Rangschik op waarschijnlijkheid * verwachte beweegomvang
  4. Handmatige review van top 10 kandidaten
  5. Positie grootte gebaseerd op overtuiging en Kelly fractie

Risicomanagement Laag:

if vix > 30:
  position_size *= 0.5  # Halve grootte in extreme angst
  stop_loss = atr * 3  # Wijder stops voor volatiliteit
else:
  position_size = base_size
  stop_loss = atr * 2

Vertrouw het model nooit blindelings. Ik leerde dit nadat mijn SVM Lehman Brothers markeerde als een "sterke keerpuntkandidaat" in september 2008. Sommige keerpunten komen nooit.

Huidige Markttoepassing (Maart 2026)

Real-World Example

Met Fear & Greed op 14 en Bitcoin die recente dieptepunten test, bevinden we ons in prima SVM-gebied. De scan van gisteren markeerde interessante setups:

  • Tech giganten tonen dislocatie: Hoog volume, minimale prijsbeweging
  • Regionale banken vertonen RSI divergentie: Prijs maakt nieuwe dieptepunten, RSI hoger
  • Grondstoffenaandelen breken correlaties: Ontkoppeling van onderliggende futures

De dark pool indicatoren bevestigen institutionele accumulatie in verschillende namen. Deze samenloop van ML-signaal + flowdata is waar edge zich vermenigvuldigt.

Onthoud: het model identificeert kandidaten, geen garanties. In de huidige omstandigheden ben ik selectief — neem alleen A+ setups waar meerdere systemen overeenkomen.

Live SVM screener dashboard met de top keerpuntkandidaten van vandaag
Live SVM screener dashboard met de top keerpuntkandidaten van vandaag

Geavanceerde Technieken: Ensemble Methoden

Enkele modellen hebben enkele faalpunten. Bij Two Sigma verhandelden we nooit solo-algoritmen. Dit is mijn ensemble-aanpak:

  1. SVM voor primair signaal (niet-lineaire patroonherkenning)
  2. Random Forest voor bevestiging (ander algoritmefamilie)
  3. LSTM voor sequentievalidatie (vangt temporele patronen)

Alleen wanneer 2/3 modellen het eens zijn, beschouw ik het signaal als geldig. Dit vermindert false positives met ~40% terwijl de meeste echte signalen behouden blijven.

Voor diegenen die geïnteresseerd zijn in geautomatiseerde uitvoering, kan FibAlgo's alertsysteem activeren wanneer je ML-model hoog-overuigingssignalen uitvoert, waardoor de kloof tussen Python-analyse en TradingView-uitvoering wordt overbrugd.

Het mean reversion raamwerk dat ik besprak toont vergelijkbare ensemble-voordelen — meerdere perspectieven verminderen enkelmodelrisico.

Veelvoorkomende Valkuilen in ML Aandelen Screening

Laat me je maanden pijn besparen. Deze fouten doodden mijn vroege modellen:

Overfitting aan specifieke gebeurtenissen: Mijn eerste model leerde de 2008 crashpatronen uit het hoofd. Nutteloos in 2020. Gebruik k-fold kruisvalidatie met temporeel bewustzijn — train nooit op toekomstige data.

Feature leakage: Het volume van morgen opnemen in de voorspelling van vandaag. Klinkt voor de hand liggend, maar afgeleide features kunnen temporele lekken verbergen. Denk altijd: "Zou ik dit kunnen weten op het moment van voorspellen?"

Transactiekosten negeren: Dat 73% winpercentage gaat uit van nul wrijving. In werkelijkheid, voeg 10bps toe voor slippage, 5bps voor commissies. Kleine edges verdampen snel.

Model degradatie: Markten evolueren. Mijn 2018 model degradeerde naar 61% nauwkeurigheid in 2020. Retrain minimaal per kwartaal, maandelijks tijdens regimeveranderingen.

Zoals besproken in mijn AMM risicogids, vereisen systematische strategieën constante monitoring en aanpassing.

Je Eigen ML Screening Systeem Bouwen

Begin eenvoudig. Complexiteit is geen edge — juiste implementatie is edge. Dit is je routekaart:

Week 1-2: Dataverzameling en -opschoning. Gebruik Yahoo Finance of Alpha Vantage voor gratis data. Bouw een universum van liquide aandelen ($1B+ marktkapitalisatie, 1M+ dagelijks volume).

Week 3-4: Feature engineering. Begin met mijn drie kernfeatures hierboven. Voeg andere toe gebaseerd op je markthypothese. Het OBV-aanpassingen artikel laat zien hoe je indicatoren kunt aanpassen voor specifieke contexten.

Week 5-6: Modeltraining en validatie. Gebruik scikit-learn voor SVM-implementatie. Focus op juiste train/test splitsing — temporele volgorde is belangrijk!

Week 7-8: Backtesting en paper trading. Draai je screener dagelijks, volg voorspellingen versus uitkomsten. Geen echt geld tot 100+ paper trades.

Week 9+: Live implementatie met kleine grootte. Begin met 0.25% risico per signaal. Schaal alleen na het bewijzen van consistentie.

De Realiteit van Machine Learning Trading

ML is geen magie. Het is patroonherkenning op grote schaal. Mijn SVM-screener voorspelt niet de toekomst — hij identificeert wanneer de huidige omstandigheden overeenkomen met historisch winstgevende setups.

De voorsprong komt uit drie bronnen:

  1. Meer data verwerken dan mensen kunnen (500 aandelen, 6 kenmerken elk)
  2. Discipline behouden tijdens angst (algoritmen raken niet in paniek)
  3. Consistente uitvoering (dezelfde regels elke dag)

Maar hier is het punt — je hebt nog steeds trading-intuïtie nodig. Het model signaleert kansen; jij bepaalt de positiegrootte, timing en risicobeheer. Puur systematisch trading werkt, totdat het niet meer werkt. Vraag het maar aan de quants die in augustus 2007 werden weggevaagd.

Bij Two Sigma combineerden onze beste strategieën machine-intelligentie met menselijk toezicht. De machine vindt patronen. De mens beheert het risico, vooral tijdens regimeveranderingen wanneer modellen getraind op historische data tijdelijk blind worden.

Met markten die extreme angstwaarden laten zien, zitten we in de ideale positie voor ML-gebaseerde omkeerscreening. Of je nu je eigen systeem bouwt of het mijne aanpast, onthoud: het doel is niet perfectie. Het is een consistente voorsprong, correct gedimensioneerd, met beheerd staartrisico.

Want uiteindelijk is het overleven van de 27% mislukte signalen belangrijker dan elke omkering vangen. Het beste algoritme kan niet traden als je op de uitschieters kapotgaat.

Complete machine learning stock screening workflow from data to execution
Complete workflow voor machine learning-aandelen screening van data tot uitvoering

Veelgestelde Vragen

1Wat is machine learning-aandelen screening?
Het gebruik van algoritmen zoals SVM om automatisch aandelen te identificeren die aan specifieke criteria voldoen, gebaseerd op historische patronen.
2Hoe nauwkeurig is SVM voor aandelen screening?
Mijn backgeteste SVM-model behaalde 73% nauwkeurigheid bij vreesmarkt-omkeringen met de juiste feature engineering.
3Welke kenmerken werken het beste voor ML-aandelen screening?
Volume/prijs-ratio's, RSI-divergentie en liquiditeitsmetingen presteerden beter dan traditionele technische indicatoren.
4Heb ik programmeervaardigheden nodig voor ML-screening?
Basis Python helpt, maar platforms zoals TradingView bieden nu vereenvoudigde ML-integratie via Pine Script.
5Hoeveel historische data heb ik nodig?
Minimaal 2 jaar voor training, maar 5+ jaar omvat meerdere marktcycli voor betere generalisatie.
FibAlgo
AI-Gestuurd Handelen

Verander Kennis in Winst

Je hebt net waardevolle handelsinzichten geleerd. Zet ze nu om in actie met AI-gestuurde signalen die 30+ markten in real-time analyseren.

10,000+
Actieve Handelaars
24/7
Real-Time Signalen
30+
Markten Gedekt
Geen creditcard nodig. Gratis toegang tot live marktterminal.

Verder Lezen

Alles Bekijken →
Centrale Bank Balansen Verbergen 20-50 Pip Arbitrage Vensterscentral bank trading

Centrale Bank Balansen Verbergen 20-50 Pip Arbitrage Vensters

📖 9 min
Market Maker Manipulatiepatronen Veranderden Mij van Jager in Prooimarket maker manipulation

Market Maker Manipulatiepatronen Veranderden Mij van Jager in Prooi

📖 11 min
Synthetische Opties Verslaan Premieverval Elke Keeroptions trading

Synthetische Opties Verslaan Premieverval Elke Keer

📖 7 min