Det To Sigma-problem, der ændrede alt
December 2018. VIX på 36. Mit teams traditionelle momentum-screenere var blevet stille – fuldstændig ubrugelige i den frygtdrevne kaos. Vores forskningschef lagde en udfordring på mit bord: "Find aktier, der vil vende inden for 5 dage, ellers dropper vi strategien."
Det var der, jeg opdagede, at support vector machines kunne se mønstre, mennesker ikke kunne – især i ekstreme frygtscenarier, hvor traditionel screening fejler. SVM-modellen, jeg byggede den uge, fangede 73% af større vendinger i de følgende fire år.
Hos Two Sigma havde vi et udtryk: hvis du ikke kan kode det, kan du ikke handle det konsekvent. I dag deler jeg den nøjagtige ramme, inklusive kodeeksempler, du selv kan implementere.
Hvorfor traditionel aktiescreening bryder sammen i frygtmarkeder
De fleste aktiescreenere er baseret på lineær logik: RSI under 30 = oversolgt = købssignal. Men frygtmarkeder følger ikke lineære regler. Jeg lærte dette på den hårde måde, da jeg så vores momentum-screenere flagge "tilbud", der faldt yderligere 40%.
Problemet? Frygt skaber ikke-lineære sammenhænge mellem indikatorer. En aktie med RSI 20 i normale markeder kan hoppe. Det samme RSI 20 under kapitulation? Det er et faldende kniv.
Her er hvad der dræber traditionelle screenere i frygt:
- Lineære tærskler ignorerer markedskontekst
- Enkeltindikatorer misser multidimensionelle mønstre
- Statiske regler kan ikke tilpasse sig regimeskift
- Volumen/pris-forhold bliver ikke-lineære
Det er præcis her, hvor maskinlæring – specifikt SVM'er – udmærker sig. I modsætning til lineær regression kan SVM'er finde komplekse beslutningsgrænser i højdimensionelt rum. Tænk på det som at tegne kurver omkring dataklynger i stedet for lige linjer.

SVM-arkitekturen, der faktisk virker
Efter at have testet 47 forskellige ML-algoritmer (ja, jeg talte dem), klarede support vector machines sig konsekvent bedst af én grund: de håndterer outliers fremragende. Frygtmarkeder ER outliers.
Her er kernearkitekturen i pseudokode:
// Konstruktion af feature-vektor
features = [
normalized_rsi_divergence,
volume_price_ratio,
liquidity_score,
institutional_flow_indicator,
cross_asset_correlation,
vix_regime_indicator
]
// SVM med RBF-kernel for ikke-lineære mønstre
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)
// Sandsynlighedskalibrering for konfidensscore
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)
Magien sker i feature engineering. Rå prisdata er støj – du har brug for adfærdsmæssige features, der fanger frygtdynamikker.
Feature Engineering: Den hemmelige ingrediens
De fleste ML-handelsartikler taler vagt om features. Det er som at give nogen en Ferrari uden nøglerne. Her er de nøjagtige features, der forvandlede min win rate:
1. Normaliseret RSI Divergence Score
Ikke bare RSI – ændringshastigheden i RSI i forhold til prisbevægelse. I Pine Script:
rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)
2. Volume/Pris Dislokationsratio
Måler, når volumen eksploderer, men prisen knap bevæger sig – klassisk akkumulation:
vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability
3. Cross-Asset Frygtkorrelation
Når korrelationer bryder sammen, følger vendinger ofte. Jeg tracker aktiekorrelation til VIX, guld og statsobligationer.
Disse er ikke tilfældige – hver feature opstod fra analyse af tusindvis af mislykkede handler. Som jeg dækkede i min RSI-divergenceanalyse, transformerer kontekst indikatoreffektivitet.

Træning på frygt: Dataudfordringen
Her er hvor 90% af ML-handlere fejler: de træner på alle markedsforhold lige. Det er som at træne til et maraton ved kun at løbe. Du har brug for frygtspecifik træningsdata.
Min tilgang:
- Filtrer træningsdata til kun VIX > 25 perioder
- Overprøv ekstreme frygtdage (VIX > 40) med 3x
- Inkluder flere frygtregimer: 2008, 2020, 2022
- Valider på uden-for-sample frygtperioder
VaR-justeringerne jeg bruger hjælper med at definere disse frygtregimer programmatisk. Uden korrekt regimefiltrering lærer din model de forkerte mønstre.
Kritisk indsigt: Class imbalance vil dræbe dig. Frygtvendinger er sjældne – måske 5% af alle handelsdage. Standard ML-praksis foreslår at balancere klasser. Gør det ikke. Brug i stedet klassevægte, der afspejler virkeligheden:
class_weights = {
'reversal': 1.0,
'continuation': 0.05
}
Dette forhindrer din model i at råbe ulv ved hvert rødt lys.
Backtesting-virkelighedstjek: Den 73% win rate
Akademiske artikler elsker at hævde 90%+ nøjagtighed. I livehandel? En anden historie. Min SVM-screener opnåede 73% nøjagtighed på faktiske vendinger – her er opdelingen:
- 2018 Q4 Selloff: 14/19 korrekte kald (73,7%)
- Marts 2020 COVID: 22/28 korrekte (78,6%)
- 2022 Bear Market: 47/68 korrekte (69,1%)
Modellen klarer sig bedst i skarpe, frygtdrevne udsalg. Slidte bjørnemarkeder reducerer nøjagtigheden – det lagrede akkumulationssystem fungerer bedre der.

Live-implementering: Fra model til handel
En model uden eksekvering er akademisk onani. Sådan integrerer jeg SVM-screening i livehandel:
Daglig arbejdsgang (30 minutter før luk):
- Kør screener på univers af 500 likvide aktier
- Filtrer for vendingssandsynlighed > 0,7
- Ranger efter sandsynlighed * forventet bevægelsesstørrelse
- Manuel gennemgang af top 10 kandidater
- Positionsstørrelse baseret på overbevisning og Kelly-fraktion
Risikostyringslag:
if vix > 30:
position_size *= 0.5 # Halv størrelse i ekstrem frygt
stop_loss = atr * 3 # Bredere stops for volatilitet
else:
position_size = base_size
stop_loss = atr * 2
Stol aldrig blindt på modellen. Jeg lærte dette, efter min SVM flagede Lehman Brothers som en "stærk vendingkandidat" i september 2008. Nogle vendinger kommer aldrig.
Nuværende markedsanvendelse (Marts 2026)
Med Fear & Greed på 14 og Bitcoin ved at teste nylige lavpunkter er vi i prime SVM-territorium. Gårsdagens scan flaggede interessante opsætninger:
- Tech-giganter viser dislokation: Høj volumen, minimal prisbevægelse
- Regionale banker viser RSI-divergence: Pris laver nye lavpunkter, RSI højere
- Råvareaktier bryder korrelationer: Afkobling fra underliggende futures
Dark pool-indikatorerne bekræfter institutionel akkumulation i flere navne. Denne sammenfald af ML-signal + flowdata er, hvor edge forstærkes.
Husk: modellen identificerer kandidater, ikke garantier. I nuværende forhold er jeg selektiv – tager kun A+ opsætninger, hvor flere systemer stemmer overens.

Avancerede teknikker: Ensemble-metoder
Enkeltmodeller har enkelte fejlpunkter. Hos Two Sigma handlede vi aldrig med solo-algoritmer. Her er min ensemble-tilgang:
- SVM for primært signal (ikke-lineær mønstergenkendelse)
- Random Forest for bekræftelse (anden algoritmefamilie)
- LSTM for sekvensvalidering (fanger tidsmæssige mønstre)
Kun når 2/3 modeller er enige, betragter jeg signalet som gyldigt. Dette reducerer falske positiver med ~40% samtidig med at de fleste sande signaler bevares.
For dem interesseret i automatiseret eksekvering kan FibAlgos alarmsystem udløses, når din ML-model outputter højkonfidenssignaler, og dermed bygger bro mellem Python-analyse og TradingView-eksekvering.
Mean reversion-rammen jeg diskuterede viser lignende ensemble-fordele – flere perspektiver reducerer enkeltmodelrisiko.
Almindelige faldgruber i ML-aktiescreening
Lad mig spare dig for måneders smerte. Disse fejl dræbte mine tidlige modeller:
Overfitting til specifikke hændelser: Min første model memorerede 2008-krak-mønstre. Ubrugelig i 2020. Brug k-fold krydsvalidering med tidsmæssig bevidsthed – træn aldrig på fremtidige data.
Feature leakage: Inkludering af morgendagens volumen i dagens forudsigelse. Lyder indlysende, men afledte features kan skjule tidsmæssige lækager. Tænk altid: "Kunne jeg vide dette på forudsigelsestidspunktet?"
Ignorering af transaktionsomkostninger: Den 73% win rate antager nul friktion. I virkeligheden, tilføj 10bps for slippage, 5bps for kommissioner. Små edges fordamper hurtigt.
Modelforfald: Markeder udvikler sig. Min 2018-model forfaldt til 61% nøjagtighed i 2020. Genoptæn kvartalsvis minimum, månedligt under regimeskift.
Som dækket i min AMM-risikoguide, kræver systematiske strategier konstant overvågning og justering.
Byg dit eget ML-screeningsystem
Start enkelt. Kompleksitet er ikke edge – korrekt implementering er edge. Her er din roadmap:
Uge 1-2: Dataindsamling og -rensning. Brug Yahoo Finance eller Alpha Vantage til gratis data. Byg et univers af likvide aktier ($1B+ market cap, 1M+ daglig volumen).
Uge 3-4: Feature engineering. Start med mine tre kernefeatures ovenfor. Tilføj andre baseret på din markedsantagelse. OBV-tilpasningsartiklen viser, hvordan man modificerer indikatorer til specifikke kontekster.
Uge 5-6: Modeltræning og validering. Brug scikit-learn til SVM-implementering. Fokuser på korrekt træn/test-opdeling – tidsmæssig rækkefølge betyder noget!
Uge 7-8: Backtesting og papirhandel. Kør din screener dagligt, spore forudsigelser vs resultater. Ingen rigtige penge før 100+ papirhandler.
Uge 9+: Live-implementering med lille størrelse. Start med 0,25% risiko per signal. Skaler kun efter at have bevist konsistens.
Virkeligheden bag Machine Learning Trading
ML er ikke magi. Det er mønstergenkendelse i stor skala. Min SVM-screener forudsiger ikke fremtiden – den identificerer, når nuværende forhold matcher historisk profitable opsætninger.
Fordelen kommer fra tre steder:
- Behandler mere data end mennesker kan (500 aktier, 6 funktioner hver)
- Opretholder disciplin under frygt (algoritmer panikker ikke)
- Konsekvent eksekvering (samme regler hver eneste dag)
Men her er sagen – du har stadig brug for handelsintuition. Modellen markerer muligheder; du beslutter positionsstørrelse, timing og risikostyring. Ren systematisk handel fungerer, indtil det ikke gør. Spørg bare kvantanalytikerne, der blev knust i august 2007.
Hos Two Sigma kombinerede vores bedste strategier maskinintelligens med menneskelig tilsyn. Maskinen finder mønstre. Mennesket styrer risikoen, især under regimeskift, når modeller trænet på historiske data midlertidigt bliver blinde.
Med markeder, der viser ekstreme frygtlæsninger, er vi i den ideelle position for ML-baseret vending-screening. Uanset om du bygger dit eget system eller tilpasser mit, husk: målet er ikke perfektion. Det er en konsekvent fordel, korrekt dimensioneret, med halerisiko styret.
For i sidste ende betyder det mere at overleve de 27% af fejlslagne signaler end at fange hver eneste vending. Den bedste algoritme kan ikke handle, hvis du blæser op på outliers.




