A Two Sigma probléma, amely mindent megváltoztatott
2018 decembere. A VIX 36-nál. A csapatom hagyományos momentum szűrői elnémultak – teljesen használhatatlanok voltak a félelem által hajtott káoszban. A kutatási vezetőnk egy kihívást dobott az asztalomra: "Találj olyan részvényeket, amelyek 5 napon belül megfordulnak, különben visszavonjuk a stratégiát."
Ekkor fedeztem fel, hogy a támogató vektor gépek olyan mintákat láthatnak, amelyeket az emberek nem – különösen a szélsőséges félelem piacain, ahol a hagyományos szűrés elbukik. Az az SVM modell, amelyet azon a héten építettem, a következő négy évben a nagy fordulatok 73%-át fogta ki.
A Two Sigmanál volt egy mondásunk: ha nem tudod leprogramozni, nem tudod következetesen kereskedni vele. Ma megosztom a pontos keretrendszert, beleértve a kódrészleteket, amelyeket magad is implementálhatsz.
Miért bukik el a hagyományos részvényszűrés a félelem piacain
A legtöbb részvényszűrő lineáris logikára támaszkodik: RSI 30 alatt = túl eladott = vételi jel. De a félelem piacai nem követik a lineáris szabályokat. Ezt a nehéz úton tanultam meg, miközben néztem, ahogy momentum szűrőink "alkukat" jelöltek, amelyek még 40%-ot estek.
A probléma? A félelem nemlineáris kapcsolatokat teremt a mutatók között. Egy RSI 20-as részvény a normál piacokon visszapattanhat. Ugyanaz az RSI 20 a kapituláció idején? Az egy zuhanó kés.
Íme, ami megöli a hagyományos szűrőket a félelemben:
- A lineáris küszöbértékek figyelmen kívül hagyják a piaci kontextust
- Az egyedi mutatók kihagyják a többdimenziós mintákat
- A statikus szabályok nem tudnak alkalmazkodni a rezsimváltásokhoz
- A volumen/ár kapcsolatok nemlineárissá válnak
Pontosan itt tűnik ki a gépi tanulás – konkrétan az SVM. A lineáris regresszióval ellentétben az SVM-ek komplex döntési határokat találhatnak a magas dimenziós térben. Gondolj rá úgy, mint görbék rajzolására az adatcsoportok körül egyenes vonalak helyett.

Az SVM architektúra, amely valóban működik
47 különböző ML algoritmus tesztelése után (igen, számoltam) a támogató vektor gépek következetesen jobbak voltak egy okból: briliánsan kezelik a kiugró értékeket. A félelem piacok KIUGRÓ ÉRTÉKEK.
Itt a mag architektúra pszeudokódban:
// Jellemző vektor konstrukció
features = [
normalized_rsi_divergence,
volume_price_ratio,
liquidity_score,
institutional_flow_indicator,
cross_asset_correlation,
vix_regime_indicator
]
// SVM RBF kernelrel a nemlineáris mintákhoz
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)
// Valószínűségi kalibrálás a konfidencia pontszámokhoz
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)
A varázslat a jellemző mérnökségben történik. A nyers áradat zaj – viselkedési jellemzőkre van szükséged, amelyek megragadják a félelem dinamikáját.
Jellemző mérnökség: A titkos szósz
A legtöbb ML kereskedési cikk csak elmélkedik a jellemzőkről. Olyan, mintha valakinek egy Ferrarit adnál kulcsok nélkül. Itt vannak a pontos jellemzők, amelyek átalakították a nyerési arányomat:
1. Normalizált RSI divergencia pontszám
Nem csak az RSI – az RSI változási üteme az ármozgáshoz képest. Pine Scriptben:
rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)
2. Volumen/Ár elmozdulási arány
Méri, amikor a volumen robban, de az ár alig mozdul – klasszikus akkumuláció:
vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability
3. Kereszt-eszköz félelem korreláció
Amikor a korrelációk megszakadnak, gyakran fordulatok következnek. Követem a részvény korrelációját a VIX-hez, az aranyhoz és az államkötvényekhez.
Ezek nem véletlenszerűek – minden jellemző több ezer sikertelen kereskedés elemzéséből került elő. Ahogyan azt a RSI divergencia elemzésem is tárgyalta, a kontextus átalakítja a mutatók hatékonyságát.

Tanítás félelemre: Az adat kihívás
Itt bukik el az ML kereskedők 90%-a: egyformán tanítanak minden piaci körülményre. Olyan, mintha egy maratonra készülnél csak sétálva. Félelem-specifikus tanító adatokra van szükséged.
Az én megközelítésem:
- Szűrd a tanító adatokat csak VIX > 25 időszakokra
- Túl-mintávezd a szélsőséges félelem napokat (VIX > 40) 3x-szor
- Foglalj bele több félelem rezsimet: 2008, 2020, 2022
- Validálj mintán kívüli félelem időszakokon
A használt VaR beállításaim segítenek ezeket a félelem rezsimeket programozottan definiálni. Megfelelő rezsim szűrés nélkül a modelled rossz mintákat tanul.
Kritikus betekintés: Az osztály egyensúlytalanság megöl. A félelem fordulatok ritkák – talán az összes kereskedési nap 5%-a. A szabványos ML gyakorlatok az osztályok kiegyensúlyozását javasolják. Ne tedd. Ehelyett használj olyan osztály súlyokat, amelyek a valóságot tükrözik:
class_weights = {
'reversal': 1.0,
'continuation': 0.05
}
Ez megakadályozza, hogy a modelled farkast kiáltson minden piros gyertyára.
Backtesting valóságellenőrzés: A 73%-os nyerési arány
Az akadémiai cikkek szeretnek 90%+ pontosságot állítani. Élő kereskedésben? Más történet. Az én SVM szűrőm 73% pontosságot ért el a tényleges fordulat jeleken – itt a lebontás:
- 2018 Q4-es zuhanás: 14/19 helyes jelzés (73.7%)
- 2020 márciusi COVID: 22/28 helyes (78.6%)
- 2022-es medvepiac: 47/68 helyes (69.1%)
A modell a legjobban az éles, félelem által hajtott zuhanásokban teljesít. A őrlő medvepiacok csökkentik a pontosságot – ott a réteges akkumulációs megközelítés jobban működik.

Élő implementáció: A modelltől a kereskedésig
Egy modell végrehajtás nélkül akadémiai maszturbáció. Így integrálom az SVM szűrést az élő kereskedésbe:
Napi munkafolyamat (30 perccel a zárás előtt):
- Futtasd a szűrőt 500 likvid részvény univerzumán
- Szűrd a > 0.7 fordulati valószínűségűekre
- Rangsorold valószínűség * várható mozgás nagyság szerint
- Kézi áttekintés a top 10 jelöltnél
- Pozíció méretezés a meggyőződés és a Kelly frakció alapján
Kockázatkezelési réteg:
if vix > 30:
position_size *= 0.5 # Fele méret szélsőséges félelemben
stop_loss = atr * 3 # Szélesebb stopok a volatilitás miatt
else:
position_size = base_size
stop_loss = atr * 2
Soha ne bízz vakon a modellben. Ezt akkor tanultam meg, amikor az SVM-em a Lehman Brotherst "erős fordulati jelöltként" jelölte meg 2008 szeptemberében. Néhány fordulat soha nem jön el.
Aktuális piaci alkalmazás (2026 március)
A Félelem és Kapzsiság 14-nél és a Bitcoin a közelmúlt mélypontjait tesztelve, mi a prím SVM területen vagyunk. A tegnapi szkennelés érdekes beállításokat jelölt meg:
- Tech óriások elmozdulást mutatnak: Magas volumen, minimális ármozgás
- Regionális bankok RSI divergenciát mutatnak: Ár új mélypontokon, RSI magasabb
- Ásványi részvények megtörik a korrelációkat: Leválás az alapul szolgáló future-ökről
A dark pool mutatók megerősítik az intézményi akkumulációt több névnél. Ez az ML jel + flow adatok együttes előfordulása, ahol az előny összetevődik.
Emlékezz: a modell jelölteket azonosít, nem garanciákat. A jelenlegi körülmények között szelektív vagyok – csak A+ beállításokat veszek fel, ahol több rendszer egyezik.

Haladó technikák: Ensemble módszerek
Az egyedi modelleknek egyedi meghibásodási pontjaik vannak. A Two Sigmanál soha nem kereskedtünk szóló algoritmusokkal. Itt az én ensemble megközelítésem:
- SVM elsődleges jelzéshez (nemlineáris minta felismerés)
- Random Forest megerősítéshez (különböző algoritmus család)
- LSTM szekvencia validáláshoz (időbeli mintákat ragad meg)
Csak akkor tekintem érvényesnek a jelet, ha 2/3 modell egyetért. Ez ~40%-kal csökkenti a hamis pozitívokat, miközben megtartja a legtöbb igaz jelet.
Azok számára, akiket az automatizált végrehajtás érdekel, a FibAlgo riasztási rendszere aktiválható, amikor az ML modelled magas meggyőződésű jeleket ad ki, áthidalva a Python elemzés és a TradingView végrehajtás közötti szakadékot.
A átlagvisszatérési keretrendszer, amelyet tárgyaltam, hasonló ensemble előnyöket mutat – több perspektíva csökkenti az egyedi modell kockázatát.
Gyakori buktatók az ML részvényszűrésben
Hadd spóroljak meg neked hónapokat fájdalomból. Ezek a hibák ölték meg korai modelljeimet:
Túlilleszkedés specifikus eseményekre: Az első modellem memorizálta a 2008-as összeomlás mintáit. Használhatatlan volt 2020-ban. Használj időbeli tudatossággal k-fold keresztvalidációt – soha ne taníts jövőbeli adatokra.
Jellemző szivárgás: A holnapi volumen belefoglalása a mai előrejelzésbe. Nyilvánvalónak hangzik, de a derivált jellemzők elrejthetik az időbeli szivárgásokat. Mindig gondold át: "Tudhatnám-e ezt az előrejelzési időpontban?"
Tranzakciós költségek figyelmen kívül hagyása: Az a 73%-os nyerési arány nulla súrlódást feltételez. A valóságban adj hozzá 10bps csúszást, 5bps jutalékot. A kis előnyök gyorsan elpárolognak.
Modell hanyatlás: A piacok fejlődnek. A 2018-as modellem 61% pontosságra hanyatlott 2020-ra. Újrataníts legalább negyedévente, havonta rezsimváltások alatt.
Ahogyan azt az AMM kockázati útmutatóm is tárgyalta, a szisztematikus stratégiák állandó monitorozást és beállítást igényelnek.
Saját ML szűrőrendszered építése
Kezdd egyszerűen. A komplexitás nem előny – a megfelelő implementáció az előny. Itt az utadat:
1-2. hét: Adatgyűjtés és tisztítás. Használj Yahoo Finance-t vagy Alpha Vantage-ot ingyenes adatokhoz. Építs egy likvid részvények univerzumát ($1B+ piaci kapitalizáció, 1M+ napi volumen).
3-4. hét: Jellemző mérnökség. Kezdd a fenti három alap jellemzőmmel. Adj hozzá másokat a piaci hipotézised alapján. Az OBV adaptációk cikk bemutatja, hogyan módosítsd a mutatókat specifikus kontextusokhoz.
5-6. hét: Modell tanítás és validálás. Használj scikit-learn-t az SVM implementációhoz. Fókuszálj a megfelelő tanítási/tesztelési felosztásra – az időbeli sorrend számít!
7-8. hét: Backtesting és papírkereskedés. Futtasd a szűrődet naponta, kövesd az előrejelzéseket az eredményekkel. Nincs valódi pénz 100+ papírkereskedésig.
9. hét+: Élő implementáció kis mérettel. Kezdj 0.25% kockázattal jelzésenként. Skálázd csak a konzisztencia bizonyítása után.
A gépi tanulás alapú kereskedés valósága
A gépi tanulás nem varázslat. Lényegében nagy léptékű mintafelismerés. Az SVM szűrőm nem jósolja meg a jövőt – hanem azt azonosítja, amikor a jelenlegi feltételek megegyeznek a történelmileg nyereséges beállításokkal.
A versenyelőny három forrásból származik:
- Több adat feldolgozása, mint amit az ember képes (500 részvény, egyenként 6 jellemző)
- Fegyelmezettség fenntartása félelem közben (az algoritmusok nem pánikolnak)
- Konzisztens végrehajtás (ugyanazok a szabályok minden egyes nap)
De itt a lényeg – a kereskedési intuíció továbbra is szükséges. A modell jelzi a lehetőségeket; te döntöd el a pozíció méretezését, az időzítést és a kockázatkezelést. A tiszta rendszerszintű kereskedés működik, amíg nem működik. Kérdezd csak meg a kvantokat, akiket 2007 augusztusában megsemmisítettek.
A Two Sigmanál a legjobb stratégiáink a gépi intelligenciát és az emberi felügyeletet kombinálták. A gép találja meg a mintákat. Az ember kezeli a kockázatot, különösen az átmeneti időszakokban, amikor a történelmi adatokon kiképzett modellek átmenetileg vakok lesznek.
Mivel a piacok extrém félelmet mutatnak, pontosan abban az optimális helyzetben vagyunk a gépi tanulás alapú fordulati szűréshez. Akár saját rendszert építesz, akár az enyémet alkalmazod, emlékezz: a cél nem a tökéletesség. A cél a konzisztens versenyelőny, megfelelő méretezéssel és a farokkockázat kezelésével.
Mert a végén az számít többet, hogy túléljük a sikertelen jelek 27%-át, mint hogy minden fordulatot megragadjunk. A legjobb algoritmus sem tud kereskedni, ha te felrobbansz a kiugró értékeken.




