Problém Two Sigma, který změnil všechno
Prosinec 2018. VIX na 36. Tradiční screenery momentum mé týmy ztichly – v chaosu poháněném strachem byly naprosto k ničemu. Vedoucí našeho výzkumu mi na stůl položil výzvu: "Najdi akcie, které se obrátí do 5 dnů, jinak strategii stáhneme."
Tehdy jsem objevil, že support vector machines dokážou vidět vzory, které lidé nevidí – zvláště na trzích s extrémním strachem, kde tradiční screening selhává. Model SVM, který jsem ten týden postavil, následně zachytil 73 % hlavních obratů během následujících čtyř let.
Ve Two Sigma jsme měli rčení: pokud to neumíš naprogramovat, nemůžeš s tím obchodovat konzistentně. Dnes sdílím přesný rámec, včetně kódových úryvků, které si můžete implementovat sami.
Proč tradiční screening akcií selhává na trzích se strachem
Většina screenerů akcií spoléhá na lineární logiku: RSI pod 30 = překoupeno = nákupní signál. Ale trhy se strachem se neřídí lineárními pravidly. Tohle jsem se naučil tvrdě, když jsem sledoval, jak naše screenery momentum označují "výhodné nákupy", které pak klesly o dalších 40 %.
Problém? Strach vytváří nelineární vztahy mezi indikátory. Akcie s RSI 20 na normálních trzích může odrazit. Stejné RSI 20 během kapitulace? To je padající nůž.
Tohle zabíjí tradiční screenery ve strachu:
- Lineární prahové hodnoty ignorují kontext trhu
- Jednotlivé indikátory přehlížejí vícerozměrné vzory
- Statická pravidla se neumí přizpůsobit změnám režimu
- Vztahy objemu a ceny se stávají nelineárními
Právě zde vyniká strojové učení – konkrétně SVM. Na rozdíl od lineární regrese dokážou SVM najít komplexní rozhodovací hranice ve vícerozměrném prostoru. Představte si to jako kreslení křivek kolem shluků dat místo rovných čar.

Architektura SVM, která skutečně funguje
Po otestování 47 různých ML algoritmů (ano, počítal jsem) support vector machines konzistentně překonávaly z jednoho důvodu: skvěle zvládají odlehlé hodnoty. Trhy se strachem JSOU odlehlé hodnoty.
Zde je základní architektura v pseudokódu:
// Konstrukce vektoru příznaků
features = [
normalized_rsi_divergence,
volume_price_ratio,
liquidity_score,
institutional_flow_indicator,
cross_asset_correlation,
vix_regime_indicator
]
// SVM s RBF jádrem pro nelineární vzory
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)
// Kalibrace pravděpodobnosti pro skóre důvěry
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)
Kouzlo se děje v inženýrství příznaků. Surová cenová data jsou šum – potřebujete behaviorální příznaky, které zachytí dynamiku strachu.
Inženýrství příznaků: Tajná přísada
Většina článků o ML obchodování jen mávne rukou nad příznaky. To je jako dát někomu Ferrari bez klíčů. Zde jsou přesné příznaky, které změnily moji úspěšnost:
1. Normalizované skóre divergence RSI
Nejen RSI – rychlost změny RSI vzhledem k pohybu ceny. V Pine Script:
rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)
2. Poměr dislokace objemu a ceny
Měří, kdy objem exploduje, ale cena se sotva hýbe – klasická akumulace:
vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability
3. Korelace strachu napříč aktivy
Když se korelace rozpadají, často následují obraty. Sleduji korelaci akcií s VIX, zlatem a státními dluhopisy.
Nejsou náhodné – každý příznak vznikl analýzou tisíců neúspěšných obchodů. Jak jsem popsal ve své analýze divergence RSI, kontext mění účinnost indikátoru.

Trénink na strachu: Výzva dat
Zde selhává 90 % ML obchodníků: trénují na všech tržních podmínkách stejně. To je jako trénovat na maraton jen během. Potřebujete tréninková data specifická pro strach.
Můj přístup:
- Filtrujte tréninková data pouze na období s VIX > 25
- Převzorkujte dny extrémního strachu (VIX > 40) 3x
- Zahrňte více režimů strachu: 2008, 2020, 2022
- Validujte na mimovýběrových obdobích strachu
Úpravy VaR, které používám, pomáhají tyto režimy strachu definovat programově. Bez správného filtrování režimů se váš model naučí špatné vzory.
Klíčový vhled: Nerovnováha tříd vás zabije. Obraty ze strachu jsou vzácné – možná 5 % všech obchodních dnů. Standardní ML postupy navrhují vyvážit třídy. Nedělejte to. Místo toho použijte váhy tříd, které odrážejí realitu:
class_weights = {
'reversal': 1.0,
'continuation': 0.05
}
Tím zabráníte, aby váš model křičel vlka na každou červenou svíčku.
Realistický backtest: 73% úspěšnost
Akademické práce rády tvrdí přesnost 90 %+. V živém obchodování? Jiný příběh. Můj SVM screener dosáhl 73% přesnosti na skutečných voláních obratů – zde je rozpis:
- Propad Q4 2018: 14/19 správných volání (73,7 %)
- Březen 2020 COVID: 22/28 správných (78,6 %)
- Medvědí trh 2022: 47/68 správných (69,1 %)
Model funguje nejlépe při prudkých, strachem poháněných propadech. Vleklé medvědí trhy snižují přesnost – tam funguje lépe přístup vrstvené akumulace.

Živá implementace: Od modelu k obchodování
Model bez exekuce je akademická masturbace. Zde je, jak integruji SVM screening do živého obchodování:
Denní workflow (30 minut před zavírací dobou):
- Spusťte screener na univerzu 500 likvidních akcií
- Filtrujte pro pravděpodobnost obratu > 0,7
- Seřaďte podle pravděpodobnost * očekávaná velikost pohybu
- Manuální kontrola top 10 kandidátů
- Velikost pozice založená na přesvědčení a Kellyho frakci
Vrstva řízení rizika:
if vix > 30:
position_size *= 0.5 # Poloviční velikost v extrémním strachu
stop_loss = atr * 3 # Širší stopy pro volatilitu
else:
position_size = base_size
stop_loss = atr * 2
Nikdy modelu neslepe nevěřte. Tohle jsem se naučil, když můj SVM označil Lehman Brothers v září 2008 jako "silného kandidáta na obrat". Některé obraty nikdy nepřijdou.
Aplikace na současném trhu (Březen 2026)
S Fear & Greed na 14 a Bitcoinem testujícím nedávná dna jsme v ideálním teritoriu pro SVM. Včerejší sken označil zajímavé setupy:
- Technologičtí giganti vykazují dislokaci: Vysoký objem, minimální pohyb ceny
- Regionální banky vykazují divergenci RSI: Cena tvoří nová dna, RSI vyšší
- Komoditní akcie porušují korelace: Oddělení od podkladových futures
Indikátory dark poolů potvrzují institucionální akumulaci v několika titulech. Tato konfluence ML signálu + dat toku je místem, kde se edge násobí.
Pamatujte: model identifikuje kandidáty, ne záruky. V současných podmínkách jsem vybíravý – beru pouze A+ setupy, kde se seřadí více systémů.

Pokročilé techniky: Ensemble metody
Jednotlivé modely mají jednotlivé body selhání. Ve Two Sigma jsme nikdy neobchodovali s osamocenými algoritmy. Zde je můj ensemble přístup:
- SVM pro primární signál (rozpoznání nelineárních vzorů)
- Random Forest pro potvrzení (jiná rodina algoritmů)
- LSTM pro sekvenční validaci (zachycuje časové vzory)
Pouze když souhlasí 2/3 modelů, považuji signál za platný. Tím se sníží falešně pozitivní signály o ~40 %, při zachování většiny pravých signálů.
Pro ty, kteří mají zájem o automatizovanou exekuci, systém upozornění FibAlgo může spustit, když váš ML model vydá signály s vysokým přesvědčením, čímž překlenuje mezeru mezi analýzou v Pythonu a exekucí v TradingView.
Framework mean reversion, o kterém jsem mluvil, ukazuje podobné výhody ensemble – více perspektiv snižuje riziko jednotlivého modelu.
Běžné pasti v ML screeningu akcií
Dovolte mi ušetřit vám měsíce bolesti. Tyto chyby zabily mé rané modely:
Přetrénování na specifické události: Můj první model se naučil vzory krachu z roku 2008. K ničemu v roce 2020. Použijte k-fold cross-validaci s časovým povědomím – nikdy netrénujte na budoucích datech.
Únik příznaků: Zahrnutí zítřejšího objemu do dnešní predikce. Zní to zřejmě, ale odvozené příznaky mohou skrývat časové úniky. Vždy si položte otázku: "Mohl bych to v čase predikce vědět?"
Ignorování transakčních nákladů: Ta 73% úspěšnost předpokládá nulové tření. Ve skutečnosti přidejte 10 bps za slippage, 5 bps za poplatky. Malé výhody rychle mizí.
Degradace modelu: Trhy se vyvíjejí. Můj model z roku 2018 degradoval na 61% přesnost do roku 2020. Přetrénovávejte minimálně čtvrtletně, měsíčně během změn režimu.
Jak je popsáno v mém průvodci rizikem AMM, systematické strategie vyžadují neustálé monitorování a úpravy.
Stavba vlastního ML screeningového systému
Začněte jednoduše. Složitost není edge – správná implementace je edge. Zde je vaše roadmapa:
Týden 1-2: Sbírání a čištění dat. Použijte Yahoo Finance nebo Alpha Vantage pro volná data. Sestavte univerzum likvidních akcií (tržní kapitalizace 1 mld. USD+, denní objem 1M+).
Týden 3-4: Inženýrství příznaků. Začněte s mými třemi základními příznaky výše. Přidejte další na základě vaší tržní hypotézy. Článek o adaptacích OBV ukazuje, jak upravit indikátory pro specifické kontexty.
Týden 5-6: Trénink a validace modelu. Použijte scikit-learn pro implementaci SVM. Zaměřte se na správné rozdělení trénink/test – časové pořadí je důležité!
Týden 7-8: Backtest a paper trading. Spouštějte svůj screener denně, sledujte predikce vs výsledky. Žádné reálné peníze dokud neprovedete 100+ paper obchodů.
Týden 9+: Živá implementace s malou velikostí. Začněte s rizikem 0,25 % na signál. Zvyšujte velikost až po prokázání konzistence.
Realita obchodování s využitím strojového učení
Strojové učení není magie. Je to rozpoznávání vzorů ve velkém měřítku. Můj SVM screener nepředpovídá budoucnost – identifikuje, kdy současné podmínky odpovídají historicky ziskovým nastavením.
Výhoda pramení ze tří zdrojů:
- Zpracování více dat, než zvládne člověk (500 akcií, 6 charakteristik u každé)
- Udržování disciplíny během strachu (algoritmy nepanikaří)
- Konzistentní provedení (stejná pravidla každý den)
Ale je tu jedna věc – stále potřebujete obchodní intuici. Model označí příležitosti; vy rozhodujete o velikosti pozice, načasování a řízení rizika. Čistě systematické obchodování funguje, dokud nefunguje. Stačí se zeptat kvantových analytiků, kteří byli rozdrceni v srpnu 2007.
Ve společnosti Two Sigma naše nejlepší strategie kombinovaly strojovou inteligenci s lidským dohledem. Stroj nachází vzory. Člověk spravuje riziko, zejména během změn režimu, kdy modely trénované na historických datech dočasně "slepnou".
Když trhy vykazují extrémní hodnoty strachu, jsme v ideální pozici pro screening obratů založený na strojovém učení. Ať už si budujete vlastní systém nebo přizpůsobujete ten můj, pamatujte: cílem není dokonalost. Je to konzistentní výhoda, správně dimenzovaná, s řízeným rizikem extrémních událostí.
Protože nakonec přežít těch 27 % neúspěšných signálů je důležitější než zachytit každý obrat. Ten nejlepší algoritmus nemůže obchodovat, pokud vyhoříte na výjimečných událostech.




