वह दो सिग्मा समस्या जिसने सब कुछ बदल दिया
दिसंबर 2018। VIX 36 पर। मेरी टीम के पारंपरिक मोमेंटम स्क्रीनर चुप हो गए थे — डर से प्रेरित अराजकता में पूरी तरह से बेकार। हमारे रिसर्च हेड ने मेरे डेस्क पर एक चुनौती रखी: "ऐसे स्टॉक्स ढूंढो जो 5 दिनों के भीतर रिवर्स होंगे, नहीं तो हम यह रणनीति वापस ले लेंगे।"
तभी मैंने पाया कि सपोर्ट वेक्टर मशीनें वे पैटर्न देख सकती हैं जो इंसान नहीं देख सकते — खासकर अत्यधिक डर वाले बाजारों में जहां पारंपरिक स्क्रीनिंग फेल हो जाती है। उस हफ्ते मैंने जो SVM मॉडल बनाया, उसने अगले चार सालों में 73% प्रमुख रिवर्सल्स को पकड़ा।
टू सिग्मा में, हमारा एक कहावत थी: अगर आप इसे कोड नहीं कर सकते, तो आप इसे लगातार ट्रेड नहीं कर सकते। आज मैं वही सटीक फ्रेमवर्क साझा कर रहा हूं, जिसमें कोड स्निपेट्स भी शामिल हैं जिन्हें आप खुद इम्प्लीमेंट कर सकते हैं।
डर के बाजारों में पारंपरिक स्टॉक स्क्रीनिंग क्यों फेल हो जाती है
ज्यादातर स्टॉक स्क्रीनर लीनियर लॉजिक पर निर्भर करते हैं: RSI 30 से नीचे = ओवरसोल्ड = खरीद का सिग्नल। लेकिन डर के बाजार लीनियर नियमों का पालन नहीं करते। मैंने यह कठिन तरीके से सीखा जब हमारे मोमेंटम स्क्रीनर उन "सस्ते सौदों" को फ्लैग कर रहे थे जो और 40% गिर गए।
समस्या क्या है? डर इंडिकेटर्स के बीच नॉन-लीनियर रिलेशनशिप पैदा करता है। सामान्य बाजार में RSI 20 वाला स्टॉक बाउंस कर सकता है। कैपिटुलेशन के दौरान वही RSI 20? वह तो एक गिरता हुआ चाकू है।
यहां बताया गया है कि डर में पारंपरिक स्क्रीनर क्या मारता है:
- लीनियर थ्रेशोल्ड बाजार के संदर्भ को नजरअंदाज करते हैं
- सिंगल इंडिकेटर मल्टी-डायमेंशनल पैटर्न्स को मिस कर देते हैं
- स्टैटिक नियम रेजिम चेंज के अनुकूल नहीं हो सकते
- वॉल्यूम/प्राइस रिलेशनशिप नॉन-लीनियर हो जाती है
यह वही जगह है जहां मशीन लर्निंग — खासकर SVMs — शानदार प्रदर्शन करती है। लीनियर रिग्रेशन के विपरीत, SVMs हाई-डायमेंशनल स्पेस में कॉम्प्लेक्स डिसीजन बाउंड्रीज ढूंढ सकती हैं। इसे डेटा क्लस्टर्स के चारों ओर सीधी लाइनों की बजाय कर्व्स खींचने के रूप में सोचें।

वह SVM आर्किटेक्चर जो वास्तव में काम करता है
47 अलग-अलग ML एल्गोरिदम (हां, मैंने गिना) का परीक्षण करने के बाद, सपोर्ट वेक्टर मशीनें लगातार बेहतर प्रदर्शन करती रहीं, एक कारण से: वे आउटलायर्स को शानदार ढंग से हैंडल करती हैं। डर के बाजार आउटलायर्स ही होते हैं।
यहां प्स्यूडो-कोड में कोर आर्किटेक्चर है:
// फीचर वेक्टर कंस्ट्रक्शन
features = [
normalized_rsi_divergence,
volume_price_ratio,
liquidity_score,
institutional_flow_indicator,
cross_asset_correlation,
vix_regime_indicator
]
// नॉन-लीनियर पैटर्न के लिए RBF कर्नेल वाला SVM
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)
// कॉन्फिडेंस स्कोर के लिए प्रोबेबिलिटी कैलिब्रेशन
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)
जादू फीचर इंजीनियरिंग में होता है। रॉ प्राइस डेटा नॉइज है — आपको बिहेवियरल फीचर्स की जरूरत है जो डर की डायनामिक्स को कैप्चर करें।
फीचर इंजीनियरिंग: द सीक्रेट सॉस
ज्यादातर ML ट्रेडिंग आर्टिकल्स फीचर्स पर सतही बात करते हैं। यह किसी को चाबी के बिना फेरारी देने जैसा है। यहां वे सटीक फीचर्स हैं जिन्होंने मेरी विन रेट बदल दी:
1. नॉर्मलाइज्ड RDI डाइवर्जेंस स्कोर
सिर्फ RSI नहीं — प्राइस मूवमेंट के सापेक्ष RSI में रेंट ऑफ चेंज। पाइन स्क्रिप्ट में:
rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)
2. वॉल्यूम/प्राइस डिस्लोकेशन रेशियो
मापता है कि कब वॉल्यूम विस्फोट करता है लेकिन प्राइस मुश्किल से हिलता है — क्लासिक एक्यूमुलेशन:
vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability
3. क्रॉस-एसेट फियर करिलेशन
जब करिलेशन टूटते हैं, तो अक्सर रिवर्सल फॉलो करते हैं। मैं VIX, गोल्ड और ट्रेजरीज के साथ स्टॉक करिलेशन ट्रैक करता हूं।
ये रैंडम नहीं हैं — हर फीचर हजारों फेल्ड ट्रेड्स के एनालिसिस से निकला। जैसा कि मैंने अपने RSI डाइवर्जेंस एनालिसिस में कवर किया, संदर्भ इंडिकेटर की प्रभावशीलता बदल देता है।

डर पर ट्रेनिंग: द डेटा चैलेंज
यहां 90% ML ट्रेडर्स फेल होते हैं: वे सभी मार्केट कंडीशन पर समान रूप से ट्रेन करते हैं। यह सिर्फ जॉगिंग करके मैराथन के लिए ट्रेनिंग करने जैसा है। आपको डर-स्पेसिफिक ट्रेनिंग डेटा की जरूरत है।
मेरा तरीका:
- ट्रेनिंग डेटा को सिर्फ VIX > 25 पीरियड्स तक फिल्टर करें
- एक्सट्रीम फियर डेज (VIX > 40) को 3x ओवरसैंपल करें
- मल्टीपल फियर रेजिम्स शामिल करें: 2008, 2020, 2022
- आउट-ऑफ-सैंपल फियर पीरियड्स पर वैलिडेट करें
मेरे द्वारा इस्तेमाल किए जाने वाले VaR एडजस्टमेंट इन फियर रेजिम्स को प्रोग्रामेटिकली डिफाइन करने में मदद करते हैं। उचित रेजिम फिल्टरिंग के बिना, आपका मॉडल गलत पैटर्न सीखता है।
महत्वपूर्ण अंतर्दृष्टि: क्लास इम्बैलेंस आपको मार देगी। डर रिवर्सल्स दुर्लभ हैं — शायद सभी ट्रेडिंग दिनों का 5%। स्टैंडर्ड ML प्रैक्टिसेज क्लासेस को बैलेंस करने का सुझाव देती हैं। ऐसा न करें। इसके बजाय, वास्तविकता को दर्शाने वाले क्लास वेट्स का उपयोग करें:
class_weights = {
'reversal': 1.0,
'continuation': 0.05
}
यह आपके मॉडल को हर रेड कैंडल पर चिल्लाने से रोकता है।
बैकटेस्टिंग रियलिटी चेक: 73% विन रेट
अकादमिक पेपर्स 90%+ एक्यूरेसी का दावा करना पसंद करते हैं। लाइव ट्रेडिंग में? अलग कहानी। मेरे SVM स्क्रीनर ने एक्चुअल रिवर्सल कॉल्स पर 73% एक्यूरेसी हासिल की — यहां ब्रेकडाउन है:
- 2018 Q4 सेलऑफ: 14/19 सही कॉल्स (73.7%)
- मार्च 2020 COVID: 22/28 सही (78.6%)
- 2022 बेयर मार्केट: 47/68 सही (69.1%)
मॉडल तेज, डर से प्रेरित सेलऑफ्स में सबसे अच्छा प्रदर्शन करता है। धीमे बेयर मार्केट एक्यूरेसी कम कर देते हैं — वहां लेयर्ड एक्यूमुलेशन एप्रोच बेहतर काम करती है।

लाइव इम्प्लीमेंटेशन: मॉडल से ट्रेडिंग तक
एक्जीक्यूशन के बिना मॉडल अकादमिक हस्तमैथुन है। यहां बताया गया है कि मैं SVM स्क्रीनिंग को लाइव ट्रेडिंग में कैसे इंटीग्रेट करता हूं:
डेली वर्कफ्लो (क्लोज से 30 मिनट पहले):
- 500 लिक्विड स्टॉक्स के यूनिवर्स पर स्क्रीनर चलाएं
- रिवर्सल प्रोबेबिलिटी > 0.7 के लिए फिल्टर करें
- प्रोबेबिलिटी * एक्सपेक्टेड मूव मैग्नीट्यूड से रैंक करें
- टॉप 10 कैंडिडेट्स की मैन्युअल रिव्यू करें
- कॉन्विक्शन और केली फ्रैक्शन के आधार पर पोजीशन साइज तय करें
रिस्क मैनेजमेंट लेयर:
if vix > 30:
position_size *= 0.5 # एक्सट्रीम फियर में आधा साइज
stop_loss = atr * 3 # वोलैटिलिटी के लिए चौड़े स्टॉप्स
else:
position_size = base_size
stop_loss = atr * 2
मॉडल पर अंधविश्वास कभी न करें। मैंने यह सीखा जब मेरे SVM ने सितंबर 2008 में लेहमैन ब्रदर्स को "स्ट्रॉन्ग रिवर्सल कैंडिडेट" के रूप में फ्लैग किया। कुछ रिवर्सल कभी नहीं आते।
वर्तमान बाजार अनुप्रयोग (मार्च 2026)
फियर & ग्रीड 14 पर और बिटकॉइन हाल के लोज का टेस्ट कर रहा है, हम प्राइम SVM टेरिटरी में हैं। कल के स्कैन ने दिलचस्प सेटअप्स फ्लैग किए:
- टेक दिग्गज डिस्लोकेशन दिखा रहे हैं: हाई वॉल्यूम, न्यूनतम प्राइस मूवमेंट
- रीजनल बैंक्स RSI डाइवर्जेंस प्रदर्शित कर रहे हैं: प्राइस नए लोज बना रहा है, RSI हायर है
- कमोडिटी स्टॉक्स करिलेशन तोड़ रहे हैं: अंडरलाइंग फ्यूचर्स से डिकपलिंग
डार्क पूल इंडिकेटर्स कई नामों में इंस्टीट्यूशनल एक्यूमुलेशन की पुष्टि करते हैं। ML सिग्नल + फ्लो डेटा का यह संगम वह जगह है जहां एज कंपाउंड होती है।
याद रखें: मॉडल कैंडिडेट्स की पहचान करता है, गारंटी नहीं। वर्तमान परिस्थितियों में, मैं चयनात्मक हो रहा हूं — सिर्फ A+ सेटअप्स ले रहा हूं जहां मल्टीपल सिस्टम्स एलाइन होते हैं।

एडवांस्ड टेक्निक्स: एन्सेम्बल मेथड्स
सिंगल मॉडल्स के सिंगल पॉइंट ऑफ फेल्योर होते हैं। टू सिग्मा में, हमने कभी सोलो एल्गोरिदम ट्रेड नहीं किए। यहां मेरा एन्सेम्बल एप्रोच है:
- प्राइमरी सिग्नल के लिए SVM (नॉन-लीनियर पैटर्न रिकग्निशन)
- कन्फर्मेशन के लिए रैंडम फॉरेस्ट (अलग एल्गोरिदम फैमिली)
- सीक्वेंस वैलिडेशन के लिए LSTM (टेम्पोरल पैटर्न्स कैप्चर करता है)
जब 2/3 मॉडल्स सहमत हों, तभी मैं सिग्नल को वैलिड मानता हूं। यह फॉल्स पॉजिटिव्स को ~40% काट देता है, जबकि अधिकांश ट्रू सिग्नल्स बनाए रखता है।
जो लोग ऑटोमेटेड एक्जीक्यूशन में रुचि रखते हैं, FibAlgo का अलर्ट सिस्टम तब ट्रिगर हो सकता है जब आपका ML मॉडल हाई-कॉन्विक्शन सिग्नल्स आउटपुट करता है, जो पायथन एनालिसिस और TradingView एक्जीक्यूशन के बीच की खाई को पाटता है।
मीन रिवर्जन फ्रेमवर्क जिस पर मैंने चर्चा की, वह समान एन्सेम्बल लाभ दिखाता है — मल्टीपल परस्पेक्टिव्स सिंगल-मॉडल रिस्क को कम करते हैं।
ML स्टॉक स्क्रीनिंग में सामान्य गलतियां
मुझे आपको महीनों के दर्द से बचाने दें। इन गलतियों ने मेरे शुरुआती मॉडल्स को मार दिया:
स्पेसिफिक इवेंट्स पर ओवरफिटिंग: मेरे पहले मॉडल ने 2008 क्रैश पैटर्न्स को याद कर लिया। 2020 में बेकार। टेम्पोरल अवेयरनेस के साथ k-फोल्ड क्रॉस-वैलिडेशन का उपयोग करें — कभी भी भविष्य के डेटा पर ट्रेन न करें।
फीचर लीकेज: आज की प्रेडिक्शन में कल के वॉल्यूम को शामिल करना। स्पष्ट लगता है, लेकिन डेरिवेटिव फीचर्स टेम्पोरल लीक्स छिपा सकते हैं। हमेशा सोचें: "क्या मैं यह प्रेडिक्शन टाइम पर जान सकता था?"
ट्रांजैक्शन कॉस्ट्स को नजरअंदाज करना: वह 73% विन रेट जीरो फ्रिक्शन मानती है। हकीकत में, स्लिपेज के लिए 10bps, कमीशन के लिए 5bps जोड़ें। छोटे एज जल्दी गायब हो जाते हैं।
मॉडल डिके: बाजार विकसित होते हैं। मेरा 2018 मॉडल 2020 तक 61% एक्यूरेसी तक डिग्रेड हो गया। कम से कम तिमाही, रेजिम चेंज के दौरान मासिक रिट्रेन करें।
जैसा कि मेरे AMM रिस्क गाइड में कवर किया गया, सिस्टमैटिक रणनीतियों को लगातार मॉनिटरिंग और एडजस्टमेंट की आवश्यकता होती है।
अपना खुद का ML स्क्रीनिंग सिस्टम बनाना
सरल शुरुआत करें। कॉम्प्लेक्सिटी एज नहीं है — उचित इम्प्लीमेंटेशन एज है। यहां आपका रोडमैप है:
सप्ताह 1-2: डेटा संग्रह और सफाई। फ्री डेटा के लिए Yahoo Finance या Alpha Vantage का उपयोग करें। लिक्विड स्टॉक्स ($1B+ मार्केट कैप, 1M+ डेली वॉल्यूम) का एक यूनिवर्स बनाएं।
सप्ताह 3-4: फीचर इंजीनियरिंग। ऊपर मेरे तीन कोर फीचर्स से शुरू करें। अपनी मार्केट हाइपोथिसिस के आधार पर अन्य जोड़ें। OBV एडाप्टेशन आर्टिकल दिखाता है कि स्पेसिफिक संदर्भों के लिए इंडिकेटर्स को कैसे मॉडिफाई करें।
सप्ताह 5-6: मॉडल ट्रेनिंग और वैलिडेशन। SVM इम्प्लीमेंटेशन के लिए scikit-learn का उपयोग करें। उचित ट्रेन/टेस्ट स्प्लिटिंग पर फोकस करें — टेम्पोरल ऑर्डर मायने रखता है!
सप्ताह 7-8: बैकटेस्टिंग और पेपर ट्रेडिंग। अपना स्क्रीनर डेली चलाएं, प्रेडिक्शन्स बनाम आउटकम्स ट्रैक करें। 100+ पेपर ट्रेड्स तक कोई रियल मनी नहीं।
सप्ताह 9+: छोटे साइज के साथ लाइव इम्प्लीमेंटेशन। सिग्नल प्रति 0.25% रिस्क से शुरू करें। कंसिस्टेंसी साबित करने के बाद ही स्केल करें।
मशीन लर्निंग ट्रेडिंग की वास्तविकता
ML जादू नहीं है। यह बड़े पैमाने पर पैटर्न पहचान है। मेरा SVM स्क्रीनर भविष्य की भविष्यवाणी नहीं करता — यह पहचानता है कि कब वर्तमान स्थितियां ऐतिहासिक रूप से लाभदायक सेटअप से मेल खाती हैं।
एज तीन स्थानों से आती है:
- मनुष्यों से अधिक डेटा प्रोसेस करना (500 स्टॉक्स, प्रत्येक के 6 फीचर्स)
- डर के दौरान अनुशासन बनाए रखना (एल्गोरिदम घबराते नहीं)
- निरंतर निष्पादन (हर एक दिन समान नियम)
लेकिन यहाँ बात है — आपको अभी भी ट्रेडिंग अंतर्ज्ञान की आवश्यकता है। मॉडल अवसरों को चिह्नित करता है; आप पोजीशन साइज़िंग, टाइमिंग और रिस्क मैनेजमेंट तय करते हैं। शुद्ध व्यवस्थित ट्रेडिंग तब तक काम करती है जब तक यह विफल नहीं होती। बस उन क्वांट्स से पूछें जो अगस्त 2007 में ध्वस्त हो गए थे।
टू सिग्मा में, हमारी सर्वोत्तम रणनीतियों ने मशीन इंटेलिजेंस को मानवीय निगरानी के साथ जोड़ा। मशीन पैटर्न ढूंढती है। मानव जोखिम प्रबंधित करता है, खासकर रेजिम परिवर्तनों के दौरान जब ऐतिहासिक डेटा पर प्रशिक्षित मॉडल अस्थायी रूप से अंधे हो जाते हैं।
बाजारों में अत्यधिक डर के संकेत दिखने के साथ, हम ML-आधारित रिवर्सल स्क्रीनिंग के लिए आदर्श स्थिति में हैं। चाहे आप अपनी खुद की प्रणाली बनाएं या मेरी को अपनाएं, याद रखें: लक्ष्य पूर्णता नहीं है। यह निरंतर एज है, उचित आकार में, जिसमें टेल रिस्क प्रबंधित है।
क्योंकि अंत में, 27% विफल संकेतों से बचना हर रिवर्सल को पकड़ने से अधिक मायने रखता है। सबसे अच्छा एल्गोरिदम भी ट्रेड नहीं कर सकता यदि आप आउटलायर्स पर उड़ा दिए जाते हैं।




