वह दो सिग्मा समस्या जिसने सब कुछ बदल दिया

दिसंबर 2018। VIX 36 पर। मेरी टीम के पारंपरिक मोमेंटम स्क्रीनर चुप हो गए थे — डर से प्रेरित अराजकता में पूरी तरह से बेकार। हमारे रिसर्च हेड ने मेरे डेस्क पर एक चुनौती रखी: "ऐसे स्टॉक्स ढूंढो जो 5 दिनों के भीतर रिवर्स होंगे, नहीं तो हम यह रणनीति वापस ले लेंगे।"

तभी मैंने पाया कि सपोर्ट वेक्टर मशीनें वे पैटर्न देख सकती हैं जो इंसान नहीं देख सकते — खासकर अत्यधिक डर वाले बाजारों में जहां पारंपरिक स्क्रीनिंग फेल हो जाती है। उस हफ्ते मैंने जो SVM मॉडल बनाया, उसने अगले चार सालों में 73% प्रमुख रिवर्सल्स को पकड़ा।

टू सिग्मा में, हमारा एक कहावत थी: अगर आप इसे कोड नहीं कर सकते, तो आप इसे लगातार ट्रेड नहीं कर सकते। आज मैं वही सटीक फ्रेमवर्क साझा कर रहा हूं, जिसमें कोड स्निपेट्स भी शामिल हैं जिन्हें आप खुद इम्प्लीमेंट कर सकते हैं।

डर के बाजारों में पारंपरिक स्टॉक स्क्रीनिंग क्यों फेल हो जाती है

ज्यादातर स्टॉक स्क्रीनर लीनियर लॉजिक पर निर्भर करते हैं: RSI 30 से नीचे = ओवरसोल्ड = खरीद का सिग्नल। लेकिन डर के बाजार लीनियर नियमों का पालन नहीं करते। मैंने यह कठिन तरीके से सीखा जब हमारे मोमेंटम स्क्रीनर उन "सस्ते सौदों" को फ्लैग कर रहे थे जो और 40% गिर गए।

समस्या क्या है? डर इंडिकेटर्स के बीच नॉन-लीनियर रिलेशनशिप पैदा करता है। सामान्य बाजार में RSI 20 वाला स्टॉक बाउंस कर सकता है। कैपिटुलेशन के दौरान वही RSI 20? वह तो एक गिरता हुआ चाकू है।

यहां बताया गया है कि डर में पारंपरिक स्क्रीनर क्या मारता है:

  • लीनियर थ्रेशोल्ड बाजार के संदर्भ को नजरअंदाज करते हैं
  • सिंगल इंडिकेटर मल्टी-डायमेंशनल पैटर्न्स को मिस कर देते हैं
  • स्टैटिक नियम रेजिम चेंज के अनुकूल नहीं हो सकते
  • वॉल्यूम/प्राइस रिलेशनशिप नॉन-लीनियर हो जाती है

यह वही जगह है जहां मशीन लर्निंग — खासकर SVMs — शानदार प्रदर्शन करती है। लीनियर रिग्रेशन के विपरीत, SVMs हाई-डायमेंशनल स्पेस में कॉम्प्लेक्स डिसीजन बाउंड्रीज ढूंढ सकती हैं। इसे डेटा क्लस्टर्स के चारों ओर सीधी लाइनों की बजाय कर्व्स खींचने के रूप में सोचें।

लीनियर बनाम SVM स्क्रीनिंग: डर के बाजारों में पारंपरिक थ्रेशोल्ड क्यों फेल होते हैं
लीनियर बनाम SVM स्क्रीनिंग: डर के बाजारों में पारंपरिक थ्रेशोल्ड क्यों फेल होते हैं

वह SVM आर्किटेक्चर जो वास्तव में काम करता है

47 अलग-अलग ML एल्गोरिदम (हां, मैंने गिना) का परीक्षण करने के बाद, सपोर्ट वेक्टर मशीनें लगातार बेहतर प्रदर्शन करती रहीं, एक कारण से: वे आउटलायर्स को शानदार ढंग से हैंडल करती हैं। डर के बाजार आउटलायर्स ही होते हैं।

यहां प्स्यूडो-कोड में कोर आर्किटेक्चर है:

// फीचर वेक्टर कंस्ट्रक्शन
features = [
  normalized_rsi_divergence,
  volume_price_ratio,
  liquidity_score,
  institutional_flow_indicator,
  cross_asset_correlation,
  vix_regime_indicator
]

// नॉन-लीनियर पैटर्न के लिए RBF कर्नेल वाला SVM
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)

// कॉन्फिडेंस स्कोर के लिए प्रोबेबिलिटी कैलिब्रेशन
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)

जादू फीचर इंजीनियरिंग में होता है। रॉ प्राइस डेटा नॉइज है — आपको बिहेवियरल फीचर्स की जरूरत है जो डर की डायनामिक्स को कैप्चर करें।

फीचर इंजीनियरिंग: द सीक्रेट सॉस

ज्यादातर ML ट्रेडिंग आर्टिकल्स फीचर्स पर सतही बात करते हैं। यह किसी को चाबी के बिना फेरारी देने जैसा है। यहां वे सटीक फीचर्स हैं जिन्होंने मेरी विन रेट बदल दी:

1. नॉर्मलाइज्ड RDI डाइवर्जेंस स्कोर
सिर्फ RSI नहीं — प्राइस मूवमेंट के सापेक्ष RSI में रेंट ऑफ चेंज। पाइन स्क्रिप्ट में:

rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)

2. वॉल्यूम/प्राइस डिस्लोकेशन रेशियो
मापता है कि कब वॉल्यूम विस्फोट करता है लेकिन प्राइस मुश्किल से हिलता है — क्लासिक एक्यूमुलेशन:

vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability

3. क्रॉस-एसेट फियर करिलेशन
जब करिलेशन टूटते हैं, तो अक्सर रिवर्सल फॉलो करते हैं। मैं VIX, गोल्ड और ट्रेजरीज के साथ स्टॉक करिलेशन ट्रैक करता हूं।

ये रैंडम नहीं हैं — हर फीचर हजारों फेल्ड ट्रेड्स के एनालिसिस से निकला। जैसा कि मैंने अपने RSI डाइवर्जेंस एनालिसिस में कवर किया, संदर्भ इंडिकेटर की प्रभावशीलता बदल देता है।

SVM फीचर इम्पोर्टेंस: वॉल्यूम/प्राइस डिस्लोकेशन 28% पर अग्रणी
SVM फीचर इम्पोर्टेंस: वॉल्यूम/प्राइस डिस्लोकेशन 28% पर अग्रणी

डर पर ट्रेनिंग: द डेटा चैलेंज

यहां 90% ML ट्रेडर्स फेल होते हैं: वे सभी मार्केट कंडीशन पर समान रूप से ट्रेन करते हैं। यह सिर्फ जॉगिंग करके मैराथन के लिए ट्रेनिंग करने जैसा है। आपको डर-स्पेसिफिक ट्रेनिंग डेटा की जरूरत है।

मेरा तरीका:

  1. ट्रेनिंग डेटा को सिर्फ VIX > 25 पीरियड्स तक फिल्टर करें
  2. एक्सट्रीम फियर डेज (VIX > 40) को 3x ओवरसैंपल करें
  3. मल्टीपल फियर रेजिम्स शामिल करें: 2008, 2020, 2022
  4. आउट-ऑफ-सैंपल फियर पीरियड्स पर वैलिडेट करें

मेरे द्वारा इस्तेमाल किए जाने वाले VaR एडजस्टमेंट इन फियर रेजिम्स को प्रोग्रामेटिकली डिफाइन करने में मदद करते हैं। उचित रेजिम फिल्टरिंग के बिना, आपका मॉडल गलत पैटर्न सीखता है।

महत्वपूर्ण अंतर्दृष्टि: क्लास इम्बैलेंस आपको मार देगी। डर रिवर्सल्स दुर्लभ हैं — शायद सभी ट्रेडिंग दिनों का 5%। स्टैंडर्ड ML प्रैक्टिसेज क्लासेस को बैलेंस करने का सुझाव देती हैं। ऐसा न करें। इसके बजाय, वास्तविकता को दर्शाने वाले क्लास वेट्स का उपयोग करें:

class_weights = {
  'reversal': 1.0,
  'continuation': 0.05
}

यह आपके मॉडल को हर रेड कैंडल पर चिल्लाने से रोकता है।

बैकटेस्टिंग रियलिटी चेक: 73% विन रेट

अकादमिक पेपर्स 90%+ एक्यूरेसी का दावा करना पसंद करते हैं। लाइव ट्रेडिंग में? अलग कहानी। मेरे SVM स्क्रीनर ने एक्चुअल रिवर्सल कॉल्स पर 73% एक्यूरेसी हासिल की — यहां ब्रेकडाउन है:

  • 2018 Q4 सेलऑफ: 14/19 सही कॉल्स (73.7%)
  • मार्च 2020 COVID: 22/28 सही (78.6%)
  • 2022 बेयर मार्केट: 47/68 सही (69.1%)

मॉडल तेज, डर से प्रेरित सेलऑफ्स में सबसे अच्छा प्रदर्शन करता है। धीमे बेयर मार्केट एक्यूरेसी कम कर देते हैं — वहां लेयर्ड एक्यूमुलेशन एप्रोच बेहतर काम करती है।

SVM स्क्रीनिंग परफॉर्मेंस: डर की घटनाओं में लगातार 70-75% एक्यूरेसी
SVM स्क्रीनिंग परफॉर्मेंस: डर की घटनाओं में लगातार 70-75% एक्यूरेसी

लाइव इम्प्लीमेंटेशन: मॉडल से ट्रेडिंग तक

एक्जीक्यूशन के बिना मॉडल अकादमिक हस्तमैथुन है। यहां बताया गया है कि मैं SVM स्क्रीनिंग को लाइव ट्रेडिंग में कैसे इंटीग्रेट करता हूं:

FibAlgo
FibAlgo लाइव टर्मिनल
30+ बाजारों के लिए रीयल-टाइम मार्केट सिग्नल, ब्रेकिंग न्यूज़ और एआई-संचालित विश्लेषण तक पहुँचें — सब एक ही टर्मिनल में।
टर्मिनल खोलें →

डेली वर्कफ्लो (क्लोज से 30 मिनट पहले):

  1. 500 लिक्विड स्टॉक्स के यूनिवर्स पर स्क्रीनर चलाएं
  2. रिवर्सल प्रोबेबिलिटी > 0.7 के लिए फिल्टर करें
  3. प्रोबेबिलिटी * एक्सपेक्टेड मूव मैग्नीट्यूड से रैंक करें
  4. टॉप 10 कैंडिडेट्स की मैन्युअल रिव्यू करें
  5. कॉन्विक्शन और केली फ्रैक्शन के आधार पर पोजीशन साइज तय करें

रिस्क मैनेजमेंट लेयर:

if vix > 30:
  position_size *= 0.5  # एक्सट्रीम फियर में आधा साइज
  stop_loss = atr * 3  # वोलैटिलिटी के लिए चौड़े स्टॉप्स
else:
  position_size = base_size
  stop_loss = atr * 2

मॉडल पर अंधविश्वास कभी न करें। मैंने यह सीखा जब मेरे SVM ने सितंबर 2008 में लेहमैन ब्रदर्स को "स्ट्रॉन्ग रिवर्सल कैंडिडेट" के रूप में फ्लैग किया। कुछ रिवर्सल कभी नहीं आते।

वर्तमान बाजार अनुप्रयोग (मार्च 2026)

फियर & ग्रीड 14 पर और बिटकॉइन हाल के लोज का टेस्ट कर रहा है, हम प्राइम SVM टेरिटरी में हैं। कल के स्कैन ने दिलचस्प सेटअप्स फ्लैग किए:

  • टेक दिग्गज डिस्लोकेशन दिखा रहे हैं: हाई वॉल्यूम, न्यूनतम प्राइस मूवमेंट
  • रीजनल बैंक्स RSI डाइवर्जेंस प्रदर्शित कर रहे हैं: प्राइस नए लोज बना रहा है, RSI हायर है
  • कमोडिटी स्टॉक्स करिलेशन तोड़ रहे हैं: अंडरलाइंग फ्यूचर्स से डिकपलिंग

डार्क पूल इंडिकेटर्स कई नामों में इंस्टीट्यूशनल एक्यूमुलेशन की पुष्टि करते हैं। ML सिग्नल + फ्लो डेटा का यह संगम वह जगह है जहां एज कंपाउंड होती है।

याद रखें: मॉडल कैंडिडेट्स की पहचान करता है, गारंटी नहीं। वर्तमान परिस्थितियों में, मैं चयनात्मक हो रहा हूं — सिर्फ A+ सेटअप्स ले रहा हूं जहां मल्टीपल सिस्टम्स एलाइन होते हैं।

लाइव SVM स्क्रीनर डैशबोर्ड आज के टॉप रिवर्सल कैंडिडेट्स दिखा रहा है
लाइव SVM स्क्रीनर डैशबोर्ड आज के टॉप रिवर्सल कैंडिडेट्स दिखा रहा है

एडवांस्ड टेक्निक्स: एन्सेम्बल मेथड्स

सिंगल मॉडल्स के सिंगल पॉइंट ऑफ फेल्योर होते हैं। टू सिग्मा में, हमने कभी सोलो एल्गोरिदम ट्रेड नहीं किए। यहां मेरा एन्सेम्बल एप्रोच है:

  1. प्राइमरी सिग्नल के लिए SVM (नॉन-लीनियर पैटर्न रिकग्निशन)
  2. कन्फर्मेशन के लिए रैंडम फॉरेस्ट (अलग एल्गोरिदम फैमिली)
  3. सीक्वेंस वैलिडेशन के लिए LSTM (टेम्पोरल पैटर्न्स कैप्चर करता है)

जब 2/3 मॉडल्स सहमत हों, तभी मैं सिग्नल को वैलिड मानता हूं। यह फॉल्स पॉजिटिव्स को ~40% काट देता है, जबकि अधिकांश ट्रू सिग्नल्स बनाए रखता है।

जो लोग ऑटोमेटेड एक्जीक्यूशन में रुचि रखते हैं, FibAlgo का अलर्ट सिस्टम तब ट्रिगर हो सकता है जब आपका ML मॉडल हाई-कॉन्विक्शन सिग्नल्स आउटपुट करता है, जो पायथन एनालिसिस और TradingView एक्जीक्यूशन के बीच की खाई को पाटता है।

मीन रिवर्जन फ्रेमवर्क जिस पर मैंने चर्चा की, वह समान एन्सेम्बल लाभ दिखाता है — मल्टीपल परस्पेक्टिव्स सिंगल-मॉडल रिस्क को कम करते हैं।

ML स्टॉक स्क्रीनिंग में सामान्य गलतियां

मुझे आपको महीनों के दर्द से बचाने दें। इन गलतियों ने मेरे शुरुआती मॉडल्स को मार दिया:

स्पेसिफिक इवेंट्स पर ओवरफिटिंग: मेरे पहले मॉडल ने 2008 क्रैश पैटर्न्स को याद कर लिया। 2020 में बेकार। टेम्पोरल अवेयरनेस के साथ k-फोल्ड क्रॉस-वैलिडेशन का उपयोग करें — कभी भी भविष्य के डेटा पर ट्रेन न करें।

फीचर लीकेज: आज की प्रेडिक्शन में कल के वॉल्यूम को शामिल करना। स्पष्ट लगता है, लेकिन डेरिवेटिव फीचर्स टेम्पोरल लीक्स छिपा सकते हैं। हमेशा सोचें: "क्या मैं यह प्रेडिक्शन टाइम पर जान सकता था?"

ट्रांजैक्शन कॉस्ट्स को नजरअंदाज करना: वह 73% विन रेट जीरो फ्रिक्शन मानती है। हकीकत में, स्लिपेज के लिए 10bps, कमीशन के लिए 5bps जोड़ें। छोटे एज जल्दी गायब हो जाते हैं।

मॉडल डिके: बाजार विकसित होते हैं। मेरा 2018 मॉडल 2020 तक 61% एक्यूरेसी तक डिग्रेड हो गया। कम से कम तिमाही, रेजिम चेंज के दौरान मासिक रिट्रेन करें।

जैसा कि मेरे AMM रिस्क गाइड में कवर किया गया, सिस्टमैटिक रणनीतियों को लगातार मॉनिटरिंग और एडजस्टमेंट की आवश्यकता होती है।

अपना खुद का ML स्क्रीनिंग सिस्टम बनाना

सरल शुरुआत करें। कॉम्प्लेक्सिटी एज नहीं है — उचित इम्प्लीमेंटेशन एज है। यहां आपका रोडमैप है:

Real-World Example

सप्ताह 1-2: डेटा संग्रह और सफाई। फ्री डेटा के लिए Yahoo Finance या Alpha Vantage का उपयोग करें। लिक्विड स्टॉक्स ($1B+ मार्केट कैप, 1M+ डेली वॉल्यूम) का एक यूनिवर्स बनाएं।

सप्ताह 3-4: फीचर इंजीनियरिंग। ऊपर मेरे तीन कोर फीचर्स से शुरू करें। अपनी मार्केट हाइपोथिसिस के आधार पर अन्य जोड़ें। OBV एडाप्टेशन आर्टिकल दिखाता है कि स्पेसिफिक संदर्भों के लिए इंडिकेटर्स को कैसे मॉडिफाई करें।

सप्ताह 5-6: मॉडल ट्रेनिंग और वैलिडेशन। SVM इम्प्लीमेंटेशन के लिए scikit-learn का उपयोग करें। उचित ट्रेन/टेस्ट स्प्लिटिंग पर फोकस करें — टेम्पोरल ऑर्डर मायने रखता है!

सप्ताह 7-8: बैकटेस्टिंग और पेपर ट्रेडिंग। अपना स्क्रीनर डेली चलाएं, प्रेडिक्शन्स बनाम आउटकम्स ट्रैक करें। 100+ पेपर ट्रेड्स तक कोई रियल मनी नहीं।

सप्ताह 9+: छोटे साइज के साथ लाइव इम्प्लीमेंटेशन। सिग्नल प्रति 0.25% रिस्क से शुरू करें। कंसिस्टेंसी साबित करने के बाद ही स्केल करें।

मशीन लर्निंग ट्रेडिंग की वास्तविकता

ML जादू नहीं है। यह बड़े पैमाने पर पैटर्न पहचान है। मेरा SVM स्क्रीनर भविष्य की भविष्यवाणी नहीं करता — यह पहचानता है कि कब वर्तमान स्थितियां ऐतिहासिक रूप से लाभदायक सेटअप से मेल खाती हैं।

एज तीन स्थानों से आती है:

  1. मनुष्यों से अधिक डेटा प्रोसेस करना (500 स्टॉक्स, प्रत्येक के 6 फीचर्स)
  2. डर के दौरान अनुशासन बनाए रखना (एल्गोरिदम घबराते नहीं)
  3. निरंतर निष्पादन (हर एक दिन समान नियम)

लेकिन यहाँ बात है — आपको अभी भी ट्रेडिंग अंतर्ज्ञान की आवश्यकता है। मॉडल अवसरों को चिह्नित करता है; आप पोजीशन साइज़िंग, टाइमिंग और रिस्क मैनेजमेंट तय करते हैं। शुद्ध व्यवस्थित ट्रेडिंग तब तक काम करती है जब तक यह विफल नहीं होती। बस उन क्वांट्स से पूछें जो अगस्त 2007 में ध्वस्त हो गए थे।

टू सिग्मा में, हमारी सर्वोत्तम रणनीतियों ने मशीन इंटेलिजेंस को मानवीय निगरानी के साथ जोड़ा। मशीन पैटर्न ढूंढती है। मानव जोखिम प्रबंधित करता है, खासकर रेजिम परिवर्तनों के दौरान जब ऐतिहासिक डेटा पर प्रशिक्षित मॉडल अस्थायी रूप से अंधे हो जाते हैं।

बाजारों में अत्यधिक डर के संकेत दिखने के साथ, हम ML-आधारित रिवर्सल स्क्रीनिंग के लिए आदर्श स्थिति में हैं। चाहे आप अपनी खुद की प्रणाली बनाएं या मेरी को अपनाएं, याद रखें: लक्ष्य पूर्णता नहीं है। यह निरंतर एज है, उचित आकार में, जिसमें टेल रिस्क प्रबंधित है।

क्योंकि अंत में, 27% विफल संकेतों से बचना हर रिवर्सल को पकड़ने से अधिक मायने रखता है। सबसे अच्छा एल्गोरिदम भी ट्रेड नहीं कर सकता यदि आप आउटलायर्स पर उड़ा दिए जाते हैं।

Complete machine learning stock screening workflow from data to execution
डेटा से निष्पादन तक पूर्ण मशीन लर्निंग स्टॉक स्क्रीनिंग वर्कफ़्लो

अक्सर पूछे जाने वाले प्रश्न

1मशीन लर्निंग स्टॉक स्क्रीनिंग क्या है?
ऐतिहासिक पैटर्न के आधार पर विशिष्ट मानदंडों को पूरा करने वाले स्टॉक्स को स्वचालित रूप से पहचानने के लिए एसवीएम जैसे एल्गोरिदम का उपयोग करना।
2स्टॉक स्क्रीनिंग के लिए एसवीएम कितना सटीक है?
उचित फीचर इंजीनियरिंग के साथ, मेरे बैकटेस्ट किए गए एसवीएम मॉडल ने डर बाजार उलटफेर पर 73% सटीकता हासिल की।
3एमएल स्टॉक स्क्रीनिंग के लिए कौन से फीचर सबसे अच्छा काम करते हैं?
वॉल्यूम/मूल्य अनुपात, आरएसआई विचलन और तरलता मेट्रिक्स ने पारंपरिक तकनीकी संकेतकों से बेहतर प्रदर्शन किया।
4क्या एमएल स्क्रीनिंग के लिए प्रोग्रामिंग कौशल की आवश्यकता है?
बेसिक पायथन मदद करता है, लेकिन ट्रेडिंगव्यू जैसे प्लेटफॉर्म अब पाइन स्क्रिप्ट के माध्यम से सरलीकृत एमएल एकीकरण प्रदान करते हैं।
5मुझे कितने ऐतिहासिक डेटा की आवश्यकता है?
प्रशिक्षण के लिए न्यूनतम 2 वर्ष, लेकिन बेहतर सामान्यीकरण के लिए 5+ वर्ष कई बाजार चक्रों को कैप्चर करते हैं।
FibAlgo
AI-संचालित ट्रेडिंग

ज्ञान को लाभ में बदलें

आपने अभी मूल्यवान ट्रेडिंग अंतर्दृष्टि सीखी है। अब उन्हें AI-संचालित संकेतों के साथ क्रियान्वित करें जो 30+ बाजारों का रीयल-टाइम विश्लेषण करते हैं।

10,000+
सक्रिय व्यापारी
24/7
रीयल-टाइम संकेत
30+
बाजार कवर किए गए
क्रेडिट कार्ड की आवश्यकता नहीं। लाइव मार्केट टर्मिनल तक मुफ्त पहुँच।

पढ़ना जारी रखें

सभी देखें →
केंद्रीय बैंक बैलेंस शीट्स में छिपे 20-50 पिप आर्बिट्रेज विंडोcentral bank trading

केंद्रीय बैंक बैलेंस शीट्स में छिपे 20-50 पिप आर्बिट्रेज विंडो

📖 9 min
मार्केट मेकर मैनिपुलेशन पैटर्न ने मुझे शिकारी से शिकार बना दियाmarket maker manipulation

मार्केट मेकर मैनिपुलेशन पैटर्न ने मुझे शिकारी से शिकार बना दिया

📖 11 min
सिंथेटिक ऑप्शन हर बार प्रीमियम डिके को हराते हैंoptions trading

सिंथेटिक ऑप्शन हर बार प्रीमियम डिके को हराते हैं

📖 7 min