مشكلة Two Sigma التي غيرت كل شيء
ديسمبر 2018. مؤشر VIX عند 36. أصبحت شاشات الفحص التقليدية لفريقنا القائمة على الزخم صامتة تمامًا - عديمة الفائدة في الفوضى التي يقودها الخوف. طرح رئيس قسم الأبحاث تحدياً على مكتبي: "ابحث عن الأسهم التي ستنعكس خلال 5 أيام، وإلا سنوقف الاستراتيجية."
هذا عندما اكتشفت أن آلات ناقلات الدعم (SVM) تستطيع رؤية أنماط لا يستطيع البشر رؤيتها - خاصة في أسواق الخوف الشديد حيث تفشل عمليات الفحص التقليدية. النموذج الذي بنيته باستخدام SVM في ذلك الأسبوع تمكن من التقاط 73% من الانعكاسات الرئيسية خلال السنوات الأربع التالية.
في Two Sigma، كان لدينا قول مأثور: إذا لم تستطع برمجته، فلن تستطيع المتاجرة به باستمرار. اليوم أشارك معكم الإطار الدقيق، بما في ذلك مقاطع التعليمات البرمجية التي يمكنكم تنفيذها بأنفسكم.
لماذا تفشل فحص الأسهم التقليدي في أسواق الخوف
تعتمد معظم شاشات فحص الأسهم على منطق خطي: مؤشر RSI أقل من 30 = ذروة بيع = إشارة شراء. لكن أسواق الخوف لا تتبع قواعد خطية. تعلمت هذا بالطريقة الصعبة عندما شاهدت شاشات فحص الزخم لدينا تعلن عن "صفقات" انخفضت بنسبة 40% أخرى.
المشكلة؟ الخوف يخلق علاقات غير خطية بين المؤشرات. سهم بمؤشر RSI 20 في الأسواق العادية قد يرتد. نفس المؤشر RSI 20 خلال مرحلة الاستسلام؟ هذا سهم في هبوط حاد.
هذا ما يقضي على شاشات الفحص التقليدية في الخوف:
- العتبات الخطية تتجاهل سياق السوق
- المؤشرات الفردية تفوت الأنماط متعددة الأبعاد
- القواعد الثابتة لا تستطيع التكيف مع تغيرات النظام
- علاقات الحجم/السعر تصبح غير خطية
هذا بالضبط حيث يتفوق التعلم الآلي - وتحديدًا SVM. على عكس الانحدار الخطي، يمكن لـ SVM إيجاد حدود قرار معقدة في فضاء عالي الأبعاد. فكر في الأمر كرسم منحنيات حول مجموعات البيانات بدلاً من خطوط مستقيمة.

هيكلية SVM التي تعمل بالفعل
بعد اختبار 47 خوارزمية تعلم آلي مختلفة (نعم، قمت بالعد)، تفوقت آلات ناقلات الدعم باستمرار لسبب واحد: إنها تتعامل مع القيم المتطرفة ببراعة. أسواق الخوف هي قيم متطرفة.
هذه هي الهيكلية الأساسية في الكود الزائف:
// بناء متجه الميزات
features = [
normalized_rsi_divergence,
volume_price_ratio,
liquidity_score,
institutional_flow_indicator,
cross_asset_correlation,
vix_regime_indicator
]
// SVM مع نواة RBF للأنماط غير الخطية
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)
// معايرة الاحتمال لدرجات الثقة
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)
السحر يحدث في هندسة الميزات. بيانات السعر الخام هي ضوضاء - أنت بحاجة إلى ميزات سلوكية تلتقط ديناميكيات الخوف.
هندسة الميزات: المكون السري
معظم مقالات المتاجرة بالتعلم الآلي تتحدث عن الميزات بشكل عام. هذا مثل إعطاء شخص سيارة فيراري بدون المفاتيح. هذه هي الميزات الدقيقة التي حولت معدل فوزي:
1. درجة تباعد RSI المعيارية
ليس فقط RSI - بل معدل التغير في RSI نسبة لحركة السعر. في Pine Script:
rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)
2. نسبة انفصال الحجم/السعر
تقيس عندما ينفجر الحجم بالكاد يتحرك السعر - تراكم كلاسيكي:
vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability
3. ارتباط الخوف عبر الأصول
عندما تنكسر الارتباطات، غالبًا ما تتبعها انعكاسات. أتتبع ارتباط السهم مع VIX والذهب والسندات الحكومية.
هذه ليست عشوائية - كل ميزة ظهرت من تحليل آلاف الصفقات الفاشلة. كما ناقشت في تحليلي لتباعد RSI، السياق يحول فعالية المؤشر.

التدريب على الخوف: تحدي البيانات
هنا يفشل 90% من متداولي التعلم الآلي: يدربون على جميع ظروف السوق بالتساوي. هذا مثل التدريب للماراثون بالجري البطيء فقط. أنت بحاجة إلى بيانات تدريبية خاصة بالخوف.
نهجي:
- تصفية بيانات التدريب لفترات VIX > 25 فقط
- تكبير عينة أيام الخوف الشديد (VIX > 40) بمقدار 3 مرات
- تضمين أنظمة خوف متعددة: 2008، 2020، 2022
- التحقق على فترات خوف خارج العينة
تعديلات VaR التي أستخدمها تساعد في تعريف أنظمة الخوف هذه برمجيًا. بدون التصفية المناسبة للنظام، يتعلم نموذجك الأنماط الخاطئة.
رؤية حرجة: عدم توازن الفئات سيدمرك. انعكاسات الخوف نادرة - ربما 5% من أيام التداول. الممارسات القياسية للتعلم الآلي تقترح موازنة الفئات. لا تفعل. بدلاً من ذلك، استخدم أوزان فئات تعكس الواقع:
class_weights = {
'reversal': 1.0,
'continuation': 0.05
}
هذا يمنع نموذجك من إطلاق الإنذار على كل شمعة حمراء.
فحص واقعي للاختبار الخلفي: معدل الفوز 73%
الأوراق الأكاديمية تحب الادعاء بدقة تتجاوز 90%. في التداول الحي؟ قصة مختلفة. حقق فاحص SVM الخاص بي دقة 73% على إشارات الانعكاس الفعلية - هذا هو التفصيل:
- هبوط الربع الرابع 2018: 14/19 إشارة صحيحة (73.7%)
- مارس 2020 COVID: 22/28 إشارة صحيحة (78.6%)
- سوق الدب 2022: 47/68 إشارة صحيحة (69.1%)
النموذج يؤدي بشكل أفضل في حالات الهبوط الحادة التي يقودها الخوف. أسواق الدب المطولة تقلل الدقة - نهج التراكم الطبقي يعمل بشكل أفضل هناك.

التنفيذ الحي: من النموذج إلى التداول
نموذج بدون تنفيذ هو استمناء أكاديمي. هذه هي طريقة دمج فحص SVM في التداول الحي:
سير العمل اليومي (30 دقيقة قبل الإغلاق):
- تشغيل الفاحص على مجموعة من 500 سهم سائل
- تصفية الاحتمالات الأكبر من 0.7 للانعكاس
- الترتيب حسب الاحتمال * حجم الحركة المتوقع
- مراجعة يدوية لأفضل 10 مرشحين
- تحديد حجم المركز بناءً على القناعة وجزء كيلي
طبقة إدارة المخاطر:
if vix > 30:
position_size *= 0.5 # نصف الحجم في الخوف الشديد
stop_loss = atr * 3 # أوامر إيقاف أوسع للتقلب
else:
position_size = base_size
stop_loss = atr * 2
لا تثق بالنموذج بشكل أعمى. تعلمت هذا بعد أن أشار SVM الخاص بي إلى Lehman Brothers كـ "مرشح قوي للانعكاس" في سبتمبر 2008. بعض الانعكاسات لا تأتي أبدًا.
التطبيق الحالي للسوق (مارس 2026)
مع مؤشر الخوف والجشع عند 14 و Bitcoin يختبر أدنى مستوياته الأخيرة، نحن في منطقة SVM مثالية. مسح الأمس أشار إلى إعدادات مثيرة للاهتمام:
- عمالقة التكنولوجيا يظهرون انفصالاً: حجم مرتفع، حركة سعرية ضئيلة
- البنوك الإقليمية تظهر تباعد RSI: السعر يصنع قيعان جديدة، RSI أعلى
- أسهم السلع تنكسر ارتباطاتها: انفصال عن العقود الآجلة الأساسية
مؤشرات البرك المظلمة تؤكد تراكم المؤسسات في عدة أسماء. هذا التقاطع لإشارة التعلم الآلي + بيانات التدفق هو حيث يتضاعف الميزة.
تذكر: النموذج يحدد مرشحين، ليس ضمانات. في الظروف الحالية، أكون انتقائيًا - آخذ فقط الإعدادات الممتازة حيث تتوافق أنظمة متعددة.

تقنيات متقدمة: طرق المجموعات
النماذج الفردية لها نقاط فشل فردية. في Two Sigma، لم نتداول أبدًا بخوارزميات منفردة. هذا هو نهجي للمجموعات:
- SVM للإشارة الأساسية (التعرف على الأنماط غير الخطية)
- Random Forest للتأكيد (عائلة خوارزمية مختلفة)
- LSTM للتحقق التسلسلي (يلتقط الأنماط الزمنية)
فقط عندما يوافق 2/3 من النماذج أعتبر الإشارة صالحة. هذا يقلل الإيجابيات الكاذبة بنحو ~40% مع الحفاظ على معظم الإشارات الحقيقية.
للمهتمين بالتنفيذ الآلي، يمكن لنظام التنبيهات في FibAlgo أن ينطلق عندما ينتج نموذج التعلم الآلي الخاص بك إشارات عالية القناعة، جسرًا للفجوة بين تحليل Python وتنفيذ TradingView.
إطار الارتداد المتوسط الذي ناقشته يظهر فوائد مجموعات مماثلة - وجهات نظر متعددة تقلل من مخاطر النموذج الواحد.
المزالق الشائعة في فحص الأسهم بالتعلم الآلي
دعني أوفر عليك شهورًا من الألم. هذه الأخطاء دمرت نماذجي المبكرة:
التكيف الزائد لأحداث محددة: نموذجي الأول حفظ أنماط انهيار 2008. عديم الفائدة في 2020. استخدم التحقق المتقاطع k-fold مع وعي زمني - لا تدرب أبدًا على بيانات مستقبلية.
تسرب الميزات: تضمين حجم الغد في توقع اليوم. يبدو واضحًا، لكن الميزات المشتقة يمكن أن تخفي تسربات زمنية. فكر دائمًا: "هل يمكنني معرفة هذا في وقت التوقع؟"
تجاهل تكاليف المعاملات: معدل الفوز 73% هذا يفترض عدم وجود احتكاك. في الواقع، أضف 10 نقاط أساس للانزلاق، 5 نقاط أساس للعمولات. المزايا الصغيرة تتبخر بسرعة.
تدهور النموذج: الأسواق تتطور. نموذجي 2018 تدهور إلى دقة 61% بحلول 2020. أعد التدريب ربع سنويًا كحد أدنى، شهريًا خلال تغيرات النظام.
كما نوقش في دليل مخاطر AMM الخاص بي، تتطلب الاستراتيجيات المنهجية مراقبة وتعديلًا مستمرين.
بناء نظام فحص التعلم الآلي الخاص بك
ابدأ ببساطة. التعقيد ليس ميزة - التنفيذ السليم هو الميزة. هذه هي خريطة طريقك:
الأسبوع 1-2: جمع البيانات وتنظيفها. استخدم Yahoo Finance أو Alpha Vantage للبيانات المجانية. أنشئ مجموعة من الأسهم السائلة (قيمة سوقية +1 مليار دولار، حجم يومي +1 مليون).
الأسبوع 3-4: هندسة الميزات. ابدأ بالميزات الأساسية الثلاثة أعلاه. أضف أخرى بناءً على فرضية السوق الخاصة بك. مقال تعديلات OBV يوضح كيفية تعديل المؤشرات لسياقات محددة.
الأسبوع 5-6: تدريب النموذج والتحقق منه. استخدم scikit-learn لتنفيذ SVM. ركز على التقسيم المناسب للتدريب/الاختبار - الترتيب الزمني مهم!
الأسبوع 7-8: الاختبار الخلفي والتداول الورقي. شغل فاحصك يوميًا، تتبع التوقعات مقابل النتائج. لا أموال حقيقية حتى 100+ صفقة ورقية.
الأسبوع 9+: التنفيذ الحي بحجم صغير. ابدأ بمخاطرة 0.25% لكل إشارة. زد الحجم فقط بعد إثبات الاتساق.
واقع التداول بالتعلم الآلي
التعلم الآلي ليس سحرًا. إنه التعرف على الأنماط على نطاق واسع. منظف الأسهم الخاص بي باستخدام آلات المتجهات الداعمة لا يتنبأ بالمستقبل — بل يحدد متى تتطابق الظروف الحالية مع إعدادات تاريخية حققت ربحًا.
الميزة التنافسية تأتي من ثلاثة مصادر:
- معالجة بيانات أكثر مما يستطيع البشر (500 سهم، 6 خصائص لكل منها)
- الحفاظ على الانضباط خلال فترات الخوف (الخوارزميات لا تشعر بالذعر)
- تنفيذ متسق (نفس القواعد كل يوم دون استثناء)
ولكن إليك الأمر المهم — ما زلت بحاجة إلى الحدس في التداول. النموذج يشير إلى الفرص؛ أنت تقرر حجم المركز والتوقيت وإدارة المخاطر. التداول المنهجي البحصر يعمل حتى يتوقف عن العمل. فقط اسأل محللي الكم الذين تكبدوا خسائر فادحة في أغسطس 2007.
في Two Sigma، كانت أفضل استراتيجياتنا تجمع بين الذكاء الآلي والإشراف البشري. الآلة تجد الأنماط. الإنسان يدير المخاطر، خاصة خلال فترات التحول في النظام السوقي عندما تصبح النماذج المدربة على بيانات تاريخية عمياء مؤقتًا.
مع ظهور مؤشرات خوف شديدة في الأسواق، نحن في المرحلة المثالية لتنقية الانعكاسات القائمة على التعلم الآلي. سواء كنت تبني نظامك الخاص أو تعدل نظامي، تذكر: الهدف ليس الكمال. إنه ميزة تنافسية متسقة، بحجم مناسب، مع إدارة مخاطر الذيل.
لأنه في النهاية، النجاة من 27% من الإشارات الفاشلة أهم من التقاط كل انعكاس. أفضل خوارزمية لا تستطيع التداول إذا انهارت على القيم المتطرفة.




