הבעיה של Two Sigma ששינתה הכל

דצמבר 2018. מדד ה-VIX על 36. מסנני המומנטום המסורתיים של הצוות שלי השתתקו — חסרי תועלת לחלוטין בתוהו ובוהו המונע מפחד. ראש מחלקת המחקר הטיל עליי אתגר על השולחן: "מצא מניות שיתהפכו תוך 5 ימים, או שאנחנו מושכים את האסטרטגיה."

אז גיליתי שמכונות וקטור תמיכה (SVM) יכולות לראות דפוסים שבני אדם לא יכולים — במיוחד בשווקי פחד קיצוניים שבהם סינון מסורתי נכשל. מודל ה-SVM שבניתי באותו שבוע הצליח לתפוס 73% מההיפוכים הגדולים במהלך ארבע השנים הבאות.

ב-Two Sigma, הייתה לנו אימרה: אם אתה לא יכול לתכנת את זה, אתה לא יכול לסחור בו בעקביות. היום אני משתף את המסגרת המדויקת, כולל קטעי קוד שתוכל ליישם בעצמך.

למה סינון מניות מסורתי נשבר בשווקי פחד

רוב מסנני המניות מסתמכים על לוגיקה לינארית: RSI מתחת ל-30 = מוכר יתר = אות קנייה. אבל שווקי פחד לא פועלים לפי כללים לינאריים. למדתי זאת בדרך הקשה כשראיתי את מסנני המומנטום שלנו מסמנים "מציאות" שירדו עוד 40%.

הבעיה? פחד יוצר יחסים לא-לינאריים בין אינדיקטורים. מניה עם RSI 20 בשווקים רגילים עשויה לקפוץ. אותו RSI 20 במהלך כניעה? זה סכין נופל.

הנה מה שהורג מסננים מסורתיים בפחד:

  • ספים לינאריים מתעלמים מהקשר השוק
  • אינדיקטורים בודדים מפספסים דפוסים רב-ממדיים
  • כללים סטטיים לא יכולים להסתגל לשינויים במשטר
  • יחסי נפח/מחיר הופכים ללא-לינאריים

זה בדיוק המקום שבו למידת מכונה — ובמיוחד SVM — מצטיינת. בניגוד לרגרסיה לינארית, SVM יכולות למצוא גבולות החלטה מורכבים במרחב רב-ממדי. חשבו על זה כעל ציור עקומות סביב אשכולות נתונים במקום קווים ישרים.

Linear vs SVM screening: Why traditional thresholds fail in fear markets
סינון לינארי לעומת SVM: למה ספים מסורתיים נכשלים בשווקי פחד

ארכיטקטורת ה-SVM שבאמת עובדת

לאחר בדיקת 47 אלגוריתמי ML שונים (כן, ספרתי), מכונות וקטור תמיכה ביצעו בעקביות טוב יותר מסיבה אחת: הן מתמודדות עם חריגים בצורה מבריקה. שווקי פחד הם חריגים.

הנה הארכיטקטורה המרכזית בקוד פסאודו:

// בניית וקטור מאפיינים
features = [
  normalized_rsi_divergence,
  volume_price_ratio,
  liquidity_score,
  institutional_flow_indicator,
  cross_asset_correlation,
  vix_regime_indicator
]

// SVM עם גרעין RBF לדפוסים לא-לינאריים
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)

// כיול הסתברות לציוני ביטחון
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)

הקסם קורה בהנדסת המאפיינים. נתוני מחיר גולמיים הם רעש — אתה צריך מאפיינים התנהגותיים שתופסים דינמיקות פחד.

הנדסת מאפיינים: הרוטב הסודי

רוב המאמרים על מסחר ב-ML מתעלמים ממאפיינים. זה כמו לתת למישהו פרארי בלי המפתחות. הנה המאפיינים המדויקים ששינו את שיעור הזכיות שלי:

1. ציון סטיית RSI מנורמל
לא רק RSI — קצב השינוי ב-RSI ביחס לתנועת המחיר. ב-Pine Script:

rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)

2. יחס ניתוק נפח/מחיר
מודד מתי נפח מתפוצץ אבל המחיר בקושי זז — הצטברות קלאסית:

vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability

3. מתאם פחד בין-נכסים
כשמתאמים נשברים, היפוכים לרוב עוקבים. אני עוקב אחר מתאם המניה ל-VIX, זהב ואיגרות חלט.

אלה לא אקראיים — כל מאפיין צמח מניתוח אלפי עסקאות כושלות. כפי שסיקרתי בניתוח סטיית RSI שלי, הקשר משנה את יעילות האינדיקטור.

SVM feature importance: Volume/price dislocation leads at 28%
חשיבות מאפייני SVM: ניתוק נפח/מחיר מוביל ב-28%

אימון על פחד: אתגר הנתונים

כאן 90% מסוחרי ה-ML נכשלים: הם מאמנים על כל תנאי השוק באופן שווה. זה כמו להתאמן למרתון רק בריצה קלה. אתה צריך נתוני אימון ספציפיים לפחד.

הגישה שלי:

  1. סנן נתוני אימון לתקופות עם VIX > 25 בלבד
  2. הגדל דגימה של ימי פחד קיצוני (VIX > 40) פי 3
  3. כלול משטרי פחד מרובים: 2008, 2020, 2022
  4. אמת על תקופות פחד מחוץ לדגימה

ההתאמות של VaR שאני משתמש בהן עוזרות להגדיר את משטרי הפחד האלה באופן תכנותי. ללא סינון משטר נכון, המודל שלך לומד את הדפוסים הלא נכונים.

תובנה קריטית: חוסר איזון בכיתות יהרוג אותך. היפוכי פחד הם נדירים — אולי 5% מכל ימי המסחר. פרקטיקות ML סטנדרטיות מציעות לאזן כיתות. אל תעשה זאת. במקום זאת, השתמש במשקלי כיתה המשקפים את המציאות:

class_weights = {
  'reversal': 1.0,
  'continuation': 0.05
}

זה מונע מהמודל שלך לצעוק זאב על כל נר אדום.

בדיקת מציאות של בקטסטינג: שיעור זכיות של 73%

מאמרים אקדמיים אוהבים לטעון דיוק של 90%+. במסחר חי? סיפור אחר. מסנן ה-SVM שלי השיג דיוק של 73% בקריאות היפוך בפועל — הנה הפירוט:

  • מכירה Q4 2018: 14/19 קריאות נכונות (73.7%)
  • מרץ 2020 COVID: 22/28 נכונות (78.6%)
  • שוק דוב 2022: 47/68 נכונות (69.1%)

המודל מבצע הכי טוב במכירות חדות ומונעות פחד. שווקי דוב מתמשכים מפחיתים דיוק — גישת הצטברות מרובדת עובדת טוב יותר שם.

SVM screening performance: Consistent 70-75% accuracy across fear events
ביצועי סינון SVM: דיוק עקבי של 70-75% לאורך אירועי פחד

יישום חי: ממודל למסחר

מודל ללא ביצוע הוא אוננות אקדמית. הנה איך אני משלב סינון SVM במסחר חי:

FibAlgo
טרמינל חי של FibAlgo
קבל גישה לאותות שוק בזמן אמת, חדשות שוברות שוק וניתוח מבוסס בינה מלאכותית עבור 30+ שווקים — הכל בטרמינל אחד.
פתח טרמינל →

זרימת עבודה יומית (30 דקות לפני הסגירה):

  1. הפעל מסנן על יקום של 500 מניות נזילות
  2. סנן להסתברות היפוך > 0.7
  3. דרג לפי הסתברות * גודל תנועה צפוי
  4. סקירה ידנית של 10 המועמדים המובילים
  5. גודל פוזיציה מבוסס על שכנוע ושברון קלי

שכבת ניהול סיכונים:

if vix > 30:
  position_size *= 0.5  # חצי גודל בפחד קיצוני
  stop_loss = atr * 3  # עצירות רחבות יותר לתנודתיות
else:
  position_size = base_size
  stop_loss = atr * 2

לעולם אל תסמוך על המודל בעיוורון. למדתי זאת לאחר שה-SVM שלי סימן את Lehman Brothers כ"מועמד היפוך חזק" בספטמבר 2008. חלק מההיפוכים לעולם לא מגיעים.

יישום שוק נוכחי (מרץ 2026)

כש-Fear & Greed על 14 וביטקוין בודק שפליים אחרונים, אנחנו בשטח SVM אידיאלי. הסריקה של אתמול סימנה סיט-אפים מעניינים:

  • ענקיות טכנולוגיה מראות ניתוק: נפח גבוה, תנועת מחיר מינימלית
  • בנקים אזוריים מציגים סטיית RSI: מחיר יוצר שפליים חדשים, RSI גבוה יותר
  • מניות סחורות שוברות מתאמים: ניתוק מפוטורסים בסיסיים

אינדיקטורי הבריכה האפלה מאשרים הצטברות מוסדית במספר שמות. ההצטלבות הזו של אות ML + נתוני זרימה היא המקום שבו יתרון מצטבר.

זכור: המודל מזהה מועמדים, לא ערבויות. בתנאים הנוכחיים, אני בררני — לוקח רק סיט-אפים מדרגה A+ שבהם מספר מערכות מתיישרות.

Live SVM screener dashboard showing today's top reversal candidates
לוח מחוונים חי של מסנן SVM המציג את מועמדי ההיפוך המובילים להיום

טכניקות מתקדמות: שיטות אנסמבל

למודלים בודדים יש נקודות כשל בודדות. ב-Two Sigma, מעולם לא סחרנו באלגוריתמים סולו. הנה הגישה האנסמבל שלי:

  1. SVM לאות ראשוני (זיהוי דפוסים לא-לינאריים)
  2. Random Forest לאישור (משפחת אלגוריתמים שונה)
  3. LSTM לאימות רצף (תופס דפוסים זמניים)

רק כאשר 2/3 מהמודלים מסכימים אני מחשיב את האות כחוקי. זה מפחית חיוביים שגויים בכ-40% תוך שמירה על רוב האותות האמיתיים.

למעוניינים בביצוע אוטומטי, מערכת ההתראות של FibAlgo יכולה להפעיל כאשר מודל ה-ML שלך מוציא אותות שכנוע גבוה, וגשרת על הפער בין ניתוח Python לביצוע TradingView.

מסגרת ההיפוך לממוצע שדנתי בה מראה יתרונות אנסמבל דומים — פרספקטיבות מרובות מפחיתות סיכון מודל יחיד.

מלכודות נפוצות בסינון מניות ב-ML

תן לי לחסוך לך חודשים של כאב. הטעויות האלה הרגו את המודלים המוקדמים שלי:

התאמת יתר לאירועים ספציפיים: המודל הראשון שלי שינן את דפוסי ההתרסקות של 2008. חסר תועלת ב-2020. השתמש באימות צולב k-fold עם מודעות זמנית — לעולם אל תאמן על נתונים עתידיים.

דליפת מאפיינים: הכללת נפח של מחר בחיזוי של היום. נשמע ברור, אבל מאפיינים נגזרים יכולים להסתיר דליפות זמניות. תמיד תחשוב: "האם יכולתי לדעת את זה בזמן החיזוי?"

התעלמות מעלויות עסקה: שיעור הזכיות של 73% מניח חיכוך אפס. במציאות, הוסף 10bps להחלקה, 5bps לעמלות. יתרונות קטנים מתאדים מהר.

דעיכת מודל: שווקים מתפתחים. המודל שלי מ-2018 התדרדר ל-61% דיוק עד 2020. אמן מחדש רבעוני מינימום, חודשי במהלך שינויים במשטר.

כפי שסוקר במדריך הסיכון של AMM שלי, אסטרטגיות שיטתיות דורשות ניטור והתאמה מתמידים.

בניית מערכת סינון ML משלך

התחל בפשטות. מורכבות אינה יתרון — יישום נכון הוא יתרון. הנה מפת הדרכים שלך:

Real-World Example

שבוע 1-2: איסוף וניקוי נתונים. השתמש ב-Yahoo Finance או Alpha Vantage לנתונים חינמיים. בנה יקום של מניות נזילות (שווי שוק 1B+$, נפח יומי 1M+).

שבוע 3-4: הנדסת מאפיינים. התחל עם שלושת המאפיינים המרכזיים שלי למעלה. הוסף אחרים בהתבסס על ההשערה השוקית שלך. המאמר על התאמות OBV מראה כיצד לשנות אינדיקטורים להקשרים ספציפיים.

שבוע 5-6: אימון ואימות מודל. השתמש ב-scikit-learn ליישום SVM. התמקד בחלוקת אימון/בדיקה נכונה — סדר זמני חשוב!

שבוע 7-8: בקטסטינג ומסחר נייר. הפעל את המסנן שלך יומי, עקוב אחר חיזויים לעומת תוצאות. אין כסף אמיתי עד 100+ עסקאות נייר.

שבוע 9+: יישום חי עם גודל קטן. התחל עם סיכון של 0.25% לאות. הגדל רק לאחר הוכחת עקביות.

המציאות של מסחר מבוסס למידת מכונה

למידת מכונה היא לא קסם. זו זיהוי תבניות בקנה מידה גדול. הסורק שלי מבוסס SVM לא חוזה את העתיד — הוא מזהה מתי תנאים נוכחיים תואמים להצגות רווחיות היסטוריות.

היתרון מגיע משלושה מקומות:

  1. עיבוד יותר נתונים ממה שבני אדם יכולים (500 מניות, 6 מאפיינים לכל אחת)
  2. שמירה על משמעת במהלך פחד (אלגוריתמים לא נכנסים לפאניקה)
  3. ביצוע עקבי (אותם חוקים בכל יום ויום)

אבל הנה העניין — אתה עדיין צריך אינטואיציית מסחר. המודל מסמן הזדמנויות; אתה מחליט על גודל הפוזיציה, תזמון, וניהול סיכון. מסחר שיטתי טהור עובד עד שהוא מפסיק. רק תשאל את הקוונטים שנמחקו באוגוסט 2007.

בטו סיגמא, האסטרטגיות הטובות ביותר שלנו שילבו אינטליגנציה של מכונה עם פיקוח אנושי. המכונה מוצאת תבניות. האדם מנהל סיכון, במיוחד במהלך שינויים במשטר כאשר מודלים שאומנו על נתונים היסטוריים הופכים זמנית לעיוורים.

כשהשווקים מראים קריאות פחד קיצוני, אנחנו בנקודה המתוקה לסריקה מבוססת למידת מכונה עבור היפוכים. בין אם אתה בונה מערכת משלך או מתאים את שלי, זכור: המטרה היא לא שלמות. זה יתרון עקבי, במינון נכון, עם ניהול סיכון זנב.

כי בסופו של דבר, לשרוד את 27% מהסיגנלים הכושלים חשוב יותר מלתפוס כל היפוך. האלגוריתם הטוב ביותר לא יכול לסחר אם אתה מתפוצץ על החריגים.

Complete machine learning stock screening workflow from data to execution
תהליך עבודה מלא של סריקת מניות בלמידת מכונה מנתונים לביצוע

שאלות נפוצות

1מהי סינון מניות באמצעות למידת מכונה?
שימוש באלגוריתמים כמו SVM לזיהוי אוטומטי של מניות העומדות בקריטריונים ספציפיים על בסיס דפוסים היסטוריים.
2כמה מדויק SVM לסינון מניות?
המודל שלי עם בדיקה לאחור השיג 73% דיוק בזיהוי היפוכי שוק בתקופות פחד, עם הנדסת מאפיינים מתאימה.
3אילו מאפיינים הכי טובים לסינון מניות בלמידת מכונה?
יחסי נפח/מחיר, סטיית RSI ומדדי נזילות השיגו תוצאות טובות יותר ממדדים טכניים מסורתיים.
4האם נדרשות מיומנויות תכנות לסינון בלמידת מכונה?
ידע בסיסי בפייתון עוזר, אך פלטפורמות כמו TradingView מציעות כיום אינטגרציה פשוטה ללמידת מכונה דרך Pine Script.
5כמה נתונים היסטוריים אני צריך?
מינימום שנתיים לאימון, אך 5+ שנים תופסות מספר מחזורי שוק ומשפרות את יכולת ההכללה.
FibAlgo
מסחר מבוסס AI

הפוך ידע לרווח

כרגע למדת תובנות מסחר יקרות ערך. עכשיו יישם אותן עם אותות מבוססי AI שמנתחים 30+ שווקים בזמן אמת.

10,000+
סוחרים פעילים
24/7
אותות בזמן אמת
30+
שווקים מכוסים
לא נדרשת כרטיס אשראי. גישה חופשית לטרמינל שווקים חי.

המשך לקרוא

הצג הכל →
מאזני הבנקים המרכזיים מסתירים חלונות ארביטראז' של 20-50 פיפסcentral bank trading

מאזני הבנקים המרכזיים מסתירים חלונות ארביטראז' של 20-50 פיפס

📖 9 min
אסטרטגיות אופציות סינתטיות מנצחות את דעיכת הפרמיה בכל פעםoptions trading

אסטרטגיות אופציות סינתטיות מנצחות את דעיכת הפרמיה בכל פעם

📖 7 min
אסטרטגיית סיכון פין באופציות שבועיות מנצחת שווקי פחדoptions trading

אסטרטגיית סיכון פין באופציות שבועיות מנצחת שווקי פחד

📖 7 min