Le Problème Two Sigma Qui a Tout Changé

Décembre 2018. Le VIX à 36. Les filtres traditionnels de momentum de mon équipe étaient devenus silencieux — complètement inutiles dans le chaos alimenté par la peur. Notre responsable de la recherche a déposé un défi sur mon bureau : "Trouve des actions qui vont se retourner dans les 5 jours, ou on retire la stratégie."

C'est là que j'ai découvert que les machines à vecteurs de support pouvaient voir des modèles que les humains ne pouvaient pas — surtout dans les marchés de peur extrême où le filtrage traditionnel échoue. Le modèle SVM que j'ai construit cette semaine-là a ensuite capté 73% des grands retournements au cours des quatre années suivantes.

Chez Two Sigma, nous avions un dicton : si tu ne peux pas le coder, tu ne peux pas le trader de manière cohérente. Aujourd'hui, je partage le cadre exact, y compris des extraits de code que vous pouvez implémenter vous-même.

Pourquoi le Filtrage Traditionnel des Actions Casse dans les Marchés de Peur

La plupart des filtres d'actions reposent sur une logique linéaire : RSI en dessous de 30 = survendu = signal d'achat. Mais les marchés de peur ne suivent pas de règles linéaires. Je l'ai appris à mes dépens en voyant nos filtres de momentum signaler des "bonnes affaires" qui ont encore chuté de 40%.

Le problème ? La peur crée des relations non linéaires entre les indicateurs. Une action avec un RSI à 20 dans des marchés normaux pourrait rebondir. Le même RSI à 20 pendant une capitulation ? C'est un couteau qui tombe.

Voici ce qui tue les filtres traditionnels dans la peur :

  • Les seuils linéaires ignorent le contexte de marché
  • Les indicateurs uniques manquent les modèles multidimensionnels
  • Les règles statiques ne peuvent pas s'adapter aux changements de régime
  • Les relations volume/prix deviennent non linéaires

C'est exactement là où l'apprentissage automatique — spécifiquement les SVM — excelle. Contrairement à la régression linéaire, les SVM peuvent trouver des frontières de décision complexes dans un espace à haute dimension. Voyez cela comme dessiner des courbes autour des clusters de données au lieu de lignes droites.

Filtrage linéaire vs SVM : Pourquoi les seuils traditionnels échouent dans les marchés de peur
Filtrage linéaire vs SVM : Pourquoi les seuils traditionnels échouent dans les marchés de peur

L'Architecture SVM Qui Fonctionne Vraiment

Real-World Example

Après avoir testé 47 algorithmes d'apprentissage automatique différents (oui, j'ai compté), les machines à vecteurs de support ont systématiquement surpassé les autres pour une raison : elles gèrent brillamment les valeurs aberrantes. Les marchés de peur SONT des valeurs aberrantes.

Voici l'architecture centrale en pseudo-code :

// Construction du vecteur de caractéristiques
features = [
  normalized_rsi_divergence,
  volume_price_ratio,
  liquidity_score,
  institutional_flow_indicator,
  cross_asset_correlation,
  vix_regime_indicator
]

// SVM avec noyau RBF pour les modèles non linéaires
model = SVM(kernel='rbf', C=10, gamma=0.001)
model.fit(training_features, reversal_labels)

// Calibration de probabilité pour les scores de confiance
calibrated_model = CalibratedClassifier(model)
reversal_probability = calibrated_model.predict_proba(new_data)

La magie opère dans l'ingénierie des caractéristiques. Les données brutes de prix sont du bruit — vous avez besoin de caractéristiques comportementales qui capturent la dynamique de la peur.

Ingénierie des Caractéristiques : La Sauce Secrète

La plupart des articles sur le trading par ML survolent les caractéristiques. C'est comme donner à quelqu'un une Ferrari sans les clés. Voici les caractéristiques exactes qui ont transformé mon taux de réussite :

1. Score de Divergence RSI Normalisé
Pas seulement le RSI — le taux de variation du RSI par rapport au mouvement des prix. En Pine Script :

rsi_val = ta.rsi(close, 14)
rsi_roc = ta.roc(rsi_val, 5)
price_roc = ta.roc(close, 5)
divergence_score = rsi_roc / math.abs(price_roc)

2. Ratio de Désalignement Volume/Prix
Mesure quand le volume explose mais le prix bouge à peine — accumulation classique :

vol_surge = volume / ta.sma(volume, 20)
price_stability = 1 / (ta.stdev(close, 5) / close)
dislocation_ratio = vol_surge * price_stability

3. Corrélation de Peur Multi-Actifs
Quand les corrélations se brisent, les retournements suivent souvent. Je suis la corrélation des actions avec le VIX, l'or et les obligations d'État.

Ce n'est pas aléatoire — chaque caractéristique est ressortie de l'analyse de milliers de trades perdants. Comme je l'ai expliqué dans mon analyse de divergence RSI, le contexte transforme l'efficacité des indicateurs.

Importance des caractéristiques SVM : Le désalignement volume/prix en tête à 28%
Importance des caractéristiques SVM : Le désalignement volume/prix en tête à 28%

Entraînement sur la Peur : Le Défi des Données

C'est là où 90% des traders ML échouent : ils s'entraînent sur toutes les conditions de marché de manière égale. C'est comme s'entraîner pour un marathon en ne faisant que du jogging. Vous avez besoin de données d'entraînement spécifiques à la peur.

Mon approche :

  1. Filtrer les données d'entraînement aux périodes VIX > 25 uniquement
  2. Suraugmenter les jours de peur extrême (VIX > 40) par 3x
  3. Inclure plusieurs régimes de peur : 2008, 2020, 2022
  4. Valider sur des périodes de peur hors échantillon

Les ajustements VaR que j'utilise aident à définir ces régimes de peur de manière programmatique. Sans un filtrage de régime approprié, votre modèle apprend les mauvais modèles.

Insight critique : Le déséquilibre des classes vous tuera. Les retournements de peur sont rares — peut-être 5% de tous les jours de trading. Les pratiques ML standard suggèrent d'équilibrer les classes. Ne le faites pas. Utilisez plutôt des poids de classe qui reflètent la réalité :

class_weights = {
  'reversal': 1.0,
  'continuation': 0.05
}

Cela empêche votre modèle de crier au loup sur chaque bougie rouge.

Vérification Réaliste du Backtest : Le Taux de Réussite de 73%

Les articles académiques aiment revendiquer une précision de 90%+. En trading réel ? C'est une autre histoire. Mon filtre SVM a atteint 73% de précision sur les appels de retournement réels — voici la répartition :

  • Vente massive du Q4 2018 : 14/19 appels corrects (73.7%)
  • COVID de mars 2020 : 22/28 corrects (78.6%)
  • Marché baissier 2022 : 47/68 corrects (69.1%)

Le modèle fonctionne mieux dans les ventes massives rapides et motivées par la peur. Les marchés baissiers prolongés réduisent la précision — l'approche d'accumulation en couches y fonctionne mieux.

Performance du filtrage SVM : Précision constante de 70-75% à travers les événements de peur
Performance du filtrage SVM : Précision constante de 70-75% à travers les événements de peur

Implémentation en Temps Réel : Du Modèle au Trading

FibAlgo
Terminal en direct FibAlgo
Accédez aux signaux de marché en temps réel, aux actualités importantes et aux analyses alimentées par l'IA pour plus de 30 marchés — le tout dans un seul terminal.
Ouvrir le terminal →

Un modèle sans exécution est de la masturbation académique. Voici comment j'intègre le filtrage SVM dans le trading en direct :

Flux de Travail Quotidien (30 minutes avant la clôture) :

  1. Exécuter le filtre sur un univers de 500 actions liquides
  2. Filtrer pour une probabilité de retournement > 0.7
  3. Classer par probabilité * amplitude de mouvement attendue
  4. Revue manuelle des 10 meilleurs candidats
  5. Taille de position basée sur la conviction et la fraction de Kelly

Couche de Gestion des Risques :

if vix > 30:
  position_size *= 0.5  # Demi-taille en peur extrême
  stop_loss = atr * 3  # Stops plus larges pour la volatilité
else:
  position_size = base_size
  stop_loss = atr * 2

Ne faites jamais aveuglément confiance au modèle. Je l'ai appris après que mon SVM ait signalé Lehman Brothers comme un "candidat fort au retournement" en septembre 2008. Certains retournements ne viennent jamais.

Application au Marché Actuel (Mars 2026)

Avec l'indice Fear & Greed à 14 et Bitcoin testant les récents plus bas, nous sommes en territoire SVM idéal. Le scan d'hier a signalé des configurations intéressantes :

  • Les géants de la tech montrant un désalignement : Volume élevé, mouvement de prix minimal
  • Les banques régionales affichant une divergence RSI : Prix faisant de nouveaux plus bas, RSI plus haut
  • Les actions de matières premières brisant les corrélations : Découplage des contrats à terme sous-jacents

Les indicateurs de dark pool confirment une accumulation institutionnelle dans plusieurs noms. Cette conjonction de signal ML + données de flux est là où l'avantage se cumule.

Rappelez-vous : le modèle identifie des candidats, pas des garanties. Dans les conditions actuelles, je suis sélectif — ne prenant que les configurations A+ où plusieurs systèmes s'alignent.

Tableau de bord du filtre SVM en direct montrant les meilleurs candidats de retournement d'aujourd'hui
Tableau de bord du filtre SVM en direct montrant les meilleurs candidats de retournement d'aujourd'hui

Techniques Avancées : Méthodes d'Ensemble

Les modèles uniques ont des points de défaillance uniques. Chez Two Sigma, nous ne tradions jamais avec des algorithmes solos. Voici mon approche d'ensemble :

  1. SVM pour le signal primaire (reconnaissance de modèles non linéaires)
  2. Forêt Aléatoire pour confirmation (famille d'algorithmes différente)
  3. LSTM pour validation de séquence (capture les modèles temporels)

Ce n'est que lorsque 2/3 modèles sont d'accord que je considère le signal valide. Cela réduit les faux positifs d'environ 40% tout en conservant la plupart des vrais signaux.

Pour ceux intéressés par l'exécution automatisée, le système d'alertes de FibAlgo peut se déclencher lorsque votre modèle ML émet des signaux de haute conviction, comblant le fossé entre l'analyse Python et l'exécution TradingView.

Le cadre de retour à la moyenne dont j'ai parlé montre des avantages d'ensemble similaires — plusieurs perspectives réduisent le risque de modèle unique.

Pièges Courants dans le Filtrage d'Actions par ML

Laissez-moi vous épargner des mois de souffrance. Ces erreurs ont tué mes premiers modèles :

Sur-ajustement à des événements spécifiques : Mon premier modèle a mémorisé les modèles du krach de 2008. Inutile en 2020. Utilisez une validation croisée k-fold avec conscience temporelle — n'entraînez jamais sur des données futures.

Fuite de caractéristiques : Inclure le volume de demain dans la prédiction d'aujourd'hui. Ça semble évident, mais les caractéristiques dérivées peuvent cacher des fuites temporelles. Demandez-vous toujours : "Pourrais-je savoir cela au moment de la prédiction ?"

Ignorer les coûts de transaction : Ce taux de réussite de 73% suppose un frottement nul. En réalité, ajoutez 10bps pour le slippage, 5bps pour les commissions. Les petits avantages s'évaporent rapidement.

Déclin du modèle : Les marchés évoluent. Mon modèle de 2018 s'est dégradé à 61% de précision d'ici 2020. Re-entraînez au minimum trimestriellement, mensuellement pendant les changements de régime.

Comme couvert dans mon guide de risque AMM, les stratégies systématiques nécessitent une surveillance et des ajustements constants.

Construire Votre Propre Système de Filtrage ML

Commencez simplement. La complexité n'est pas un avantage — une implémentation correcte est un avantage. Voici votre feuille de route :

Semaines 1-2 : Collecte et nettoyage des données. Utilisez Yahoo Finance ou Alpha Vantage pour des données gratuites. Construisez un univers d'actions liquides (capitalisation boursière 1B+$, volume quotidien 1M+).

Semaines 3-4 : Ingénierie des caractéristiques. Commencez avec mes trois caractéristiques principales ci-dessus. Ajoutez-en d'autres basées sur votre hypothèse de marché. L'article sur les adaptations OBV montre comment modifier les indicateurs pour des contextes spécifiques.

Semaines 5-6 : Entraînement et validation du modèle. Utilisez scikit-learn pour l'implémentation SVM. Concentrez-vous sur une séparation train/test appropriée — l'ordre temporel compte !

Semaines 7-8 : Backtest et paper trading. Exécutez votre filtre quotidiennement, suivez les prédictions vs les résultats. Pas d'argent réel avant 100+ trades papier.

Semaine 9+ : Implémentation en direct avec une petite taille. Commencez avec 0.25% de risque par signal. Augmentez l'échelle seulement après avoir prouvé la cohérence.

La réalité du trading par apprentissage automatique

Le ML n'est pas magique. C'est de la reconnaissance de motifs à grande échelle. Mon screener SVM ne prédit pas l'avenir — il identifie quand les conditions actuelles correspondent à des configurations historiquement rentables.

L'avantage provient de trois sources :

  1. Traiter plus de données qu'un humain ne le peut (500 actions, 6 caractéristiques chacune)
  2. Maintenir la discipline pendant la peur (les algorithmes ne paniquent pas)
  3. Une exécution cohérente (les mêmes règles chaque jour)

Mais voici le point crucial — vous avez toujours besoin d'intuition de trading. Le modèle signale les opportunités ; vous décidez du sizing de position, du timing et de la gestion du risque. Le trading purement systématique fonctionne... jusqu'à ce qu'il ne fonctionne plus. Demandez simplement aux quants qui se sont fait décimer en août 2007.

Chez Two Sigma, nos meilleures stratégies combinaient l'intelligence machine avec la supervision humaine. La machine trouve les motifs. L'humain gère le risque, surtout pendant les changements de régime où les modèles entraînés sur des données historiques deviennent temporairement aveugles.

Avec des marchés affichant des niveaux de peur extrêmes, nous sommes dans la zone idéale pour le screening de retournements basé sur le ML. Que vous construisiez votre propre système ou adaptiez le mien, souvenez-vous : le but n'est pas la perfection. C'est un avantage cohérent, correctement dimensionné, avec un risque de queue géré.

Car en fin de compte, survivre aux 27% de signaux échoués importe plus que de capturer chaque retournement. Le meilleur algorithme ne peut pas trader si vous explosez sur les valeurs aberrantes.

Workflow complet de screening d'actions par apprentissage automatique, des données à l'exécution
Workflow complet de screening d'actions par apprentissage automatique, des données à l'exécution

Questions Fréquemment Posées

1Qu'est-ce que le filtrage d'actions par apprentissage automatique ?
Utiliser des algorithmes comme les SVM pour identifier automatiquement les actions répondant à des critères spécifiques basés sur des modèles historiques.
2Quelle est la précision des SVM pour le filtrage d'actions ?
Mon modèle SVM backtesté a atteint 73 % de précision sur les inversions de marché de peur avec une ingénierie des caractéristiques appropriée.
3Quelles caractéristiques fonctionnent le mieux pour le filtrage d'actions par apprentissage automatique ?
Les ratios volume/prix, la divergence RSI et les mesures de liquidité ont surpassé les indicateurs techniques traditionnels.
4Ai-je besoin de compétences en programmation pour le filtrage par apprentissage automatique ?
Les bases de Python aident, mais des plateformes comme TradingView offrent désormais une intégration simplifiée de l'apprentissage automatique via Pine Script.
5De combien de données historiques ai-je besoin ?
Minimum 2 ans pour l'entraînement, mais 5 ans ou plus capturent plusieurs cycles de marché pour une meilleure généralisation.
FibAlgo
Trading Piloté par l'IA

Transformez le Savoir en Profit

Vous venez d'apprendre des informations précieuses sur le trading. Maintenant, mettez-les en pratique avec des signaux alimentés par l'IA qui analysent 30+ marchés en temps réel.

10,000+
Traders Actifs
24/7
Signaux en Temps Réel
30+
Marchés Couverts
Aucune carte de crédit requise. Accès gratuit au terminal de marché en direct.

Continuer la lecture

Voir tout →
Les Bilans des Banques Centrales Cachent des Fenêtres d'Arbitrage de 20-50 Pipscentral bank trading

Les Bilans des Banques Centrales Cachent des Fenêtres d'Arbitrage de 20-50 Pips

📖 9 min
Les Schémas de Manipulation des Market Makers M'ont Transformé de Chasseur en Proiemarket maker manipulation

Les Schémas de Manipulation des Market Makers M'ont Transformé de Chasseur en Proie

📖 11 min
Les Options Synthétiques Surpassent Toujours la Décroissance de la Primeoptions trading

Les Options Synthétiques Surpassent Toujours la Décroissance de la Prime

📖 7 min