DeepSeek : l’IA chinoise qui a « bouleversé » le game et fait paniquer la Silicon Valley

Vous est-il déjà arrivé de regarder un film de science-fiction et de vous dire que pour créer une intelligence artificielle digne de ce nom, il fallait forcément des milliards de dollars, des laboratoires futuristes dignes d’un James Bond et une armée d’ingénieurs ? Pendant longtemps, c’était un peu l’idée reçue. Pour rivaliser avec les géants, il fallait une force de frappe colossale. Et puis, début 2025, un acteur inattendu est entré en scène avec la subtilité d’un T-Rex dans une bibliothèque : DeepSeek.

Cette IA, venue de Chine, n’a pas seulement proposé une alternative ; elle a remis en question les fondements mêmes de la course à l’IA. En démontrant qu’on pouvait atteindre des performances de pointe avec une fraction des coûts et des ressources, elle a provoqué une véritable onde de choc. Dans cet article, nous allons décortiquer le phénomène DeepSeek. Nous plongerons dans son histoire rocambolesque, nous soulèverons le capot pour comprendre sa mécanique interne, et nous verrons comment cette IA redéfinit les règles du jeu. Attachez vos ceintures, le voyage s’annonce passionnant.

La carte d’identité de DeepSeek

Voici les informations essentielles pour faire connaissance avec notre IA du jour.

  • Nom : DeepSeek | 深度求索
  • Créateur : Liang Wenfeng, co-fondateur du fonds spéculatif High-Flyer.
  • Date de lancement :
    • Fondation de l’entreprise : Mai / Juillet 2023.
    • Premier modèle : Novembre 2023.
    • Lancement de l’application chatbot aux États-Unis : Janvier 2025.
  • Type d’IA : Spécialiste des grands modèles de langage (LLMs) et des modèles multimodaux (vision, code, etc.).
  • Modèle de tarification : L’assistant IA grand public est gratuit. Les modèles plus spécialisés sont en open source ou accessibles via une API payante, mais à des tarifs très compétitifs (ex: DeepSeek-R1 à 0,55$ par million de tokens en entrée).
  • Langues supportées : Non spécifié pour le chatbot, mais les modèles pour le code comme DeepSeek-Coder-V2 supportent jusqu’à 338 langages de programmation.
  • Plateformes : Application mobile (iOS, Android), interface web et API pour les développeurs.

En bref, un nouveau venu qui a débarqué sans crier gare et qui s’est très vite fait un nom. Vous ne trouvez pas que ça a le goût de l’aventure ?

Kitcreanet deepseek
Deepseek ai – Image créée par ChatGPT

Il était une fois… L’histoire de DeepSeek

L’épopée de DeepSeek n’est pas celle d’une startup classique née dans un garage (j’ai déjà utilisé cette phrase et cette image pour débuter un de mes articles non ?, je radote, c’est moche de vieillir…) C’est une histoire de vision, de contraintes transformées en force et d’une audace qui a pris tout le monde de court.

Tout commence avec Liang Wenfeng, un nom à retenir. Co-fondateur de High-Flyer, un fonds spéculatif quantitatif, Liang n’est pas un novice en matière de calcul intensif. Pendant des années, son fonds a amassé des cartes graphiques (GPU) et bâti des supercalculateurs pour décrypter les marchés financiers. Nous sommes en 2023, l’IA générative est sur toutes les lèvres et Liang sent qu’il se passe quelque chose d’énorme.

Mais au lieu de simplement investir dans des startups existantes, il prend une décision radicale. Il réoriente les immenses ressources de calcul de High-Flyer pour créer sa propre entité : DeepSeek AI. Son objectif ? Ne pas seulement suivre la vague, mais construire ses propres modèles de pointe, avec en ligne de mire le Graal de l’Intelligence Artificielle Générale (AGI). Lorsqu’on l’interroge sur ses motivations, sa réponse est déconcertante : « Je ne serais pas capable de trouver une raison commerciale. […] La recherche scientifique fondamentale a un très faible retour sur investissement« . Il compare sa démarche à celle des premiers investisseurs d’OpenAI, mus par la pure curiosité scientifique et le désir de « faire cette chose« .

Un défi de taille se dresse pourtant sur sa route : la « guerre froide technologique » entre les États-Unis et la Chine. Washington impose des restrictions sévères sur l’exportation des puces IA les plus puissantes, notamment celles de Nvidia1. Coupé de l’approvisionnement en « cerveaux » de silicium de pointe, le projet semblait compromis. C’était sans compter sur l’anticipation de Liang, qui aurait stocké environ 50 000 puces Nvidia A100 juste avant l’interdiction.

Kitcreanet guerre froide chine usa
Des restrictions qui ont failli plomber le développement de Deepseek… – Image ChatGPT

Mais le vrai coup de génie de DeepSeek n’est pas matériel, il est logiciel. Contrainte de faire mieux avec moins, l’équipe se concentre sur une obsession : l’optimisation. Plutôt que de suivre la course à la puissance brute, elle repense l’architecture même des modèles d’IA pour les rendre incroyablement plus efficaces.

Le résultat est fulgurant. En novembre 2023, un premier modèle voit le jour. Mais le coup de tonnerre mondial a lieu en janvier 2025. DeepSeek lance son application de chatbot aux États-Unis et en quelques jours, elle se hisse au sommet des applications gratuites, détrônant même ChatGPT. Peu après, ils publient leur modèle de raisonnement DeepSeek-R1, dont les performances rivalisent avec les meilleurs du monde, mais pour un coût de développement estimé à moins de 6 millions de dollars, contre des centaines de millions pour ses concurrents.

L’onde de choc est immédiate. Le 27 janvier 2025, les marchés financiers paniquent. L’idée qu’une entreprise chinoise, avec des ressources supposément inférieures, puisse produire une IA si performante et si peu chère bouleverse le monde de l’IA. L’action de Nvidia, le titan des puces IA, dévisse, perdant 600 milliards de dollars de valorisation en un temps record. L’histoire de DeepSeek devient le symbole inattendu qu’une contrainte peut être le plus puissant des moteurs d’innovation — Merci Donald !

Le logo de Deepseek

Il représente une baleine bleue (ou possiblement une orque) et il est devenu emblématique de cette entreprise d’intelligence artificielle chinoise qui a rapidement gagné en popularité. Cette représentation visuelle n’est pas le fruit du hasard, mais un choix délibéré porteur de symbolisme profond.

La symbolique de la baleine – Profondeur et intelligence

La baleine, créature majestueuse et grande exploratrice des profondeurs océaniques, symbolise parfaitement la mission de DeepSeek qui est d’explorer les territoires inexplorés de l’intelligence artificielle. Le nom même de l’entreprise, « DeepSeek » (recherche profonde), fait écho à cette idée de plonger dans les profondeurs de la connaissance.

Les baleines sont reconnues pour leur intelligence exceptionnelle et leur capacité à communiquer de manière complexe sur de longues distances, ce qui reflète parfaitement l’ampleur et l’intégration que DeepSeek vise dans le traitement et l’analyse des informations.

Force et fiabilité

Tout comme les baleines sont des créatures puissantes dans l’océan, cette imagerie suggère la confiance et la robustesse, des qualités essentielles pour une entreprise d’intelligence artificielle. La baleine représente également la sagesse, la puissance et la prospérité dans de nombreuses cultures.

Approchabilité et différenciation

Contrairement aux logos d’autres entreprises d’IA qui adoptent souvent des designs abstraits, minimalistes ou robotiques, DeepSeek a choisi une baleine amicale et accessible. Ce choix crée une connexion émotionnelle plus forte avec les utilisateurs et humanise l’intelligence artificielle, souvent perçue comme froide ou intimidante.

Une stratégie de marque distinctive – Contraste avec la concurrence

Le logo de DeepSeek se démarque nettement des tendances dominantes dans l’industrie de l’IA, qui privilégient des esthétiques abstraites et de plus en plus rigides, inspirées par la technologie. En s’écartant de ces tendances, DeepSeek offre aux consommateurs un nouveau point de vue sur la façon dont une entreprise d’IA pourrait se représenter.

Couleur bleue significative

Le choix du bleu vif n’est pas anodin. Cette couleur symbolise la confiance, l’innovation et l’accessibilité, offrant un sentiment de calme et de sécurité dans un domaine souvent associé à des changements rapides et à la complexité.

Orque ou baleine bleue ?

Il existe un débat sur la nature exacte de l’animal représenté dans le logo. Certains affirment qu’il s’agit d’une orque (aussi connue sous le nom de « baleine tueuse »), membre de la famille des dauphins.

Des indices comme la nageoire située près de la tête et les marques blanches sur le ventre et autour des yeux suggèrent qu’il pourrait effectivement s’agir d’une orque. Cette interprétation ajoute une dimension supplémentaire au symbolisme, car les orques sont connues pour leur adaptabilité, leur travail d’équipe et leur position dominante dans l’écosystème marin.

Une autre interprétation : la lettre « d »

Une explication alternative suggère que le logo de DeepSeek est en réalité une lettre « d » minuscule, représentant l’image de marque centrale de l’entreprise. L’inspiration du design viendrait de l’océan, symbolisant l’esprit d’exploration de territoires inexplorés de DeepSeek et son engagement à faire de l’AGI (Intelligence Artificielle Générale) une réalité.

Un logo qui fair parler de lui !

Que ce soit une baleine, une orque ou une représentation stylisée de la lettre « d », le logo de DeepSeek incarne des valeurs d’intelligence, de profondeur, d’exploration et de connectivité. Ce choix de design s’écarte délibérément des tendances dominantes dans l’industrie de l’IA pour créer une identité de marque plus chaleureuse, accessible et mémorable. Dans un secteur où les logos tendent vers l’abstraction et la froideur technologique, la baleine bleue de DeepSeek représente une approche rafraîchissante qui évoque l’imagination et l’inconnu plutôt que l’omniprésence ou la domination. C’est un choix stratégique qui positionne l’entreprise comme différente et potentiellement plus accessible que ses concurrents occidentaux et …. qui à lui seul a fait couler beaucoup d’encre… Malin !

Alors, Deepseek, comment ça marche ?

Maintenant que nous connaissons son histoire, la question brûle les lèvres : mais comment font-ils ? Quel est le secret de DeepSeek pour produire des résultats de premier plan sans se ruiner ? Pour le comprendre, oublions un instant le code et les algorithmes, et utilisons une analogie.

Niveau 1 – Vue d’ensemble : Le motoriste de génie

Imaginez l’intelligence artificielle comme un moteur de voiture de course. Pendant des années, la compétition a suivi une règle simple : pour plus de puissance, il faut un plus gros moteur. Plus de cylindres, plus de litres, plus de consommation. C’est l’approche de la force brute.

DeepSeek, c’est un peu le motoriste de génie qui arrive dans le paddock et dit : « Et si, au lieu d’un V12 glouton, on concevait un V6 ultra-optimisé, plus léger, plus sobre, mais tout aussi puissant ?« . C’est exactement ça, la philosophie de DeepSeek. L’entreprise ne cherche pas à construire le plus gros « cerveau » possible (le plus grand nombre de paramètres, dans le jargon), mais le plus efficace.

Lorsque vous envoyez une requête à DeepSeek, vous ne réveillez pas une immense machine monolithique. Vous activez un système intelligent qui va mobiliser uniquement les ressources nécessaires pour votre tâche précise, de la manière la plus efficiente qui soit. C’est une approche qui privilégie l’ingéniosité logicielle à la puissance matérielle brute. Le résultat ? Une expérience utilisateur fluide et rapide, mais des coûts d’opération (l’inférence) et de fabrication (l’entraînement) drastiquement réduits.

Niveau 2 – Sous le capot : Les secrets de l’efficacité

Si on ouvre le capot de ce moteur révolutionnaire, on trouve deux ou trois innovations techniques clés. Pas de panique, c’est très simple à comprendre avec des comparaisons du quotidien.

  1. L’Architecture MoE (Mixture-of-Experts) : L’équipe de spécialistes Les IA traditionnelles sont comme un médecin généraliste omniscient, qui doit tout savoir sur tout. C’est lourd et pas toujours efficace. DeepSeek utilise une approche MoE, ce qui signifie « Mélange d’Experts ».
    • Comment ça marche ? Imaginez que le modèle n’est pas un seul grand cerveau, mais une équipe d’experts : un spécialiste du code, un expert en poésie, un mathématicien, un traducteur, etc. Quand votre question arrive (« Écris-moi un poème en Python sur la relativité« ), un « manager » intelligent (le routeur) ne dérange pas toute l’équipe. Il dirige la question vers les 2 ou 3 experts les plus pertinents (ici, le poète et le codeur).
    • L’avantage ? C’est beaucoup plus rapide et économe en énergie. Au lieu d’activer des centaines de milliards de « neurones » (paramètres) pour chaque tâche, DeepSeek n’en active qu’une petite fraction, les plus utiles. Par exemple, son modèle DeepSeek-V2 active seulement 21 milliards de ses 236 milliards de paramètres pour une tâche donnée.
  2. Multi-Head Latent Attention (MLA) : Le secrétaire ultra-efficace Pour qu’une IA puisse tenir une conversation, elle doit se souvenir de ce qui a été dit avant. Cette « mémoire à court terme » s’appelle le Cache KV (Key-Value). Plus la conversation est longue, plus ce cache devient énorme et ralentit la machine. C’est comme garder toutes vos notes de réunion en vrac sur votre bureau.
    • Comment ça marche ? L’architecture MLA, intégrée dans les modèles récents comme DeepSeek-V2 et V3, agit comme un secrétaire de génie. Au lieu de garder toutes les notes, il les lit et en fait un résumé ultra-compressé, un « vecteur latent ».
    • L’avantage ? Cette technique réduit la taille de la « mémoire » nécessaire de plus de 93% ! Cela permet à l’IA de gérer des conversations beaucoup plus longues et de générer des réponses bien plus rapidement, sans faire surchauffer le moteur.

Grâce à ces innovations, DeepSeek a prouvé qu’en matière d’IA, la taille ne fait pas tout. L’intelligence de la conception peut surpasser la simple accumulation de ressources.

Concurrence et positionnement : Le challenger face au champion

DeepSeek n’est pas arrivé dans une arène vide. Il a directement défié le champion en titre, OpenAI, créateur de ChatGPT, ainsi que d’autres géants comme Google et Meta. Mais sa stratégie est radicalement différente.

CaractéristiqueOpenAI (le Champion)DeepSeek (le Challenger)
PhilosophieCapacités larges, modèles fermés et puissants (GPT-4o) Modèles ultra-efficaces, approche « open source »
Modèles PharesGPT-4o, o1 DeepSeek-V3, DeepSeek-R1
Coût de Dev.Estimé à >100M$ pour GPT-4 ~6M$ pour DeepSeek-V3
Tarification APIPremium
(ex: o1 à 15$/M tokens input)
Très agressive
(ex: R1 à 0.55$/M tokens input)
Atout principalImage de marque, avance historiqueEfficacité coût/performance, ouverture

Ce qui différencie fondamentalement DeepSeek, ce n’est pas seulement de faire aussi bien, mais de le faire différemment.

  1. La révolution du coût : En entraînant des modèles de classe mondiale pour une fraction du prix, DeepSeek rend la technologie accessible à plus de monde et remet en question le modèle économique dominant.
  2. L’ouverture comme force : En publiant beaucoup de ses modèles en « open weight » (poids des paramètres ouverts) ou open source, DeepSeek encourage la collaboration et l’innovation au sein de la communauté mondiale, accélérant les progrès pour tous.
  3. L’efficacité comme dogme : L’entreprise a prouvé qu’elle pouvait obtenir des résultats similaires à ses concurrents en utilisant environ un dixième de la puissance de calcul.

DeepSeek ne se positionne pas comme un simple clone, mais comme une alternative philosophique : l’IA intelligente et frugale face à l’IA puissante et coûteuse.

Points forts et cas d’usage

Au-delà de la technique, que peut-on faire avec DeepSeek ? Ses points forts découlent directement de sa philosophie :

  • Efficacité Révolutionnaire : Des performances de pointe pour des coûts d’entraînement et d’utilisation radicalement inférieurs.
  • Performance Élevée : Les modèles rivalisent ou surpassent les meilleurs du marché sur des tâches de raisonnement, de langage et de code.
  • Accessibilité : L’approche open source et les prix bas des API démocratisent l’accès à une IA de haute volée.
  • Spécialisation : Une gamme de modèles dédiés à des tâches spécifiques (code, vision, mathématiques), ce qui les rend très performants dans leur domaine.

Voici quelques cas d’usage concrets pour vous lancer :

1. Brainstorming créatif avec l’assistant généraliste

  • Difficulté : Débutant
  • Objectif : Générer des idées originales rapidement.
  • Pas-à-pas :
    1. Ouvrez l’application DeepSeek – AI Assistant.Envoyez un prompt simple et ouvert. Par exemple : « Donne-moi 5 concepts de slogans publicitaires pour une nouvelle marque de café éco-responsable qui cible les jeunes urbains. Adopte un ton décalé et inspirant.« Affinez les résultats en discutant avec l’IA : « J’aime bien le 3ème, peux-tu le développer en 3 variations plus courtes ?« 
Kitcreanet 1jour1ia deepseek01
La fenêtre de Chat de DeepSeek

2. Optimiser un script avec DeepSeek-Coder

  • Difficulté : Intermédiaire
  • Prérequis : Avoir des notions de base en programmation (ex: Python).
  • Objectif : Rendre un code plus propre et plus efficace.
  • Pas-à-pas : Accédez à un service utilisant l’API de DeepSeek-Coder ou à une interface de test. Préparez votre prompt en incluant votre morceau de code. Par exemple : « Voici une fonction Python qui est lente. Peux-tu la refactoriser pour la rendre plus performante et plus lisible ? Ajoute des commentaires pour expliquer tes changements. »

Analysez le code optimisé proposé par l’IA et intégrez-le dans votre projet. Le modèle a des performances comparables à GPT-4 Turbo pour ce genre de tâches.

3. Analyser un document visuel avec DeepSeek-VL

  • Difficulté : Intermédiaire / Avancé
  • Objectif : Extraire des informations textuelles d’une image ou d’un PDF.
  • Pas-à-pas :
    1. Utilisez une interface compatible avec DeepSeek-VL (Vision-Language) — ça fonctionne directement dans le Chat standard.
    2. Uploadez une image, comme un graphique financier ou une capture d’écran d’un site web. Dans mon exemple j’ai pris un scan d’une page d’un rapport financier publique d’une société française.
    3. Posez une question précise sur l’image : « Qui possède un plan de motivation à long terme dans cette image ?« 
    4. L’IA va « lire » l’image et vous fournir une analyse textuelle basée sur les données visuelles.
Kitcreanet 1jour1ia deepseek02
J’ai donné une page d’un rapport au format image .jpeg, et j’ai posé cette question.

Limites, risques et points faibles

Toute médaille a son revers et malgré son ascension fulgurante, DeepSeek n’est pas exempt de limites. Il est important (comme toujours avec les IA) de garder un regard critique et nuancé.

  • Transparence des données : C’est le grand point d’interrogation. Bien que les modèles soient ouverts, la composition exacte des données d’entraînement (les 14,8 billions de « tokens » pour DeepSeek-V3, par exemple) reste floue. D’où viennent ces données ? Comment ont-elles été filtrées ? Cela pose des questions sur les biais potentiels (culturels, idéologiques) que le modèle pourrait reproduire.
  • Les conditions du « Open Weight » : Le terme « open weight » ou « open source » peut être ambigu. Les licences, bien que permissives, peuvent contenir des conditions d’utilisation spécifiques qui diffèrent des standards habituels du logiciel libre et qui ne sont pas toujours explicitées en détail.
  • Dépendance matérielle initiale : Le succès initial de DeepSeek a été rendu possible par un stock de puces Nvidia acquis avant les sanctions. La stratégie à long terme pour sécuriser son infrastructure matérielle face aux restrictions géopolitiques persistantes reste un défi majeur.
  • Jeunesse et pérennité : Fondée en 2023, DeepSeek est une entreprise très jeune. Face à des géants comme Google ou Microsoft qui ont des décennies d’existence et des revenus colossaux, sa capacité à maintenir son rythme d’innovation et sa stabilité financière sur le long terme est une question légitime.

Il est donc important de voir DeepSeek non pas comme une solution parfaite, mais comme une proposition audacieuse avec ses propres zones d’ombre.

Conclusion

Alors, que retenir de l’ouragan DeepSeek ? Plus qu’un simple concurrent d’OpenAI, DeepSeek est un disrupteur philosophique. Il est la preuve vivante qu’il existe une autre voie dans le développement de l’intelligence artificielle : une voie basée sur l’ingéniosité, l’optimisation et l’efficacité, plutôt que sur la seule puissance brute et des budgets illimités.

En forçant l’industrie à repenser le rapport coût/performance, DeepSeek a non seulement démocratisé l’accès à une IA de pointe, mais il a aussi potentiellement changé les règles de la compétition pour les années à venir. Son histoire est une belle leçon de stratégie où la contrainte est devenue le plus grand des avantages. Reste à voir si ce « David » de l’IA pourra continuer à innover et à tenir tête aux « Goliaths » sur le long terme.

La question qu’il nous laisse est profonde : l’avenir de l’IA appartient-il aux mastodontes aux ressources infinies, ou à ceux qui sauront, comme DeepSeek, faire preuve de plus d’intelligence dans la conception même de l’intelligence ?

Continuons la discussion !

  • Votre avis m’intéresse : Avez-vous déjà testé DeepSeek ou l’un de ses modèles spécialisés ? Avez-vous été surpris par la qualité de ses réponses ou de son code ? Partagez votre expérience dans les commentaires !
  • Le défi de la semaine : Prenez un prompt de raisonnement un peu complexe (un problème de logique ou un casse-tête mathématique) et soumettez-le à la fois à DeepSeek et à un autre chatbot que vous utilisez. Comparez la clarté, la logique et l’exactitude des réponses. Lequel s’en sort le mieux ?

Pour approfondir le sujet DeepSeek :

  1. Site Officiel : https://www.deepseek.com – Pour tester leurs outils et suivre les annonces.
  2. Rapport Technique de DeepSeek-V3 (arXiv) : https://arxiv.org/abs/2412.19437 – Pour les plus courageux qui veulent plonger dans les détails techniques.
  3. Dépôt GitHub de DeepSeek-V3 : https://github.com/deepseek-ai/DeepSeek-V3 – Pour explorer le code et les modèles open source.

Timeline des dates clés

  • Mai/Juillet 2023 : Fondation de DeepSeek par Liang Wenfeng.
  • Novembre 2023 : Lancement du tout premier modèle de l’entreprise.
  • 10 Janvier 2025 : Lancement de l’application grand public « DeepSeek – AI Assistant » aux États-Unis.
  • 20 Janvier 2025 : Lancement du modèle de raisonnement DeepSeek-R1 en open source, qui fait grand bruit.
  • Fin Janvier 2025 : L’application devient n°1 sur l’App Store US, et le succès de l’entreprise provoque une chute des cours des géants technologiques américains.
  • Juin 2024 / Juin 2025 : Annonces successives de modèles spécialisés très performants comme DeepSeek-Coder-V2 et mises à jour de l’écosystème.

Notes de bas de page

  1. NVIDIA est une entreprise technologique spécialisée dans la conception de processeurs graphiques (GPU) utilisés dans le gaming, la conception professionnelle, les centres de données et l’intelligence artificielle. https://www.nvidia.com/fr-fr/ ↩︎

Vous pouvez retrouver tous les termes techniques de cet article dans le glossaire disponible ici.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *