Le marché des vector databases s’est consolidé en 2026 autour de cinq acteurs : Pinecone, Qdrant, Weaviate, Milvus et pgvector (Postgres). Chacun a ses forces et ses pièges. Choisir le bon dépend de votre volume (1 M ou 1 Md de vecteurs ?), votre budget, et votre stack existante. Ce comparatif teste les cinq sur RAG production avec 50 M d’embeddings et donne les chiffres réels.
Critères de comparaison
- Performance recherche (p95 latency à 50 M de vecteurs)
- Filtrage hybride (vecteur + metadata)
- Scalabilité horizontale
- Modèle de pricing (managed vs self-hosted)
- Maturité écosystème (intégrations, libs)
- Conformité (RGPD, hébergement EU)
1. Pinecone — le leader managé
- Type : 100% managé cloud (AWS, GCP, Azure)
- Forces : zéro ops, intégrations partout (LangChain, LlamaIndex), latence excellente
- Faiblesses : verrouillage, coût qui explose au-delà de 10 M vecteurs
- Prix 2026 : 70-200 €/mois pour 1 M vecteurs, 800-2500 €/mois à 10 M
- Verdict : idéal pour démarrer vite, à reconsidérer en passage à l’échelle
2. Qdrant — la montée en puissance
- Type : open-source + cloud managé
- Forces : performance brute (Rust), filtrage avancé, hybrid search natif
- Faiblesses : moins de tutoriels que Pinecone, mais l’écart se réduit
- Prix 2026 : Qdrant Cloud à partir de 25 €/mois, gratuit en self-host
- Verdict : meilleur rapport qualité/prix en 2026, choix par défaut pour PME
3. Weaviate — le polyvalent multimodal
- Type : open-source + cloud
- Forces : multimodal natif (images, audio), modules d’embedding intégrés
- Faiblesses : courbe d’apprentissage plus raide, verbosité GraphQL
- Prix 2026 : 30 €/mois minimum cloud, gratuit self-hosted
- Verdict : excellent pour cas d’usage multimodaux complexes
4. Milvus — le scale extrême
- Type : open-source distribué
- Forces : conçu pour milliards de vecteurs, sharding automatique
- Faiblesses : ops lourdes, overkill pour <100 M vecteurs
- Prix 2026 : Zilliz Cloud à partir de 100 €/mois, self-host gratuit
- Verdict : à choisir uniquement si vous dépassez 500 M vecteurs
5. pgvector — Postgres qui fait tout
- Type : extension Postgres
- Forces : aucune nouvelle infra, transactions ACID, jointures SQL
- Faiblesses : performance limitée au-delà de 10 M vecteurs sans optimisation
- Prix 2026 : coût de votre Postgres existant
- Verdict : choix gagnant si vous avez déjà Postgres et < 5 M vecteurs
Benchmark performance (50 M vecteurs, 1536 dims)
- Pinecone p95 : 25 ms
- Qdrant p95 : 18 ms
- Weaviate p95 : 32 ms
- Milvus p95 : 22 ms (optimisé)
- pgvector p95 : 80-150 ms (sans IVF tuning), 35 ms avec
Quel choisir selon votre cas
- MVP / prototype : pgvector si Postgres déjà en place, sinon Qdrant Cloud
- Startup / PME (< 50 M vecteurs) : Qdrant
- Multimodal : Weaviate
- Volume géant (> 500 M) : Milvus auto-hébergé
- Zéro ops, budget illimité : Pinecone
- RGPD strict : Qdrant ou Weaviate self-hosted en France
Pièges fréquents
- Choisir Pinecone par défaut : facture x10 à scale
- Sous-dimensionner les embeddings (768 vs 1536 change tout)
- Oublier le reranker (Cohere ou Voyage) : -25% de précision sans
- Filtrer mal (post-filter au lieu de pre-filter) : latence x3
- Ne pas indexer correctement (HNSW params M et efConstruction)
Setup minimal Qdrant en 5 minutes
- docker run -p 6333:6333 qdrant/qdrant
- Python : pip install qdrant-client
- Créer collection avec dim=1536, distance=Cosine
- Insérer vecteurs en batch de 100
- Recherche : client.search(collection_name, query_vector, limit=10)
❓ Questions fréquentes
Faut-il toujours un vector DB pour un RAG ?
Non si vous avez moins de 10 000 documents : un index FAISS en mémoire ou même un calcul cosine direct suffit. Au-delà, un vector DB devient nécessaire.
Quelle dimension d’embedding utiliser ?
1536 (text-embedding-3-large) ou 1024 (Voyage v3, Cohere v3) en 2026. 768 est trop court pour les cas exigeants. 3072+ apporte peu de gain pour beaucoup de coût stockage.
Combien coûte un RAG production avec 1 M de docs ?
Embeddings (one-shot) : 100-500 € selon modèle. Stockage Qdrant Cloud : 50-150 €/mois. Inférence LLM : variable selon trafic. Total : 200-800 €/mois pour usage modéré.
Self-host ou managed ?
Self-host si vous avez une équipe DevOps et 10 M+ vecteurs (économies réelles). Managed sinon, le temps gagné vaut largement la différence de prix.
Conclusion
En 2026, Qdrant est devenu le choix par défaut pour la majorité des projets RAG : open-source, performant, prix raisonnable, écosystème mature. Pinecone reste pertinent pour zéro-ops absolu, pgvector pour l’intégration Postgres simple. Évitez Milvus sauf scale extrême.