Comment fonctionne PlagiGuard
Nous croyons en la transparence totale. Voici le détail de notre architecture technique, des services utilisés et de notre politique de traitement des données.
Flux de traitement d'un document
Soumission
L'utilisateur télécharge son document (PDF, DOCX, ODT, RTF, TXT) ou colle son texte directement.
Extraction
Le texte est extrait du fichier côté serveur via des bibliothèques spécialisées (PhpWord, PdfParser). Aucun service externe n'est utilisé pour cette étape.
Analyse
Le texte est envoyé à notre moteur d'analyse pour la détection de plagiat et/ou de contenu IA. Les documents volumineux sont automatiquement découpés en segments pour une analyse complète.
Rapport
Un rapport PDF est généré côté serveur avec les scores, les sources détectées et les recommandations. Le rapport est stocké sur nos serveurs.
Moteur d'analyse
Détection de plagiat
- Comparaison avec des milliards de pages web indexées
- Détection des correspondances identiques et similaires (paraphrase)
- Liste des sources correspondantes avec URLs et extraits
- Score de similarité global (0-100%)
Détection IA
- Modèles de détection entraînés sur GPT-4, Claude, Gemini, etc.
- Analyse phrase par phrase avec score de confiance
- Score de lisibilité (readability)
- Détection d'attaques d'obfuscation (tentatives de contournement)
Données retournées par l'analyse
Stack technique
Backend
- PHP 8.4 + Symfony 8.0
- Doctrine ORM (MySQL)
- Symfony Messenger (traitement asynchrone)
Traitement de documents
- PhpOffice/PhpWord (DOCX, ODT, RTF)
- Smalot/PdfParser (PDF)
- DomPDF (génération de rapports PDF)
Services externes
- Moteur de détection (plagiat & IA)
- Passerelle de paiement sécurisée
Traitement et sécurité des données
Ce que nous stockons
- Le texte soumis (pour permettre la consultation ultérieure)
- Les résultats d'analyse (scores, sources, payload complet)
- Le rapport PDF généré
- Les métadonnées (date, type d'analyse, nombre de mots)
Mesures de sécurité
- Isolation des données par université (architecture multi-tenant)
- Contrôle d'accès par rôle (RBAC) sur chaque endpoint
- Protection CSRF sur tous les formulaires
- Journalisation complète des requêtes API (audit trail)
FAQ — Questions fréquentes
Comment fonctionne le moteur d'analyse ?
La détection de plagiat et de contenu IA nécessite des modèles de machine learning entraînés sur des milliards de documents. PlagiGuard s'appuie sur un moteur d'analyse performant capable de détecter le plagiat et le contenu généré par IA dans un seul processus.
Les documents sont-ils conservés après analyse ?
Le moteur d'analyse traite les textes en temps réel et ne conserve pas les documents après traitement. Les résultats d'analyse sont stockés uniquement sur les serveurs PlagiGuard, sous le contrôle de l'institution.
Y a-t-il une limite de mots par document ?
Il n'y a pas de limite technique fixe. Le système découpe automatiquement les documents volumineux en segments et les analyse individuellement, puis les résultats sont agrégés. Les limites effectives dépendent des crédits configurés par l'administrateur de votre université.
L'architecture est-elle modulaire ?
L'architecture de PlagiGuard est modulaire. Le service d'analyse est découplé du reste de l'application, ce qui permet une évolution flexible sans modifier la logique métier.
Des questions techniques ?
Nous sommes disponibles pour répondre à toutes vos questions concernant l'architecture, la sécurité et le traitement des données.