Disponible · Remote
Évaluateur IA & Spécialiste Red-Team · QA Conversationnel
12 ans d'audit qualité, appliqués aux systèmes d'IA. Bilingue FR/EN.
Professionnel de l'assurance qualité avec plus de 12 ans d'expérience à évaluer des comportements d'agents, concevoir des rubriques et encadrer la performance — aujourd'hui appliqués aux systèmes d'IA. Expérimenté dans l'identification de modes d'échec, d'incohérences dans les sorties et de lacunes de politique dans des environnements complexes et à fort volume. Praticien des outils d'IA générative (Claude, Gemini, Google AI Studio, Claude Code), des concepts de red-teaming, du prompt engineering et de l'infrastructure LLM auto-hébergée. Bilingue FR/EN, rigoureux par nature, motivé à rendre les systèmes d'IA plus sûrs et fiables.
Application web Flask pour évaluer des conversations de chatbot IA contre une grille qualité structurée de 15 critères. Système de score pondéré sur 100, règle d'échec automatique pour la sécurité, export CSV et rapport HTML. Interface bilingue FR/EN.
Application full-stack de gestion de campagnes de jeu de rôle sur table. Navigateur d'aventures, bestiaire, gestionnaire de PNJ et de rencontres, cartes interactives. Stack React + TypeScript + Node.js + PostgreSQL.
Bientôt disponible
Ouvert aux opportunités remote et contractuelles. Disponible immédiatement.