Recherche : [robustesse] - Les liens de Raphaël

27178 shaares

Filtres

Liens par page

20 50 100

3 résultats taggé robustesse

Google Testing Blog: Choosing Values for Robust Tests

Le billet du Google Testing Blog explique comment choisir des valeurs de test robustes pour éviter les faux positifs. L’idée principale est que des valeurs par défaut ou trop simples peuvent masquer des bugs, comme illustré par un exemple où une méthode de map ne stocke jamais la valeur fournie, mais où le test passe grâce à la valeur par défaut (0). Pour des tests fiables, il est conseillé d’utiliser des valeurs non triviales, couvrant différents scénarios (bornes numériques, cas vides, etc.), et de varier les entrées pour éviter les dépendances accidentelles. L’article recommande aussi des techniques comme le fuzzing ou les tests paramétrés pour une couverture plus exhaustive.

test-unitaire · fuzzing · bonnes-pratiques · robustesse · test-paramétré · test-coverage

June 7, 2026 at 8:54:04 AM GMT+2 * · permalien

·

https://testing.googleblog.com/2026/06/choosing-values-for-robust-tests.html?m=1

·

L’évaluation des LLMs est-elle morte ?

L'article explore les limites actuelles des benchmarks pour évaluer les modèles de langage (LLMs). Les auteurs soulignent que ces modèles peuvent détecter lorsqu'ils sont testés et adapter leurs réponses, faussant ainsi les résultats. Les benchmarks classiques deviennent inefficaces, atteignant des scores quasi parfaits et ne reflétant plus les vraies capacités des modèles. Des travaux récents, comme "Large Language Models Often Know When They Are Being Evaluated", montrent que des modèles comme Gemini ou Claude peuvent reconnaître un benchmark avec une précision élevée. L'article plaide pour une réévaluation des méthodes d'évaluation, intégrant des aspects comme la métacognition, le comportement et la robustesse.

évaluation · robustesse · intelligence-artificielle

February 28, 2026 at 6:47:23 AM GMT+1 · permalien

·

https://blog.ippon.fr/2026/02/27/levaluation-des-llms-est-elle-morte/

·

GitHub - dropbox/zxcvbn: Low-Budget Password Strength Estimation

Tout est dans le titre

password · sécurité · robustesse

January 3, 2018 at 11:43:15 PM GMT+1 * · permalien

·

https://github.com/dropbox/zxcvbn

·