Comment évaluer les performances du code Python avec pytest-benchmark
Everett Pompeii
Qu’est-ce que le Benchmarking ?
Le benchmarking est la pratique consistant à tester les performances de votre code pour voir à quelle vitesse (latence) ou combien (débit) de travail il peut effectuer. Cette étape souvent négligée dans le développement logiciel est cruciale pour créer et maintenir un code rapide et performant. Le benchmarking fournit les métriques nécessaires aux développeurs pour comprendre comment leur code se comporte sous diverses charges de travail et conditions. Pour les mêmes raisons que vous écrivez des tests unitaires et d’intégration pour éviter les régressions de fonctionnalités, vous devriez écrire des benchmarks pour éviter les régressions de performances. Les bugs de performance sont des bugs !
Écrire FizzBuzz en Python
Pour écrire des benchmarks, nous avons besoin de code source à évaluer. Pour commencer, nous allons écrire un programme très simple, FizzBuzz.
Les règles pour FizzBuzz sont les suivantes :
Écrivez un programme qui imprime les entiers de
1
à100
(inclus) :
- Pour les multiples de trois, imprimez
Fizz
- Pour les multiples de cinq, imprimez
Buzz
- Pour les multiples de trois et de cinq, imprimez
FizzBuzz
- Pour tous les autres, imprimez le numéro
Il existe de nombreuses façons d’écrire FizzBuzz. Nous allons donc choisir ma préférée :
- Itérer de
1
à100
, en utilisant une plage de101
. - Pour chaque nombre, calculer le module (reste après division) pour
3
et5
. - Si le reste est
0
, alors le nombre est un multiple du facteur donné.- Si le reste est
0
pour15
, alors imprimerFizzBuzz
. - Si le reste est
0
pour3
, alors imprimerFizz
. - Si le reste est
0
pour5
, alors imprimerBuzz
.
- Si le reste est
- Sinon, il suffit d’imprimer le nombre.
Suivre étape par étape
Pour suivre ce tutoriel étape par étape, vous devrez installer Python et installer pipenv
.
🐰 Le code source de cet article est disponible sur GitHub.
Créez un fichier Python nommé game.py
,
et définissez son contenu avec l’implémentation FizzBuzz ci-dessus.
Ensuite, exécutez python game.py
.
La sortie devrait ressembler à :
🐰 Boom ! Vous êtes en train de réussir l’entretien de codage !
Avant d’aller plus loin, il est important de discuter des différences entre le micro-benchmarking et le macro-benchmarking.
Micro-Benchmarking vs Macro-Benchmarking
Il existe deux grandes catégories de benchmarks logiciels : les micro-benchmarks et les macro-benchmarks.
Les micro-benchmarks fonctionnent à un niveau similaire aux tests unitaires.
Par exemple, un benchmark pour une fonction qui détermine Fizz
, Buzz
, ou FizzBuzz
pour un seul nombre serait un micro-benchmark.
Les macro-benchmarks fonctionnent à un niveau similaire aux tests d’intégration.
Par exemple, un benchmark pour une fonction qui joue l’ensemble du jeu de FizzBuzz, de 1
à 100
, serait un macro-benchmark.
Généralement, il est préférable de tester au niveau le plus bas d’abstraction possible. Dans le cas des benchmarks, cela les rend à la fois plus faciles à maintenir, et cela aide à réduire le bruit dans les mesures. Cependant, tout comme avoir des tests de bout en bout peut être très utile pour vérifier la cohérence de l’ensemble du système tel que prévu, avoir des macro-benchmarks peut être très utile pour s’assurer que les chemins critiques à travers votre logiciel restent performants.
Benchmarking en Python
Les deux options populaires pour le benchmarking en Python sont : pytest-benchmark et airspeed velocity (asv)
pytest-benchmark
est un outil de benchmarking puissant
intégré au populaire cadre de test pytest
.
Il permet aux développeurs de mesurer et de comparer la performance de leur code en exécutant des benchmarks en parallèle de leurs tests unitaires.
Les utilisateurs peuvent facilement comparer leurs résultats de benchmark localement
et exporter leurs résultats dans divers formats, tels que JSON.
airspeed velocity (asv)
est un autre outil de benchmarking avancé dans l’écosystème Python.
L’un des principaux avantages de asv
est sa capacité à générer des rapports HTML détaillés et interactifs,
ce qui facilite la visualisation des tendances de performances et l’identification des régressions.
De plus, asv
prend en charge le Benchmarking Continu Relatif nativement.
Les deux sont supportés par Bencher.
Alors, pourquoi choisir pytest-benchmark
?
pytest-benchmark
s’intègre parfaitement avec pytest
,
qui est le standard de facto pour les tests unitaires dans l’écosystème Python.
Je vous suggère d’utiliser pytest-benchmark
pour évaluer la latence de votre code,
surtout si vous utilisez déjà pytest
.
En effet, pytest-benchmark
est excellent pour mesurer le temps d’horloge.
Refactoriser FizzBuzz
Afin de tester notre application FizzBuzz, nous devons découpler notre logique de l’exécution principale de notre programme. Les outils de benchmark ne peuvent pas mesurer l’exécution principale. Pour ce faire, nous devons apporter quelques modifications.
Refactorisons notre logique FizzBuzz en quelques fonctions :
play_game
: Prend un entiern
, appellefizz_buzz
avec ce nombre, et sishould_print
estTrue
, imprime le résultat.fizz_buzz
: Prend un entiern
et effectue la logique réelle deFizz
,Buzz
,FizzBuzz
, ou juste le nombre, renvoyant le résultat sous forme de chaîne.
Ensuite, mettez à jour l’exécution principale pour qu’elle ressemble à ceci :
L’exécution principale de notre programme parcourt les nombres de 1
à 100
inclus et appelle play_game
pour chaque nombre, avec should_print
défini sur True
.
Évaluation comparative de FizzBuzz
Afin de faire l’évaluation comparative de notre code, nous devons créer une fonction de test qui exécute notre benchmark.
En bas de game.py
, ajoutez le code suivant :
- Créez une fonction nommée
test_game
qui prend en paramètre un fixturebenchmark
depytest-benchmark
. - Créez une fonction
run_game
qui itère de1
à100
inclusivement.- Pour chaque nombre, appelez
play_game
, avecshould_print
défini surFalse
.
- Pour chaque nombre, appelez
- Passez la fonction
run_game
au coureurbenchmark
.
Nous devons maintenant configurer notre projet pour exécuter nos benchmarks.
Créez un nouvel environnement virtuel avec pipenv
:
Installez pytest-benchmark
dans ce nouvel environnement pipenv
:
Nous sommes maintenant prêts à évaluer notre code, exécutez pytest game.py
:
🐰 Laitue faire bouger les betteraves ! Nous avons nos premières métriques de benchmark !
Enfin, nous pouvons reposer nos têtes de développeurs fatiguées… Je plaisante, nos utilisateurs veulent une nouvelle fonctionnalité !
Écrire FizzBuzzFibonacci en Python
Nos indicateurs clés de performance (KPI) sont en baisse, donc notre Chef de Produit (PM) veut que nous ajoutions une nouvelle fonctionnalité. Après de nombreux brainstormings et entretiens avec les utilisateurs, il est décidé que le bon vieux FizzBuzz ne suffit pas. Les enfants d’aujourd’hui veulent un nouveau jeu, FizzBuzzFibonacci.
Les règles du FizzBuzzFibonacci sont les suivantes :
Écrivez un programme qui imprime les entiers de
1
à100
(inclus) :
- Pour les multiples de trois, imprimez
Fizz
- Pour les multiples de cinq, imprimez
Buzz
- Pour les multiples de trois et cinq, imprimez
FizzBuzz
- Pour les nombres qui font partie de la séquence de Fibonacci, imprimez uniquement
Fibonacci
- Pour tous les autres, imprimez le nombre
La séquence de Fibonacci est une séquence dans laquelle chaque nombre est la somme des deux précédents.
Par exemple, en commençant par 0
et 1
, le prochain nombre dans la séquence de Fibonacci serait 1
.
Suivi par : 2
, 3
, 5
, 8
et ainsi de suite.
Les nombres qui font partie de la séquence de Fibonacci sont connus sous le nom de nombres de Fibonacci. Nous allons donc devoir écrire une fonction qui détecte les nombres de Fibonacci.
Il y a plusieurs façons de générer la séquence de Fibonacci et plusieurs façons de détecter un nombre de Fibonacci. Nous allons donc choisir ma méthode préférée :
- Créez une fonction nommée
is_fibonacci_number
qui prend en entrée un entier et retourne un booléen. - Itérez sur tous les nombres de
0
jusqu’à notre nombren
inclus. - Initialisez notre séquence de Fibonacci en commençant par
0
et1
comme étant respectivement les nombresprevious
etcurrent
. - Itérez tant que le nombre
current
est inférieur à l’itération actuellei
. - Additionnez les nombres
previous
etcurrent
pour obtenir le nombrenext_value
. - Mettez à jour le nombre
previous
avec le nombrecurrent
. - Mettez à jour le nombre
current
avec le nombrenext_value
. - Une fois que
current
est supérieur ou égal au nombre donnén
, nous sortirons de la boucle. - Vérifiez si le nombre
current
est égal au nombre donnén
et, le cas échéant, retournezTrue
. - Sinon, retournez
False
.
Nous devons maintenant mettre à jour notre fonction fizz_buzz
:
- Renommez la fonction
fizz_buzz
enfizz_buzz_fibonacci
pour la rendre plus descriptive. - Appelez notre fonction d’assistance
is_fibonacci_number
. - Si le résultat de
is_fibonacci_number
estTrue
, retournezFibonacci
. - Si le résultat de
is_fibonacci_number
estFalse
, réalisez la même logiqueFizz
,Buzz
,FizzBuzz
ou nombre et retournez le résultat.
Comme nous avons renommé fizz_buzz
en fizz_buzz_fibonacci
, nous devons également mettre à jour notre fonction play_game
:
Tant notre exécution principale que la fonction test_game
peuvent rester exactement les mêmes.
Mesurer les performances de FizzBuzzFibonacci
Maintenant, nous pouvons relancer notre test de performance :
En remontant dans notre historique de terminal, nous pouvons faire une comparaison visuelle entre les performances de nos jeux FizzBuzz et FizzBuzzFibonacci : 10.8307 us
vs 735.5682 us
. Vos chiffres seront légèrement différents des miens. Cependant, la différence entre les deux jeux est probablement d’environ 50 fois. Cela me semble bien ! Surtout pour ajouter une fonctionnalité aussi impressionnante que Fibonacci à notre jeu. Les enfants vont adorer !
Étendre FizzBuzzFibonacci en Python
Notre jeu est un succès ! Les enfants adorent vraiment jouer à FizzBuzzFibonacci.
Tellement que les dirigeants ont décidé qu’ils voulaient une suite.
Mais c’est le monde moderne, nous avons besoin de revenus récurrents annuels (ARR) et non plus d’achats uniques !
La nouvelle vision pour notre jeu est qu’il soit ouvert, terminé de vivre entre la limite de 1
et 100
(même si elle est incluse).
Non, nous explorons de nouveaux horizons !
Les règles pour Open World FizzBuzzFibonacci sont les suivantes :
Écrivez un programme qui prend en entrée n’importe quel nombre entier positif et affiche :
- Pour les multiples de trois, affichez
Fizz
- Pour les multiples de cinq, affichez
Buzz
- Pour les multiples à la fois de trois et de cinq, affichez
FizzBuzz
- Pour les nombres qui font partie de la séquence de Fibonacci, affichez uniquement
Fibonacci
- Pour tous les autres, affichez le nombre
Pour que notre jeu fonctionne pour n’importe quel nombre, nous devrons accepter un argument de la ligne de commande. Mettez à jour l’exécution principale pour qu’elle ressemble à ceci :
- Importez le paquet
sys
. - Récupérez tous les arguments (
args
) passés à notre jeu depuis la ligne de commande. - Obtenez le premier argument passé à notre jeu et vérifiez s’il s’agit d’un chiffre.
- Si c’est le cas, analysez le premier argument en tant qu’entier,
i
. - Jouez à notre jeu avec l’entier nouvellement analysé
i
.
- Si c’est le cas, analysez le premier argument en tant qu’entier,
- Si l’analyse échoue ou si aucun argument n’est passé, par défaut, invitez à entrer une saisie valide.
Maintenant, nous pouvons jouer à notre jeu avec n’importe quel nombre !
Exécutez python game.py
suivi d’un nombre entier pour jouer à notre jeu :
Et si nous omettons ou fournissons un nombre invalide :
Wow, cela a été un test exhaustif ! L’intégration continue (CI) réussit. Nos patrons sont ravis. Livrons-le ! 🚀
La fin
🐰 … la fin de votre carrière peut-être ?
Rien que pour rire! Tout est en feu! 🔥
Au début, tout semblait aller bien. Et puis à 02h07 du matin le samedi, mon bip a sonné :
📟 Votre jeu est en feu! 🔥
Après me être précipité hors du lit, j’ai essayé de comprendre ce qui se passait. J’ai essayé de rechercher dans les journaux, mais c’était difficile parce que tout continuait de s’effondrer. Finalement, j’ai trouvé le problème. Les enfants ! Ils adorent notre jeu tellement, qu’ils jouaient jusqu’à un million! Dans un éclair de génie, j’ai ajouté deux nouveaux points de référence :
- Un micro-benchmark
test_game_100
pour jouer au jeu avec le nombre cent (100
) - Un micro-benchmark
test_game_1_000_000
pour jouer au jeu avec le nombre un million (1_000_000
)
Lorsque je l’ai exécuté, j’ai obtenu cela :
Attendez… attendez…
Quoi ! 15.8470 us
x 1,000
devrait être 15,847.0 us
pas 571,684.6334 us
🤯
Même si j’ai obtenu ma fonction de séquence de Fibonacci correctement d’un point de vue fonctionnel, je dois avoir un problème de performance quelque part.
Corriger FizzBuzzFibonacci en Python
Reprenons un autre regard sur cette fonction is_fibonacci_number
:
Maintenant que je pense à la performance, je réalise que j’ai une boucle supplémentaire, inutile.
Nous pouvons complètement nous débarrasser de la boucle for i in range(n + 1):
et
simplement comparer la valeur current
au nombre donné (n
) 🤦
- Mettez à jour notre fonction
is_fibonacci_number
. - Initialisez notre séquence de Fibonacci en commençant par
0
et1
en tant que nombresprevious
etcurrent
respectivement. - Itérez tant que le nombre
current
est inférieur au nombre donnén
. - Ajoutez le nombre
previous
et le nombrecurrent
pour obtenir le nombrenext_value
. - Mettez à jour le nombre
previous
au nombrecurrent
. - Mettez à jour le nombre
current
au nombrenext_value
. - Une fois que
current
est supérieur ou égal au nombre donnén
, nous sortirons de la boucle. - Vérifiez si le nombre
current
est égal au nombre donnén
et retournez ce résultat.
Maintenant, relançons ces benchmarks et voyons ce que nous obtenons :
Oh, wow ! Notre benchmark test_game
est de retour à peu près au même niveau que l’original FizzBuzz.
J’aimerais me souvenir exactement de quel score il s’agissait. Cela fait trois semaines cependant.
Mon historique de terminal ne remonte pas aussi loin.
Et pytest-benchmark
ne stocke ses résultats que lorsque nous le lui demandons.
Mais je pense que c’est proche !
Le benchmark test_game_100
a chuté de près de 50x à 322.0815 ns
.
Et le benchmark test_game_1_000_000
a chuté de plus de 500,000x ! 571,684,633.4 ns
à 753.1445 ns
!
🐰 Eh bien, au moins, nous avons détecté ce problème de performance avant qu’il n’arrive en production… oh, d’accord. Peu importe…
Détection des régressions de performances dans l’intégration continue (CI)
Les dirigeants n’étaient pas contents du torrent de critiques négatives que notre jeu a reçu à cause de mon petit bug de performance. Ils m’ont dit de ne pas laisser cela se reproduire, et quand j’ai demandé comment, ils m’ont juste dit de ne pas le refaire. Comment suis-je censé gérer cela‽
Heureusement, j’ai trouvé cet outil open source génial appelé Bencher. Il y a un niveau gratuit super généreux, donc je peux simplement utiliser Bencher Cloud pour mes projets personnels. Et au travail où tout doit être dans notre cloud privé, j’ai commencé à utiliser Bencher Self-Hosted.
Bencher a des adaptateurs intégrés, il est donc facile de l’intégrer dans CI. Après avoir suivi le guide de démarrage rapide, je suis en mesure d’exécuter mes benchmarks et de les suivre avec Bencher.
En utilisant cet astucieux appareil de voyage dans le temps qu’un gentil lapin m’a donné, j’ai pu revenir en arrière et revivre ce qui se serait passé si nous utilisions Bencher depuis le début. Vous pouvez voir où nous avons d’abord poussé l’implémentation buggée de FizzBuzzFibonacci. J’ai immédiatement obtenu des échecs dans CI en commentaire sur ma demande de tirage. Ce même jour, j’ai corrigé le bug de performance, en supprimant cette boucle inutile et supplémentaire. Pas de feux. Juste des utilisateurs heureux.
Bencher: Benchmarking Continu
Bencher est une suite d’outils de benchmarking continu. Avez-vous déjà eu une régression de performance qui a impacté vos utilisateurs ? Bencher aurait pu empêcher cela de se produire. Bencher vous permet de détecter et de prévenir les régressions de performance avant qu’elles n’arrivent en production.
- Exécuter: Exécutez vos benchmarks localement ou en CI en utilisant vos outils de benchmarking préférés. La CLI
bencher
enveloppe simplement votre harnais de benchmarking existant et stocke ses résultats. - Suivre: Suivez les résultats de vos benchmarks au fil du temps. Surveillez, interrogez et graphiquez les résultats à l’aide de la console web Bencher en fonction de la branche source, du banc d’essai et de la mesure.
- Détecter: Détectez les régressions de performances en CI. Bencher utilise des analyses de pointe et personnalisables pour détecter les régressions de performances avant qu’elles n’arrivent en production.
Pour les mêmes raisons que les tests unitaires sont exécutés en CI pour prévenir les régressions de fonctionnalités, les benchmarks devraient être exécutés en CI avec Bencher pour prévenir les régressions de performance. Les bugs de performance sont des bugs !
Commencez à détecter les régressions de performances en CI — essayez Bencher Cloud gratuitement.