Excel: Comment trouver des doublons avec la fonction NB.SI ?

Publié le 17 juillet 2024 à 23:50

La gestion efficace des données est essentielle dans tout environnement professionnel moderne. Parmi les défis rencontrés par ceux qui travaillent avec des bases de données volumineuses se trouve la nécessité d'identifier et de gérer les doublons. Les doublons peuvent entraîner des erreurs coûteuses et compromettre l'intégrité des analyses et des rapports. Dans cet article, nous explorerons comment utiliser la fonction NB.SI dans Excel pour détecter et gérer efficacement les doublons, en optimisant ainsi la qualité et la fiabilité des données.

Résumé

Pour trouver les cellules en doublon dans une plage de données, on peut utiliser la fonction NB.SI. Dans notre exemple, la formule en D3 est :

 

= NB.SI( $B$3:$B$10 ; B3 ) > 1

 

Cette formule permet de vérifier le nombre d’apparition de l’article « Chaise » dans la plage de cellules B3:B10. Si le nombre est supérieur à 1, la valeur VRAI sera renvoyée. Dans le cas contraire, ce sera la valeur FAUX qui sera renvoyée.

 

Formule Excel – Trouver des doublons avec NB.SI

= NB.SI( plage ; valeur ) > 1

 

Explications

Cette formule Excel permet de vérifier si les valeurs présentes dans une plage de cellules sont présentes à plusieurs reprises (doublons). Pour cela, on utilise la fonction NB.SI.

 

Fonction NB.SI

La fonction NB.SI compte le nombre de valeurs répondant à un critère dans une plage de données définie. Dans notre exemple la formule présente en D3 compte le nombre d’apparitions de « Chaise » dans la plage de cellules B3:B10 :

 

= NB.SI( $B$3:$B$10 ; B3 ) --> Résultat: 3

 

En englobant la fonction NB.SI dans un test logique, nous demandons à vérifier si la valeur est supérieure à 1. Si c’est le cas, ce sera la valeur VRAI qui sera renvoyée. Dans le cas contraire ce sera la valeur FAUX.

 

= NB.SI( $B$3:$B$10 ; B3 ) > 3 --> Résultat: VRAI

 

Il aurait été possible de mettre ce test logique en tant que premier argument d’une fonction SI. On peut alors personnalisé les résultats renvoyés

 

= SI( NB.SI( $B$3:$B$10 ; B3 ) > 3 ; "doublon" ; "") --> Résultat: "doublon"

 

Plusieurs critères avec la fonction NB.SI.ENS

Pour identifier les doublons sur la base de plusieurs critères (ex: article et famille), il faut utiliser la fonction NB.SI.ENS. Dans notre exemple la formule présente en E3 compte le nombre d’apparitions de « Chaise » dans la famille « Salon » :

 

= NB.SI.ENS( $B$3:$B$10 ; B3 ; $C$3:$C$10 ; C3 ) > 1

 

Identifier les doublons à partir de la 2e occurence

Si vous souhaitez identifier les doublons à partir de la 2e occurrence, c’est-à-dire que vous voulez que la première apparition ne soit pas identifiée comme un doublon, la formule sera sensiblement la même. La seule différence résidera dans l’utilisation des dollars. La formule en D3 serait :

 

= NB.SI( $B$3:B3 ; B3 )

 

Dans cette formule, seule la référence initiale la plage de cellule est figée. L’autre extrémité va s’étendre à mesure qu’on étendra la formule.

 

= NB.SI( $B$3:B3 ; B3 ) > 1 --> FAUX

=NB.SI( $B$3:B4 ; B4 ) > 1 --> FAUX

= NB.SI( $B$3:B5 ; B5 ) > 1 --> VRAI

= NB.SI( $B$3:B6 ; B6 ) > 1 --> FAUX

= NB.SI( $B$3:B7 ; B7 ) > 1 --> FAUX

= NB.SI( $B$3:B8 ; B8 ) > 1 --> VRAI

= NB.SI( $B$3:B9 ; B9 ) > 1 --> FAUX

= NB.SI( $B$3:B10 ; B10 ) > 1 --> VRAI

En conclusion, la fonction NB.SI d'Excel se révèle être un outil puissant pour détecter et gérer les doublons dans les bases de données. En utilisant des critères spécifiques et des formules simples, les utilisateurs peuvent non seulement identifier les entrées en double, mais aussi prendre des mesures correctives immédiates pour assurer l'intégrité et la précision des données. En intégrant cette méthode dans leurs flux de travail, les professionnels peuvent améliorer la qualité de leurs analyses et rapports, tout en réduisant les risques d'erreurs coûteuses et de décisions erronées basées sur des données incorrectes.

Ajouter un commentaire

Commentaires

Il n'y a pas encore de commentaire.