Vous utilisez un shell (bash par exemple) et souhaitez manipulez du texte et particulièrement des doublons ?
Vous connaissez certainement la commande uniq qui permet de ne pas répéter n fois tout doublon de la ligne précédente.
$ echo "cc
bb
bb
aa
bb" | uniq
cc
bb
aa
bb
Comme c'est limité à masquer les doublons qui se suivent peut-être connaissez vous également la commande sort -u qui permet d'effectuer un premier tri avant d'appliquer un uniq :
$ echo "cc
bb
bb
aa
bb" | sort -u
aa
bb
cc
Mais vous êtes vous déjà demandé s'il était possible de faire complètement l'inverse et de n'afficher QUE les doublons ?
- Non ?
- Eh bien moi si ;)
Il suffit d'effectuer l'enchaînement de commandes suivant :
$ echo "cc
bb
bb
aa
bb" | sort | uniq -D | sort -u
bb
Intéressant non ?!