# [Commandes Linux] Grep / Awk / Cut / Sed

## Introduction

Cette page montre l'utilisation d'outils en ligne de commande qui permettent de travailler avec les chaînes de caractères.

## Grep

Permet de trouver un motif dans un fichier.

##### Syntaxe globale

```bash
grep [options] motif [fichier...]
```

Voici les options les plus courantes :

```markdown
-i : Ignorer la casse (recherche insensible à la casse).
-r : Rechercher récursivement dans les répertoires.
-l : Afficher uniquement les noms de fichiers contenant des correspondances.
-v : Inverser la recherche (afficher les lignes qui ne contiennent pas le motif).
-n : Afficher le numéro de ligne de chaque correspondance.
-c : Afficher le nombre total de correspondances trouvées.
-A num : Afficher num lignes après chaque correspondance.
-B num : Afficher num lignes avant chaque correspondance.
-C num : Afficher num lignes avant et après chaque correspondance.
-e motif : Rechercher plusieurs motifs.
-f fichier : Lire les motifs à partir d'un fichier.
--exclude=pattern : Exclure les fichiers correspondant au modèle donné.
--include=pattern : Inclure uniquement les fichiers correspondant au modèle donné.
--color=auto : Surligner les correspondances en couleur (par défaut).
--color=never : Désactiver la coloration.
```

##### Exemples :

- Rechercher un motif dans un fichier : ```bash
    grep "motif" fichier.txt
    ```
- Rechercher un motif dans plusieurs fichiers récursivement : ```bash
    grep -r "motif" répertoire/
    ```
- Rechercher un motif en ignorant la casse : ```bash
    grep -i "motif" fichier.txt
    ```
- Afficher uniquement les noms de fichiers contenant des correspondances : ```bash
    grep -l "motif" fichier1.txt fichier2.txt
    ```
- Inverser la recherche pour afficher les lignes sans correspondances : ```bash
    grep -v "motif" fichier.txt
    ```
- Afficher le numéro de ligne de chaque correspondance : ```bash
    grep -n "motif" fichier.txt
    ```
- Rechercher plusieurs motifs : ```bash
    grep -e "motif1" -e "motif2" fichier.txt
    ```
- Utiliser un fichier contenant des motifs à rechercher : ```
    grep -f motifs.txt fichier.txt
    ```
- Exclure certains fichiers de la recherche : ```bash
    grep "motif" --exclude=*.log répertoire/
    ```
- Activer/désactiver la coloration des correspondances : ```bash
    grep --color=always "motif" fichier.txt
    grep --color=never "motif" fichier.txt
    ```

## Awk

Il s'agit d'un outil de traitement de texte principalement utilisé pour manipuler et analyser des données tabulaires.

##### Syntaxe globale

```bash
awk 'pattern { action }' fichier
```

Il existe deux principales utilisation **Awk** :

- **Pattern** : Condition pour appliquer une action.
- **Action** : Commandes à exécuter si le pattern est vrai.

##### Exemples

- Afficher une colonne spécifique d'un fichier CSV : ```bash
    awk -F ',' '{print $2}' fichier.csv
    ```
- Calculer la somme d'une colonne : ```bash
    awk '{sum += $1} END {print sum}' fichier.txt
    ```
- Filtrer les lignes qui correspondent à un motif : ```bash
    awk '/motif/ {print}' fichier.txt
    ```
- Afficher les lignes avec plus de 3 champs : ```bash
    awk 'NF > 3 {print}' fichier.txt
    ```
- Utiliser des opérations mathématiques : ```bash
    awk '{total += $1 * $2} END {print total}' fichier.txt
    ```
- Remplacer du texte dans une colonne : ```bash
    awk '{gsub("ancien", "nouveau", $3); print}' fichier.txt
    ```
- Regrouper et compter les occurrences : ```bash
    awk '{count[$1]++} END {for (item in count) print item, count[item]}' fichier.txt
    ```
- Utiliser des variables avec awk : ```bash
    awk '{total += $1} END {average = total / NR; print "Moyenne :", average}' fichier.txt
    ```
- Personnaliser le séparateur de champ (-F) : ```bash
    awk -F ':' '{print $1}' fichier.txt
    ```
- Appliquer awk à plusieurs fichiers : ```bash
    awk '{print FILENAME, $0}' fichier1.txt fichier2.txt
    ```
- Utiliser des conditions multiples : ```bash
    awk '$1 > 50 && $2 == "A" {print}' fichier.txt
    ```
- Redirection de la sortie vers un fichier : ```bash
    awk '{print $1, $2}' fichier.txt > sortie.txt
    ```

## Cut

Cut st utilisée pour extraire des colonnes ou des champs de texte à partir de fichiers ou de données en entrée. Il est plus rapide et performant que awk et doit être utilisé, dans la mesure du possible, sur des grandes quantités de données.

##### Syntaxe globale

```bash
cut [OPTIONS] [FICHIERS]
```

##### Options courantes

```markdown
-c LISTE : Extraire des caractères (par numéro de colonne).
-f LISTE : Extraire des champs (délimités par un séparateur).
-d CARACTERE : Spécifier le séparateur de champ (par défaut : tabulation).
-s : Ignorer les lignes sans délimiteur, ne pas les afficher.

Liste :
- Une liste de numéros de colonnes (pour l'option -c) ou de numéros de champs (pour l'option -f), séparés par des virgules.
- Les plages de numéros de colonnes ou de champs sont spécifiées avec un tiret (par exemple, 1-3).
```

##### Exemples

- Extraire une colonne spécifique d'un fichier CSV (séparé par des virgules) : ```bash
    cut -d ',' -f 2 fichier.csv
    ```
- Extraire une colonne spécifique d'un fichier TSV (séparé par des tabulations) : ```bash
    cut -f 3 fichier.tsv
    ```
- Extraire plusieurs colonnes d'un fichier CSV : ```bash
    cut -d ',' -f 1,3,5 fichier.csv
    ```
- Extraire une plage de caractères d'une ligne de texte : ```bash
    echo "ABCDEFG" | cut -c 2-4
    ```
- Ignorer les lignes sans délimiteur : ```bash
    cut -d ',' -f 2,3 -s fichier.csv
    ```
- Extraire une colonne spécifique d'un fichier avec des espaces comme séparateur : ```bash
    cut -d ' ' -f 2 fichier.txt
    ```
- Extraire plusieurs plages de caractères d'une ligne de texte : ```bash
    echo "12345ABC67890" | cut -c 1-5,7-9
    ```
- Extraire tous les champs d'un fichier de configuration (séparés par des espaces ou des tabulations) : ```bash
    cut -d ' ' -f - fichier.conf
    ```

## Sed

C'est un outil puissant de traitement de texte en ligne de commande.

##### Syntaxe globale

```bash
sed [OPTIONS] 'commande' [FICHIERS]
```

##### Options courantes

```markdown
-e 'script' : Ajouter un script de commande à exécuter.
-i[SUFFIXE] : Modifier le fichier en place (crée une sauvegarde avec un SUFFIXE si spécifié).
-n : Désactiver la sortie automatique, nécessite l'utilisation de p (impression explicite).
-r : Activer les expressions régulières étendues (compatibles avec les regex modernes).
```

##### Commandes courantes

```markdown
- s/regex/remplacement/g : Remplacer les occurrences de regex par remplacement (g pour global, sinon seulement la première occurrence).
- p : Imprimer la ligne courante.
- d : Supprimer la ligne courante.
- 1,10s/regex/remplacement/g : Appliquer la commande de remplacement uniquement aux lignes 1 à 10.
- /motif/cmd : Appliquer la commande cmd aux lignes contenant le motif.
- !cmd : Appliquer la commande cmd à toutes les lignes sauf celles spécifiées.
- a\ : Ajouter une ligne après la ligne courante.
- i\ : Insérer une ligne avant la ligne courante.
- c\ : Remplacer la ligne courante par une nouvelle ligne.
```

##### Exemples

- Remplacer toutes les occurrences d'un mot dans un fichier : ```bash
    sed 's/motif/remplacement/g' fichier.txt
    ```
- Supprimer les lignes vides d'un fichier : ```bash
    sed '/^$/d' fichier.txt
    ```
- Remplacer une ligne spécifique par du texte dans un fichier : ```bash
    sed '7c\Nouveau texte' fichier.txt
    ```
- Ajouter du texte à la fin de chaque ligne : ```bash
    sed 's/$/ Texte à ajouter/' fichier.txt
    ```
- Imprimer uniquement les lignes contenant un motif : ```bash
    sed -n '/motif/p' fichier.txt
    ```
- Supprimer la dernière ligne d'un fichier : ```bash
    sed '$d' fichier.txt
    ```
- Modifier un fichier en place avec sauvegarde : ```bash
    sed -i.bak 's/motif/remplacement/g' fichier.txt
    ```
- Utiliser des expressions régulières étendues avec -r : ```bash
    sed -r 's/(motif1|motif2)/remplacement/g' fichier.txt
    ```
- Ajouter une ligne avant chaque ligne contenant un motif : ```bash
    sed '/motif/i\Nouvelle ligne' fichier.txt
    ```
- Supprimer toutes les lignes sauf celles contenant un motif : ```bash
    sed -n '/motif/p; /motif2/p' fichier.txt
    ```