« Modèle:Regex » : différence entre les versions

Contenu supprimé Contenu ajouté
Aucun résumé des modifications
Aucun résumé des modifications
Ligne 18 :
! Explication
|-
| style="text-align:center;" | <code>'''.'''</code>
| .
| Point
| n'importe quel caractère
|-
| style="text-align:center;" | <code>'''['''...''']'''</code>
| [...]
| crochets
| {{wt|classe de caractères}} : tous les caractères énumérés dans la classe, avec possibilité de plages dont les bornes sont séparées par "-". Ex : <code>[0-9a-z]</code> pour tout l'alphanumérique en minuscule, ou <code>[0-Z]</code> pour tous les caractères de la table Unicode entre "0" et "Z", c'est-à-dire l'alphanumérique majuscule plus ":;<=>?@"<ref>https://unicode-table.com/fr/</ref>.
|-
| style="text-align:center;" | <code>'''[^'''...''']'''</code>
| [^...]
| crochets et circonflexe
| {{wt|classe complémentée}} : tous les caractères sauf ceux énumérés.
|-
| style="text-align:center;" | <code>'''^'''</code>
| ^
| circonflexe
| marque le début de la chainechaîne, la ligne...
|-
| style="text-align:center;" | <code>'''$'''</code>
| $
| dollar
| marque la fin d'une chainechaîne, ligne...
|-
| style="text-align:center;" | <code>'''<nowiki>|</nowiki>'''</code>
| barre verticale
| alternative - ou reconnaît l'un ou l'autre
|-
| style="text-align:center;" | <code>(...)</code>
| (...)
| parenthèses
| {{wt|groupe de capture}} : utilisée pour limiter la portée d'un masque ou de l'alternative
|-
| style="text-align:center;" | <code>'''*'''</code>
| *
| astérisque
| 0, 1 ou plusieurs occurrences
|-
| style="text-align:center;" | <code>'''+'''</code>
| +
| le plus
| 1 ou plusieurs occurrences
|-
| style="text-align:center;" | <code>'''?'''</code>
| ?
| interrogation
| 0 ou 1 occurrence
|-
| style="text-align:center;" | <code>'''{'''...'''}'''</code>
| {...}
| accolades
| comptage : détermine un nombre de caractères remplissant les critères qu'il suit. Ex : <code>a{2}</code> deux occurrences de "a", <code>a{1,10}</code> (sans espace) entre une et dix.
|-
| style="text-align:center;" | <code>'''(?P<'''''nom'''''>'''''pattern''''')'''</code>
| Sous-motif nommé
| named subpattern
| nomme le résultat d'un groupe de capture par un nom.
|}
 
'''Remarques :'''
* Les caractères de débutsdébut et fin de chaineschaîne (<code>^</code> et <code>$</code>) ne fonctionnent pas dans <code>[]</code> où ils ont un autre rôle.
* Les opérateurs <code>*</code> et <code>+</code> sont toujours {{wt|avide}}s, pour qu'ils laissent la priorité il faut leur apposer un <code>?</code> à leur suite<ref>https://docstore.mik.ua/orelly/webprog/pcook/ch13_05.htm</ref>.
 
Ligne 76 :
! Signification
|-
| style="text-align:center;" | <code>'''<nowiki>[[:alpha:]]</nowiki> '''</code>
|n'importe quelle lettre
|-
| style="text-align:center;" | <code>'''<nowiki>[[:digit:]]</nowiki> '''</code>
|n'importe quel chiffre
|-
| style="text-align:center;" | <code>'''<nowiki>[[:xdigit:]] </nowiki> '''</code>
|caractères hexadécimaux
|-
| style="text-align:center;" | <code>'''<nowiki>[[:alnum:]]</nowiki> '''</code>
|n'importe quelle lettre ou chiffre
|-
| style="text-align:center;" | <code>'''<nowiki>[[:space:]]</nowiki> '''</code>
|n'importe quel espace blanc
|-
| style="text-align:center;" | <code>'''<nowiki>[[:punct:]]</nowiki> '''</code>
|n'importe quel signe de ponctuation
|-
| style="text-align:center;" | <code>'''<nowiki>[[:lower:]] </nowiki> '''</code>
|n'importe quelle lettre en minuscule
|-
| style="text-align:center;" | <code>'''<nowiki>[[:upper:]] </nowiki> '''</code>
|n'importe quelle lettre capitale
|-
| style="text-align:center;" | <code>'''<nowiki>[[:blank:]]</nowiki> '''</code>
|espace ou tabulation
|-
| style="text-align:center;" | <code>'''<nowiki>[[:graph:]] </nowiki> '''</code>
|caractères affichables et imprimables
|-
| style="text-align:center;" | <code>'''<nowiki>[[:cntrl:]]</nowiki> '''</code>
|caractères d'échappement
|-
| style="text-align:center;" | <code>'''<nowiki>[[:print:]]</nowiki> '''</code>
|caractères imprimables exceptés ceux de contrôle
|}
Ligne 117 :
! Expression !! Signification
|-
| style="text-align:center;" | <code>'''\A'''</code> || Début de chainechaîne
|-
| style="text-align:center;" | <code>'''\b'''</code> || Caractère de début ou fin de mot
|-
| style="text-align:center;" | <code>'''\d'''</code> || Chiffre
|-
| style="text-align:center;" | <code>'''\D'''</code> || Non chiffre
|-
| style="text-align:center;" | <code>'''\n'''</code> || Fin de ligne
|-
| style="text-align:center;" | <code>'''\\pL'''</code>, <code>'''\p{L}'''</code>, <code>'''\p{Letter}'''</code> || Lettre (dans tout langage)
|-
| style="text-align:center;" | <code>'''\s'''</code> || Caractères espace
|-
| style="text-align:center;" | <code>'''\S'''</code> || Non caractères espace
|-
| style="text-align:center;" | <code>'''\t'''</code> || Tabulation
|-
| style="text-align:center;" | <code>'''\w'''</code> || Caractère alphanumérique : lettre, chiffre ou underscore
|-
| style="text-align:center;" | <code>'''\W'''</code> || Caractère qui n'est pas lettre, chiffre ou underscore
|-
| style="text-align:center;" | <code>'''\X'''</code> || Caractère Unicode
|-
| style="text-align:center;" | <code>'''\z'''</code> || Fin de chainechaîne
|}