Guia de Expressões Regulares

Aprenda a usar expressões regulares para extrair informações de seus arquivos de forma eficiente

O que são Expressões Regulares?

Expressões regulares (regex) são sequências de caracteres que formam um padrão de busca. Elas são extremamente úteis para encontrar, validar e extrair informações de textos. No FileDivider, usamos expressões regulares para identificar onde cada seção começa e para extrair informações específicas dos seus arquivos.

Conceitos Básicos

Antes de mergulharmos em exemplos específicos, vamos entender alguns conceitos básicos de expressões regulares:

Caracteres Literais

A maioria dos caracteres em uma expressão regular representa a si mesmo. Por exemplo, a expressãoabc corresponde exatamente à sequência "abc".

Metacaracteres

Alguns caracteres têm significados especiais, como . ^ $ * + ? [ ] \ | ( )

Classes de Caracteres

Colchetes definem um conjunto de caracteres. Por exemplo, [abc] corresponde a "a", "b" ou "c".

Quantificadores

Especificam quantas vezes um caractere pode aparecer, como * + ? {n} {n,} {n,m}

Metacaracteres Comuns

MetacaractereDescriçãoExemplo
.Qualquer caractere, exceto quebra de linhaa.c corresponde a "abc", "adc", "a1c", etc.
^Início da linha^abc corresponde a "abc" apenas no início da linha
$Fim da linhaabc$ corresponde a "abc" apenas no final da linha
\dQualquer dígito (0-9)\d\d\d corresponde a três dígitos como "123"
\wQualquer caractere alfanumérico ou underscore\w+ corresponde a uma ou mais letras, números ou underscore
\sQualquer espaço em brancoa\sb corresponde a "a b", "a\tb", etc.
*Zero ou mais ocorrênciasab*c corresponde a "ac", "abc", "abbc", etc.
+Uma ou mais ocorrênciasab+c corresponde a "abc", "abbc", mas não a "ac"
?Zero ou uma ocorrênciaab?c corresponde a "ac" e "abc"

Exemplos Práticos para o FileDivider

Exemplo 1: Identificar Início de Seção

Para dividir um documento em seções que começam com "Capítulo" seguido por um número:

Capítulo \d+

Esta expressão corresponderá a textos como "Capítulo 1", "Capítulo 42", etc.

Exemplo 2: Extrair CPF

Para extrair um CPF no formato XXX.XXX.XXX-XX:

\d3\.\d3\.\d3-\d2

Esta expressão corresponderá a CPFs como "123.456.789-01".

Exemplo 3: Extrair Datas

Para extrair datas no formato DD/MM/AAAA:

\d2/\d2/\d4

Esta expressão corresponderá a datas como "01/01/2023".

Exemplo 4: Extrair Nomes de Clientes

Para extrair nomes de clientes que começam com "Cliente:" seguido por qualquer texto:

Cliente: (.+)

Esta expressão corresponderá a textos como "Cliente: João Silva" e capturará "João Silva" como um grupo.

Dicas para Usar Expressões Regulares no FileDivider

  • Auxiliar "Inicio": Este auxiliar é obrigatório e deve conter uma expressão que identifique onde cada seção começa. Escolha um padrão que seja único para o início de cada seção.
  • Seja específico: Quanto mais específica for sua expressão regular, menos chances de correspondências indesejadas.
  • Teste suas expressões: Antes de processar arquivos grandes, teste suas expressões regulares em uma pequena amostra do seu texto.
  • Use grupos de captura: Parênteses () criam grupos de captura que podem ser referenciados posteriormente, útil para extrair informações específicas.

Ferramentas para Testar Expressões Regulares

Existem várias ferramentas online que podem ajudar você a testar suas expressões regulares antes de usá-las no FileDivider:

  • Regex101 - Uma ferramenta interativa com explicações detalhadas
  • RegExr - Outra excelente ferramenta para testar e aprender
  • RegEx Tester - Simples e fácil de usar