Guia Operacional MPLS para ISPs
Guia Operacional MPLS para ISPs
Este guia tem como objetivo padronizar o troubleshooting MPLS em ambientes de provedores de Internet (ISPs), com foco principal em equipamentos Huawei, mas aplicável a ambientes multivendor.
Objetivo e Público-Alvo
Este documento foi elaborado para auxiliar equipes NOC, N2, N3 e Engenharia na identificação, análise e correção de falhas relacionadas a MPLS.
Público-Alvo
- Analistas NOC/N1
- Analistas N2/N3
- Engenheiros de Redes
- Operadores de Backbone MPLS
Regra Fundamental
O troubleshooting MPLS deve seguir uma sequência lógica:
- Camada Física
- Conectividade IP
- OSPF
- MPLS
- LDP
- Serviço (L2VC/VSI)
- MTU
Uma falha em qualquer etapa anterior compromete as etapas seguintes.
Como o MPLS Funciona na Prática
MPLS não deve ser tratado como uma tecnologia isolada. Em uma rede ISP, o MPLS depende inicialmente da conectividade IP e de um protocolo IGP, normalmente OSPF ou IS-IS.
O IGP garante o alcance entre as loopbacks dos roteadores. Em seguida, o LDP utiliza essa conectividade para distribuir labels. Somente após essas etapas os serviços L2VPN, como VPWS (L2VC) e VPLS (VSI), conseguem operar corretamente.
Resumo Prático
- OSPF encontra o caminho.
- LDP distribui as labels.
- MPLS encaminha usando labels.
- L2VC e VSI utilizam essa infraestrutura para transportar serviços Ethernet.
Diagramas de Referência
Função dos Protocolos
OSPF
O OSPF é responsável por garantir a conectividade IP entre os roteadores do backbone. Em ambientes MPLS, normalmente são anunciadas as interfaces de transporte e as loopbacks utilizadas como Router-ID e LSR-ID.
Sem alcance IP entre as loopbacks dos roteadores, o MPLS e o LDP não conseguem estabelecer suas adjacências corretamente.
MPLS
O MPLS (Multiprotocol Label Switching) adiciona um rótulo (label) aos pacotes para permitir o encaminhamento baseado em labels ao invés de consultas sucessivas à tabela de roteamento IP.
Os principais serviços suportados incluem:
- L2VPN (VPWS/L2VC)
- VPLS (VSI)
- Engenharia de Tráfego
- VPNs de Camada 3
LDP
O LDP (Label Distribution Protocol) é responsável pela distribuição das labels entre os roteadores MPLS.
Após a conectividade IP ser estabelecida pelo OSPF, os roteadores formam vizinhanças LDP e trocam informações de labels para cada prefixo conhecido.
Caso o LDP apresente falhas, os serviços MPLS dependentes serão impactados.
Targeted LDP
O Targeted LDP (tLDP) permite estabelecer sessões LDP diretamente entre roteadores não adjacentes.
É amplamente utilizado em serviços VPWS (L2VC), onde os PEs precisam trocar informações de pseudowires através de sessões remotas.
A ausência ou falha do Targeted LDP normalmente resulta em serviços L2VC inoperantes, mesmo que o MPLS e o OSPF estejam funcionando corretamente.
L2VC versus VSI
L2VC (VPWS)
O L2VC (Layer 2 Virtual Circuit), também conhecido como VPWS (Virtual Private Wire Service), cria uma conexão ponto a ponto entre dois equipamentos PE através da rede MPLS.
Características:
- Serviço ponto a ponto.
- Menor consumo de recursos.
- Simplicidade operacional.
- Amplamente utilizado para transporte de VLANs entre localidades.
Fluxo simplificado:
VSI (VPLS)
A VSI (Virtual Switch Instance), utilizada em implementações VPLS, cria um domínio Ethernet multiponto sobre a rede MPLS.
Características:
- Serviço multiponto.
- Comportamento semelhante a um switch Ethernet.
- Permite múltiplos sites na mesma LAN virtual.
- Maior consumo de recursos em comparação ao L2VC.
Comparativo
| Característica | L2VC (VPWS) | VSI (VPLS) |
|---|---|---|
| Topologia | Ponto a ponto | Multiponto |
| Complexidade | Baixa | Média |
| Escalabilidade | Alta | Muito alta |
| Consumo de recursos | Menor | Maior |
| Caso de uso | Transporte de VLANs | LAN estendida entre múltiplos sites |
Quando um L2VC ou VSI apresenta falhas:
- Validar interfaces físicas.
- Confirmar alcance IP entre as loopbacks.
- Verificar OSPF.
- Verificar MPLS.
- Verificar LDP.
- Verificar sessões Targeted LDP.
- Validar MTU ponta a ponta.
- Confirmar estado do serviço (VC ou VSI).
MTU em Ambientes MPLS
Conceitos Fundamentais
Em redes MPLS, a MTU deve ser planejada considerando o overhead adicional introduzido pelas labels MPLS.
Cada label MPLS adiciona 4 bytes ao pacote.
Exemplos:
- 1 Label = +4 bytes
- 2 Labels = +8 bytes
- 3 Labels = +12 bytes
Dependendo da tecnologia utilizada (L2VC, VSI, QinQ, PPPoE, VXLAN, etc.), o overhead total pode aumentar significativamente.
Exemplo Prático
Uma rede Ethernet tradicional normalmente opera com MTU 1500 bytes.
Ao adicionar MPLS:
- Payload IP = 1500 bytes
- 2 Labels MPLS = +8 bytes
- Cabeçalho Ethernet = +18 bytes
O enlace precisa suportar uma MTU superior a 1500 bytes para evitar fragmentação ou descarte de pacotes.
Sintomas de Problemas de MTU
Problemas de MTU podem gerar sintomas como:
- L2VC sobe, mas não passa tráfego.
- VSI apresenta instabilidade.
- Aplicações específicas não funcionam.
- Sites abrem parcialmente.
- Perda de pacotes para tráfego maior.
- PPPoE conecta, mas navegação apresenta falhas.
- OSPF e BGP estabelecem normalmente, porém o tráfego de usuário apresenta problemas.
Validação de MTU
Uma das formas mais simples de validação é utilizar ping com DF-bit (Don't Fragment).
Exemplo:
ping -f -s 1472 X.X.X.X
ou em equipamentos Huawei:
ping -a LoopBack0 X.X.X.X -f -s 1472
O objetivo é identificar o maior tamanho de pacote que consegue atravessar toda a rede sem fragmentação.
Troubleshooting
Ao investigar problemas relacionados a MTU:
- Validar MTU física das interfaces.
- Verificar MTU do backbone MPLS.
- Confirmar MTU dos serviços L2VC ou VSI.
- Testar ping com DF-bit.
- Verificar QinQ e encapsulamentos adicionais.
- Confirmar configuração fim a fim.
Boas Práticas
- Padronizar MTU do backbone.
- Documentar MTU de serviços especiais.
- Validar MTU durante ativações.
- Incluir testes de MTU nos procedimentos operacionais.
- Considerar expansões futuras de encapsulamento.
Procedimento de Troubleshooting MPLS
Fluxo de Validação
Sempre execute o troubleshooting seguindo a sequência abaixo.
Uma falha identificada em qualquer etapa deve ser corrigida antes de prosseguir.
Etapa 1 - Camada Física
Validar:
- Interface UP/UP.
- Potência óptica dentro dos limites.
- Ausência de CRC e erros físicos.
- Negociação correta da interface.
Comandos Huawei:
display interface brief display interface GigabitEthernet 0/0/0
Etapa 2 - Conectividade IP
Validar:
- Endereçamento IP.
- Rotas presentes.
- Ping entre vizinhos diretos.
Comandos Huawei:
display ip interface brief display ip routing-table ping X.X.X.X
Etapa 3 - OSPF
Validar:
- Vizinhanças estabelecidas.
- Loopbacks anunciadas.
- Rotas presentes na tabela.
Comandos Huawei:
display ospf peer display ospf routing display ip routing-table protocol ospf
Etapa 4 - MPLS
Validar:
- MPLS habilitado nas interfaces.
- LSR-ID configurado.
- Tabela MPLS populada.
Comandos Huawei:
display mpls interface display mpls lsr-id display mpls forwarding-table
Etapa 5 - LDP
Validar:
- Sessões LDP estabelecidas.
- Troca de labels funcionando.
Comandos Huawei:
display mpls ldp session display mpls ldp peer display mpls ldp lsp
Etapa 6 - Targeted LDP
Validar:
- Sessões remotas estabelecidas.
- Remote Peer alcançável.
Comandos Huawei:
display mpls ldp remote-peer display mpls ldp session
Etapa 7 - Serviço
Para L2VC:
display mpls l2vc
Para VSI:
display vsi display vsi verbose
Validar:
- Estado UP.
- Labels aprendidas.
- Peer correto.
Etapa 8 - MTU
Validar:
- MTU física.
- MTU MPLS.
- MTU do serviço.
Executar testes com DF-bit sempre que houver suspeita de fragmentação.
Checklist Final
| Item | Status |
|---|---|
| Interface Física | OK / NOK |
| Conectividade IP | OK / NOK |
| OSPF | OK / NOK |
| MPLS | OK / NOK |
| LDP | OK / NOK |
| Targeted LDP | OK / NOK |
| Serviço | OK / NOK |
| MTU | OK / NOK |
Comandos de Troubleshooting Huawei
Casos Reais de Troubleshooting
Caso 1 - OSPF UP e LDP DOWN
Sintoma:
- OSPF estabelecido.
- Loopbacks alcançáveis.
- LDP não sobe.
Possíveis causas:
- MPLS não habilitado na interface.
- LSR-ID incorreto.
- ACL bloqueando TCP 646.
Comandos:
display mpls interface display mpls ldp peer
Caso 2 - LDP UP e L2VC DOWN
Sintoma:
- LDP operacional.
- VC State Down.
Possíveis causas:
- Targeted LDP Down.
- VC-ID divergente.
- Peer incorreto.
Comandos:
display mpls l2vc display mpls ldp remote-peer
Caso 3 - L2VC UP sem tráfego
Sintoma:
- VC State UP.
- Cliente sem comunicação.
Possíveis causas:
- MTU.
- VLAN incorreta.
- QinQ inconsistente.
Comandos:
display interface display mpls l2vc verbose
Caso 4 - VSI UP sem aprendizado MAC
Sintoma:
- VSI UP.
- MAC Address não aparece.
Possíveis causas:
- Split-horizon.
- VLAN incorreta.
- SAP/AC Down.
Comandos:
display vsi verbose display mac-address
Caso 5 - Problema de MTU
Sintoma:
- Ping pequeno funciona.
- Ping grande falha.
- Navegação parcial.
Possíveis causas:
- MTU incompatível.
- MPLS overhead.
Comandos:
ping -f -s 1472 X.X.X.X
Comandos de Referência Huawei
OSPF
display ospf peer display ospf routing display ospf interface display ospf brief
MPLS
display mpls interface display mpls lsr-id display mpls forwarding-table display mpls lsp
LDP
display mpls ldp peer display mpls ldp session display mpls ldp lsp display mpls ldp statistics
Targeted LDP
display mpls ldp remote-peer display mpls ldp session
L2VC
display mpls l2vc display mpls l2vc verbose
VSI
display vsi display vsi verbose display mac-address vsi
Interface
display interface brief display interface GigabitEthernet x/x/x
Autor
Daniel Melo Gerente de Redes | G3 Telecom Especialista em ISP, BGP, MPLS e Engenharia de Backbone
Última atualização: Junho/2026