确认所需资料:双方的ASN(自治系统号)、公网前缀(/24或更短)、对等IP地址、联系人与维护窗口、以及合同/跨境合规(中国大陆需要ICP或相关备案视服务类型而定)。
检查数据中心或机房:确认机柜、交叉连接接口、VLAN ID、光纤类型(LC/SC)、以及是否支持CN2直连或需要通过港澳/海缆中转。
可选方式:A. CN2直连(最佳时延与抖动);B. 专线/MPLS VPN(稳定,私有链路);C. 公网BGP over Internet(成本低,但不稳定);D. 云厂商云专线(如阿里云、华为云直连)。
决策要点:根据延迟需求、带宽预算、故障切换需求选择,若目标为广州CN2到台湾优先选择CN2直连或MPLS L3VPN。
1) 双端开通电路并确认光口/网口速率;2) 提供并确认对端的子网(如:对端BGP IP 10.0.0.2/30,本端10.0.0.1/30);3) 配置接口MTU(建议9000或至少1500一致),关闭不必要的中间网元的流控。
链路验收:通过ping、iperf测带宽、查看物理接口错误统计(CRC、丢包),确保无物理层问题后再开始BGP会话建立。
确定会话类型:广州CN2与台湾通常为eBGP。示例(Cisco风格):router bgp 本端ASN;neighbor 对端IP remote-as 对端ASN;neighbor 对端IP description CN2-TW;neighbor 对端IP ebgp-multihop 1(若跨三层,谨慎使用)。
启用keepalive与MD5:neighbor 对端IP password 密码;设置timers:neighbor 对端IP timers 10 30(根据实际情况调整);验证:show ip bgp summary / show bgp sessions。
对入站与出站必须做严格过滤:出站仅宣布你的授权前缀(通过prefix-list);入站设置最大前缀限制(max-prefix)与prefix-list限制,防止对端误发布路由导致路由泄露。
使用AS-PATH、prefix-list和route-map:配置import/export的route-map来设置local-pref、prepend或打上community;启用RPKI/ROA验证或使用IRR做额外保护。
与运营商确认支持的BGP community值与含义(流量工程、黑洞、出口选择等)。在路由发布时打上对应community以便运营商按策略处理。
常见流量控制手段:在本地通过local-pref调整入站路径优先级;通过AS-Path prepend或community请求对端改变返回路径(但需与对端运营商协商)。
台湾侧多为多家骨干互联,确认对端是否通过本地IX或三地交换,注意DNS解析策略、Anycast服务的地理就近问题;若有CDN或公网流量,应测试从台湾到广州的真实延迟与丢包。
跨境法律合规:确认数据传输、内容合规性,必要时在合同中注明应对突发关断与维护的处理流程。
验证步骤:1) 建立BGP后检查路由表(show ip bgp);2) 从两端测试端到端连通性(ping、traceroute);3) 使用bgp route-map做临时策略并观察路由变动日志。
常见故障及处理:BGP无法建立——检查AS/neighbor IP/MD5/TTL;路由不下发——检查prefix-list与route-map;高丢包——排查链路CRC/MTU或运营商侧问题并提出工单。
部署BGP监控:使用SNMP、sFlow、BGPmon或自建脚本定期抓取BGP邻居状态、路由量、抖动。关键项设置告警:BGP邻居掉线、前缀数量异常、路径突变。
备份与演练:配置备份对等(secondary path)并做切换演练,记录切换步骤与恢复步骤,确保在主线路故障时能快速生效。
优化项:调整TCP窗口、MSS(避免分片问题)、开启BFD以缩短会话检测时间、合理配置QoS和队列策略以保障关键流量。
版本与兼容:不同路由器厂商BGP实现细节不同(例如community处理、route-refresh行为),上线前在lab或维护窗口做兼容性验证。
回答:首先检查对端是否确实宣布了前缀(询问对端运营商或用路由查看工具);其次检查本侧的import策略(prefix-list/route-map)是否拦截或有max-prefix限制;查看BGP选路属性(local-pref、AS-PATH)是否导致被本侧策略过滤。
回答:先与对端运营商确认支持的community;若支持可通过打社区请求运营商设置出口策略;若不支持,则可在自己出口对等处使用AS-Path prepend或调整local-pref影响对端路由选择,必要时协调对端或中间运营商配合。
回答:验收清单应包括:物理链路无误(接口速率/MTU/无CRC);BGP会话建立且稳定(持续至少一段时间);正确宣布/接收前缀并通过ping/traceroute验证;完成路由过滤与max-prefix配置;监控告警已就绪并测试故障切换流程。
