2726|8

1万

帖子

2853

TA的资源

管理员

楼主
 

郑州洪灾,通信网络的容灾机制,发挥作用了吗? [复制链接]

这两天,河南郑州等地区遭受罕见的强降雨袭击,出现了严重的洪涝灾害。

 

洪水造成的城市内涝,给当地居民的生命财产带来重大损失。来自现场的触目惊心的视频画面,牵动着全国人民的心。

 

 

目前,一线正在进行紧张的抢险救灾行动。我们只能默默祈祷,希望雨早点停,水早点退,灾区的损失不要进一步扩大,灾区人民的生活能尽快恢复正常。

 

 

作为通信人,小枣君在关注现场灾情的同时,特别留意了一下通信网络设施的损失情况。

 

根据以往的经验,遇到大灾大害,当地的通信基础设施一定会遭受损坏。而可靠的通信网络,是抢险救灾的重要保障,也是稳定一线灾民情绪的基石。

 

也就是说,灾害一旦发生,一线通信人必须尽快投入到通信设备抢修和应急保障的工作中。

 

小枣君的朋友圈里,就已经有河南的通信同行正在加班加点抢修,力求尽快恢复业务。

 

图片来自郑州联通

 

根据现场同行反馈的故障通知消息来看,这次洪灾确实造成了远超以往的危害

 

郑州现场的故障通知消息

 

往常的普通洪灾,一般只会淹没基站和接入机房。更严重一点,也就是各区县的汇聚机房和机楼机房。这次特大降雨造成的内涝,竟然将省会城市部分骨干核心机房也淹了,而且主备机房都发生雨水倒灌。

 

这种情况,极为罕见。近几十年,国内应该是没有发生过。

 

骨干机房,运行着重要的核心网设备。而核心网设备,是整个通信网络的心脏。

 

核心网机房

 

目前来看,受影响最大的,是运营商的HLR设备。

 

HLR,全名是Home Location Register,归属位置寄存器。它是一种用户数据库设备,是核心网关键设备之一,存储着所有本地用户的数据信息,包括用户的基本信息、基本业务信息、补充业务信息,等等。

 

HLR是2G/3G时代的叫法,现在4G/5G时代,HLR已经改名叫HSS(Home Subscriber Server,归属签约用户服务器),功能和性能上有所升级。

 

HLR和HSS,作为用户数据库,是整个通信网络的核心。但凡出现重大网络故障,多半和它们有关。要么是数据库误删,要么是传输中断(例如光纤中断),导致HLR(HSS)链路中断。

 

2017年广西南宁重大网络中断故障,就是运营商HLR的80万用户数据被误删导致的。当时整网业务中断长达8小时39分,影响巨大,责任方被罚5亿元人民币。
 

这次郑州HLR被淹退服(通信行业术语:退出服务),影响本来也是巨大的。但是从现场情况来看,应该是容灾机制发挥了作用,所以没有造成大面积的通信中断。

 

首先,提醒一下河南灾区的兄弟姐妹们,最近期间手机尽量不要关机。因为手机开关机都需要联系HLR进行“登记”。

 

正常情况下

 

在HLR退服的情况下,手机开机,信令消息到不了HLR,就无法得到来自网络的身份确认,也就无法接入网络。

 

HLR退服情况下

 

一般来说,手机连入网络后,网络也会定期对手机进行“位置更新”。也就是说,每隔一段时间,网络会让手机上报状态信息。这次,在灾情发生的情况下,当地运营商可能已经在网络侧手动修改配置,延长了更新周期,避免位置更新失败。

 

此外,本次郑州HLR退服,运营商的异城异地备份方案也发挥了重要作用。

 

在本地主备HLR都受灾的情况下,运营商启用了位于邻近省份省会城市的备份HLR,临时顶替退服的本地HLR,保障业务的实现。

 

 

这基本上算是最高级别的备份了,专门针对战争、恐袭、地震等极端情况。

 

不同的容灾级别

 

在极特殊的情况下,用户通话量激增,网络中信令消息太多,超过了网络链路的负荷,网络侧可能会采取取消用户鉴权等手段,尽可能降低网络信令负荷,避免网络彻底拥塞。

 

本次洪灾,固网宽带接入业务的radius设备离线,就采取了取消鉴权的方法。

 

Radius,全名是Remote Authentication Dial In User Service,远程用户拨号认证系统。看名字就知道,也是一个对用户进行认证授权的设备。现场radius故障,采用的解决方案,就是直接关闭认证,启用拨号不认证策略,保证所有用户网络畅通。

 

 

除了HLR之外,根据现场反馈的情况,微波中继线路也有短暂影响,IPTV业务也受影响,这些都不算太麻烦。

 

目前,现场的通信工程师们正在进行紧张的设备抢修,相信不久之后,核心骨干网络的功能就会恢复。随着洪水的退却,各个站点机房的抢修也会紧锣密鼓地启动起来,老百姓的手机和宽带业务,会逐渐恢复正常。

 

最后,再次祈祷河南地区的雨早点停,洪水早点退,希望大家都平平安安的,也希望所有一线的通信工程师们能注意安全,不辱使命,抢险成功!

 

 

图片来自网络,非郑州灾区现场

 

 

作者:小枣君 

来源:鲜枣课堂   https://mp.weixin.qq.com/s/-FhonJzN52WE0gbdnNEFsg  

此帖出自无线连接论坛
加EE小助手好友,
入技术交流群
EE服务号
精彩活动e手掌握
EE订阅号
热门资讯e网打尽
聚焦汽车电子软硬件开发
认真关注技术本身

最新回复

亲身经历了这场天灾,徒步三个多小时回家,路上水深基本在腰部以上,经历了七十多个小时的断水断电,一切在慢慢恢复,生在中国真的很幸福,即使危难时刻也没有放弃每一个人   详情 回复 发表于 2021-7-23 15:46
点赞 关注
个人签名玩板看这里:
https://bbs.eeworld.com.cn/elecplay.html
EEWorld测评频道众多好板等你来玩,还可以来频道许愿树许愿说说你想要玩的板子,我们都在努力为大家实现!
 

回复
举报

1942

帖子

2

TA的资源

版主

沙发
 

没想到还能造成这么多问题。

此帖出自无线连接论坛

点评

只会更多。我总是在想,我们这些技术,在各种灾难各种需求面前要怎么好好利用。 每个大事的背后都有多少的技术在支持啊  详情 回复 发表于 2021-7-21 18:06
 
 

回复

1万

帖子

2853

TA的资源

管理员

板凳
 
w494143467 发表于 2021-7-21 17:30 没想到还能造成这么多问题。

只会更多。我总是在想,我们这些技术,在各种灾难各种需求面前要怎么好好利用。 每个大事的背后都有多少的技术在支持啊

此帖出自无线连接论坛
加EE小助手好友,
入技术交流群
EE服务号
精彩活动e手掌握
EE订阅号
热门资讯e网打尽
聚焦汽车电子软硬件开发
认真关注技术本身

点评

确实也是,之前公司做的也是救援定位设备,在没网的情况下,只能自组网就起了作用。  详情 回复 发表于 2021-7-21 20:28
个人签名玩板看这里:
https://bbs.eeworld.com.cn/elecplay.html
EEWorld测评频道众多好板等你来玩,还可以来频道许愿树许愿说说你想要玩的板子,我们都在努力为大家实现!
 
 
 

回复

1万

帖子

25

TA的资源

版主

4
 

看新闻报道,网络还是通的,发挥了不少作用。

此帖出自无线连接论坛
 
 
 

回复

1942

帖子

2

TA的资源

版主

5
 
okhxyyo 发表于 2021-7-21 18:06 只会更多。我总是在想,我们这些技术,在各种灾难各种需求面前要怎么好好利用。 每个大事的背后都有多少 ...

确实也是,之前公司做的也是救援定位设备,在没网的情况下,只能自组网就起了作用。

此帖出自无线连接论坛
 
 
 

回复

7671

帖子

2

TA的资源

五彩晶圆(高级)

6
 

天灾人祸,千年一遇,这种情况下网络还能通,说明基建投入在关键时刻的巨大作用。

此帖出自无线连接论坛
个人签名

默认摸鱼,再摸鱼。2022、9、28

 
 
 

回复

1662

帖子

0

TA的资源

五彩晶圆(初级)

7
 

通信系统设计的时候还是考虑到了恶劣天气环境的影响

比如台风,暴雨,冰雹,炎热...

看到网上那些在地铁车厢里乘客站在胸口深的水中的视频就知道通信系统还是相当可靠的

此帖出自无线连接论坛
 
 
 

回复

402

帖子

0

TA的资源

一粒金砂(高级)

8
 

亲身经历了这场天灾,徒步三个多小时回家,路上水深基本在腰部以上,经历了七十多个小时的断水断电,一切在慢慢恢复,生在中国真的很幸福,即使危难时刻也没有放弃每一个人

此帖出自无线连接论坛

点评

平安是福,没事就好。  详情 回复 发表于 2021-7-23 21:48
 
 
 

回复

1万

帖子

2853

TA的资源

管理员

9
 
xxhhzz 发表于 2021-7-23 15:46 亲身经历了这场天灾,徒步三个多小时回家,路上水深基本在腰部以上,经历了七十多个小时的断水断电,一切在 ...

平安是福,没事就好。

此帖出自无线连接论坛
加EE小助手好友,
入技术交流群
EE服务号
精彩活动e手掌握
EE订阅号
热门资讯e网打尽
聚焦汽车电子软硬件开发
认真关注技术本身
 
 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
快速回复 返回顶部 返回列表