第二十二章 地下突围(1/2)
陈浩用了两天半。
比承诺的三天还快了半天。
他基於现有的地下空间信道传播模型,生成了一万两千组模擬数据,覆盖了地铁隧道、地下停车场、地下商场、人防工程四种典型场景。每种场景又按照深度、面积、材质、人员密度等变量做了细分,排列组合下来,数据的多样性比左城预期的还要丰富。
“预训练用这批数据跑了一轮,分类器对地下场景的识別准確率从百分之七十八提升到了百分之八十九。“陈浩把结果投在实验室的大屏幕上,“但还差一截——百分之八十九的识別率意味著每十次有一次判断错误,场景切换时会出现参数配置不匹配的情况,性能还是上不去。“
“差的那一截,得靠真实数据来补。“左城说。
韩哲的回覆在昨天下午到了——蓝湾通信在华夏市东区有一座地铁沿线基站,覆盖了三个地铁站和两段隧道区间,可以开放七天的数据访问权限。但有一个条件:数据採集需要左城团队自己到现场部署採集设备,蓝湾通信只提供基站埠的接入权限。
换句话说,得自己去地铁里采数据。
“我和方泽去。“左城拍板,“陈浩,你留在实验室等数据回来做微调训练。“
十一月二十六號,左城和方泽扛著两箱设备挤进了早高峰的地铁。
採集设备是从林教授实验室借的,加上方泽自己改装的一套可携式嵌入式採集板——巴掌大小,用移动电源供电,能连续记录射频信號的原始波形和基站端的信道状態信息。
他们在东区的三个地铁站分別部署了採集节点。站台上一个、隧道入口一个、站厅角落一个。方泽负责硬体调试,左城负责和基站埠做数据同步。
整个过程比预想的麻烦。
地铁站里的电磁环境极其复杂——除了基站信號,还有列车控制系统的无线电波、乘客手机的射频辐射、ledgg屏的电磁泄露、甚至安检机都会產生干扰。这些噪声叠加在一起,信號环境比实验室里模擬的要恶劣得多。
“模擬数据和真实环境的差距就在这里。“方泽蹲在站台一角调试採集板,额头上渗著薄汗,“模型里只考虑了建筑结构对信號的衰减和反射,没算进去这些乱七八糟的环境噪声源。“
“所以才需要真实数据。“左城在手机上检查基站埠的同步状態,“模擬数据教会分类器地下空间长什么样,真实数据教会它真正的地下空间有多脏。两步缺一不可。“
他们在地铁里待了整整一天,从早上七点的早高峰到晚上十点的末班车。中午饭是在站台上啃的三明治,晚饭是方泽从便利店买的两个饭糰。
左城发现了一个有趣的现象——方泽这个人在日常社交中沉默寡言,但在现场作业的时候话变多了。他会主动指出採集位置的信號盲区、分析不同站台的结构差异对信號传播的影响、甚至和地铁站的保安大叔聊了十分钟,搞清楚了隧道里中继设备的布局。
“你跟设备和现场打交道的时候比跟人打交道自在多了。“左城说。
方泽没否认,只是耸了耸肩:“设备不会说废话。“
晚上十点半,两人扛著设备从地铁站出来,冷风一吹,左城打了个哆嗦。十一月底的华夏市已经入冬了,他穿少了。
方泽从背包里掏出一件皱巴巴的衝锋衣扔给他。
“带了备用的。“
左城接过来套上,没说谢。有些东西不用说。
回到实验室已经快十二点了。陈浩还在等著,桌上的外卖盒子摞了三层,电脑屏幕亮著,分类器的训练框架已经搭好了,就等数据餵进去。
左城把一天的採集数据导出来——总计四千七百组,覆盖了三个站台和两段隧道在不同时段、不同客流量下的真实信道状態。
“够了。“陈浩看了一眼数据量,推了推眼镜,手指已经搭上了键盘。
微调训练跑了一整夜。
第二天早上,结果出来了。
分类器对地下场景的识別准確率:百分之九十六点三。
从百分之七十八到百分之九十六点三,模擬数据预训练加真实数据微调,两步走下来,效果远超预期。
左城立刻把更新后的分类器嵌入场景自適应算法,跑了一组完整的全场景仿真测试。
城市密集区:性能超基准百分之三十八。
高速公路:超基准百分之四十一。
室內覆盖:超基准百分之三十三。
地下空间:超基准百分之三十一。
本章未完,点击下一页继续阅读。