戈壁滩上的辉煌

  • 2024-09-13
  • 回复了主题帖: 【Follow me第二季第1期】01 Ardunio ide环境搭建+ 物料展示 +板载LED点亮

    这个板子支持的开发环境还挺多,不过看大家用cpy的比较多

  • 回复了主题帖: 白露:白露白露,湿湿漉漉

    下一个就是秋分了,可以说是真正的入秋了,秋高气爽啊

  • 回复了主题帖: 【Follow me第二季第2期】开箱+环境搭建+Blink&串口打印

    感觉Arduino UNO R4 WiFi还是挺好玩的,是不是都可以用这个板子进行啊

  • 回复了主题帖: MCU嵌入式C代码编程规范

    这个每个公司有不行的规范,主打一个好观察,好维护,不过个人写就是另外一回事了

  • 发表了主题帖: 《开关电源仿真与设计》-反激式变换器

            反激式变换器是市场上最受欢迎的结构之一。大量的消费产品使用这类变换器,如笔记本电脑适配器、DVD播放器、机顶盒、卫星接收机、显示器、电视接收机、LCD监视器等。三种特性验证了其成功:简单、容易设计和低成本。许多设计者认为反激式变换器具有较差EMI特性、输出纹波大及变压器尺寸大。反激式结构的灵感同样来自于以前的降压-升压变换器,降压-升压变换器传输一相对于输入地为负的电压,电路没有隔离。把电感和功率开关位置交换,可得到类似的结构,但这是相对于输入电压而言的。最后,通过磁心把电感耦合到电源,就得到隔离反激式变换器。副边二极管可以置于接地回路中,或在很多情况下,在正电压回路中。请注意变压器同名端位于反向端,这是典型的反激式结构。         对于隔离降压-升压变换器,首先在导通时间把能量从输入源存储起来。在开关断开期间,电感电压反向,钳位二极管正向偏置,电感电流流向输出电容和负载。然而,由于电感和负载共地,输出电压为负。在反激式降压-升压变换器中,配置一对电感,这有助于通过处理绕组的同名端及二极管的方向来采用所需极性。通过调节匝数比,输出电容端电压可正可负,可高于或低于输入电压。物理上把绕组分离开还起到了电隔离的作用,这是与电源连接的所有主电路所需要的,但要注意所选择的变压器对漏电流的阻断能力。         由于原边和副边电感不同时流过电流,反激式变换器中使用“变压器”一词是不合适的,但在文献中可能是为了清楚起见,普遍使用该名称。真正的变压器工作意味着在原边和副边电感中同时有电流流过,类似于正向变换器。由于这一理由,用耦合电感表示会更严格一些。实际上,反激式“变压器”是当做电感来设计的。         在电子元器件中,变压器的设计和性能受到多种因素的影响。电容效应、漏电感以及副边二极管的电容都是需要考虑的重要因素。特别是在反激式变换器设计中,漏电感的存在可能会导致能量转移效率下降,给设计带来一定困扰。在选择变压器结构时,需要注意漏电感值不能过高,通常应该控制在原边电感值的2%以内。此外,副边二极管的电容也需要考虑在内,特别是在使用肖特基二极管时更为重要。在CCM条件下,副边二极管可能会出现瞬间短路的情况,需要注意这一点。         准谐振反激变换器设计简洁,然而传统CCM反激变换器在副边同步整流(SR)方面的实现效果不佳。为提升效率,设计者可转向准谐振(QR)变换器,其特性在于副边直通电流的消失。QR变换器的工作频率精妙地平衡在原边电感电流的连续与非连续模式边界,促使副边二极管自然关断,从而实现变压器两侧的无损转换。这一工作模式被冠以BCM(边界导通模式)或CRM(临界导通模式)之名。         漏极电压偏移钳位使用低阻抗电压源Velamp,能安全地限制漏极电压幅度, Velamp通过快速二极管连接到高电压输人源。实际上,低阻抗电压源由RCD钳位电路或瞬态电压抑制器(TVS)组成。为了解释电流关系,把Velamp源视为简单的电压源。         求DCM工作条件下的谷点,只要副边二极管导通,就会在原边电感两端出现折算电压并使原边电感电流下降。若新的开关周期到来,而副边电感中仍有电流流过,则原边电感工作在CCM,当开关闭合时整流二极管突然阻断。与二极管的制造技术有关,二极管的突然阻断会造成相关的损耗。如果二极管是PN结型的,折算到原边的电压可视为短路,电流检测元件上出现尖峰电流,直到二极管恢复其阻断能力。         当二极管突然阻断时,出现的振铃波形通常是由于振荡电路中存在的杂散元件,如漏电感、合电容和其他寄生元件所致。为了减少这种振荡现象,可以人为地增加阻尼环路中的欧姆损耗,即增加阻尼电阻值。通过求解与RLC电路相关的简单等式,可以确定适当的阻尼电阻值。可以使用一些速度较慢的二极管,如1N4937或1N4007,该类二极管实际上呈现出相当大的阻断损耗机理,它能对漏电感振铃产生很大阻尼作用并使其消失。瞬态电压抑制器(TVS)只有一个雪崩二极管(记住,低于6.2V有齐纳效应,超过6.2V称为雪崩效应),由于芯片尺寸大,它能吸收高功率脉冲。TVS将钳位漏极的电压偏移,如同钳位电阻所做的那样,驱散所有的功率。TVS动态电阻很小,尽管电流变化大,其钳位电压相当恒定。         反激式变换器传输功率受到限制的主要原因之一是由于存在漏电感(除变压器尺寸外)。可以看到典型的单开关电路中是通过把漏电感储能转输到外部网络来解决这一问题的——能量以热的形式耗散,效率下降。为了在高功率变换器中使用反激式结构,双开关结构可能是一种可行的办法。         有源钳位反激式变换器是目前ATX电源中备受欢迎的选择。相比传统双开关正激变换器,单开关反激式有源钳位提供了一种更高效率和更低成本的替代方案。针对ATX效率要求的提高,认证要求在50%负载时效率达到94%,在20%负载时也要保持在90%以上。有源钳位背后的原理是利用电容存储漏电感能量,以确保功率开关处于零电压开关状态,从而减少损耗。这种技术不仅可以延伸到功率超过150W的场合,还可以增加开关工作频率,减小磁性元件的尺寸。         辅助绕组,作为电源架构中的关键元件,负责在控制器启动后提供稳定的电力支持。典型的电路布局中启动电阻的设计尤为关键。为了缓解漏电感现象,有时会巧妙地融入一个小电阻(如R1)作为缓冲。辅助绕组不仅具备短路保护变换器的功能,还能在待机状态下智能切断电力供应,展现了其双重防护机制。其电压水平紧密关联于控制器性能及所选用MOSFET的特性。尽管现代元件的耐压能力有所提升,能承受30V电压的不乏其例,但多数设备仍以20V的Vos为安全上限。细查MOSFET数据手册,我们不难发现,Rps(on)指标常在10V条件下测量,这意味着在此电压下性能得到优化。若将驱动电压适度提升至12~15V区间(考虑检测电阻压降影响),虽会略增导通损耗,但总体仍在可控范围内。然而,需警惕此举可能导致驱动器功率损耗上升,并影响MOSFET的寿命,因其受驱动电压等多个参数共同制约。         在控制器的反馈信息突然消失时,输出出现短路。在启动阶段,系统工作在开环状态,但尚未实现电压调节。电路一直监控反馈环的工作,因此也具有监控启动阶段的功能。然而,市场上一些控制器缺乏短路保护电路。当输出短路时,这些控制器依赖于辅助绕组电压的消失,使控制器进入保护性脉冲工作状态。理论上,这种方法是可行的。可惜的是,漏电感会破坏电源绕组和辅助绕组之间的耦合。         反激式变换器在消费市场上最受欢迎。设计者要注意漏电感、半导体器件电压、副边二极管阻尼、副边电容有效电流、电流模式设计、仿真、低待机功率技术和最大功率失控点。

  • 发表了主题帖: 《开关电源仿真与设计》-变换器前端电路

    整流桥         离线电源作为一种DC-DC转换器(涵盖反激式与正激式技术),其核心运作源自输入电压经整流后的直流电能供给。此直流电压源自正弦交流电的完美整流,交流电的极性在每秒内以50或60次的频率更迭,具体取决于所在地区的电网标准。为应对广泛的应用需求,普遍采用全波整流模式,其效能远超仅适用于低瓦数场景(数瓦级)的半波整流。在单相离线电源系统中,全波整流器被誉为“格里茨桥”,巧妙地运用四个二极管构建起整流桥梁,确保了电能的高效转换与利用。         整流后的电压为后端变换器,特别是反激式变换器提供必要的电能供给。为简化分析流程,我们可将此闭环变换器理想化为一个电流源,根据输入电压的极性变化,两个二极管会同时导通,从而在给定电流条件下引发两倍压降的产生。当电源极性反转时,电流流动的路径变化:它要么流经D1和D4,要么流经D3和D2。因此只要电源电压超出滤波电容电压与两个正向压降之和,滤波电容便会开始充电,直至达到正弦电压的峰值。充电开始的时刻t亦随之确定。         选定滤波电容,其设计需适应特定的输入电压范围。若输入电压低于临界值,转换器可能过热或陷入失控的不稳定状态。滤波电容的关键作用在于稳定电压波动,防止DC-DC转换器输入电压的骤降。考虑到电容的规格与成本,所选电容无法完全维持峰值电压恒定,滤波电容电压将逐渐降至设计者预设的Vmin,该值通常设定为最小输入电压峰值的25%至30%之间。二极管全部阻断情境下,电容作为电源向转换器供电的情形,电压与电流方向一致。在二极管截止期间,电容放电的环路电流可通过特定表达式分析,其放电时长等同于总电源周期的一半减去二极管的导通时间t。深入剖析,二极管的导通时间则是电源周期的四分之一减去电压降至Vmin所需的时间。         电容的有效电流考量,虽然电容值计算的精准性。然而在实际应用中,电容的最终选定仍需紧密围绕其有效电流值这一核心要素展开。同样地,这一原则也贯穿于滤波电容的选型过程中。         保持时间是指当输入电源突然中断(例如,因瞬时电源故障)时,电源能够维持标称功率输出的持续时间。为评估此性能,测试过程涉及在输入电源跨越零电压点的瞬间切断电源,并监测滤波电容电压的衰减情况。在此特定时间段内,电源将失去调节能力,其输出电压将逐渐降至零。同时,电源内置的保护机制将适时介入,防止在低电压状态下对电源造成损害。         在电源阻抗为零的理想状态下,滤波电容充电时波形保持不失真。然而,实际情况下,输入电源通过整流电路接入,整流器具有特定输出阻抗,且此阻抗受多种设施如电动机、光镇流器、电冰箱等共享同一分布网络的影响,使得电源阻抗预测变得复杂。此外,变换器中串联的EM1滤波器进一步影响整流桥的驱动阻抗。Intusoft公司在简报3中提出了一个简化的局部电源模型,由电阻与低值电感构成。在此模型下,充电电流峰值会导致电源电压下降,形成凹陷,人为增加电源阻抗的输入电源EMI滤波器同样能产生此类波形效果,有效抑制峰值电流,进而减少滤波电容的实际电流负担。         浪涌电流现象解析:电源初通时,整流器初次接入,滤波电容处于完全放电状态。此时,二极管桥因电容放电而暂时短路,引发巨大充电电流。若滤波电容容量大,此电流尖峰足以触发电源保护机制,甚至损害整流二极管。部分厂商已设定最大浪涌电流限制,以应对用户在电源峰值时接入变换器的极端情况。评估浪涌电流时应避免自耦变压器介入。         完成前端整流电路的电源设计后,最佳实践是在温控环境中,如设定至最高工作温度50℃,进行性能测试。此时,需加载最大电流并借助继电器接入最大输入电压,继电器由低频脉冲方波发生器精准控制,确保导通时长可调并维持数百毫秒,而断开时间则足以让滤波电容彻底放电。测试应采用低阻抗交流源,避免使用自耦变压器,因其电感特性会削弱浪涌脉冲,虽能间接保护二极管桥和滤波电容,却偏离实际工况。测试应持续数小时,并涵盖低输入电压条件,以全面评估电源性能。此外,进行老化测试同样关键,即在恒定电压下无继电器介入,连续运行超过100小时(通常为168小时),以暴露并检验潜在的设计缺陷。若电源历经此系列严苛测试仍表现稳定,则标志着设计者在裕度考量上的深思熟虑与成功实践。 电压倍压器         20世纪70年代,电压倍压器在电源难以适应宽泛输入电压范围的背景下广泛应用,尤其是那些不具备通用输入能力的系统。通过电压选择器,系统能够灵活切换至117V或230V的有效电压源,而倍压器则能在这些电压下稳定输出电压,为电路效能带来显著提升。然而,错误地设置选择器位置可能引发严重故障,强调了操作准确性的重要性。 时至今日,倍压器在低压环境如美国和日本仍占据一席之地,其通过提升整流后的直流电压,有效降低了变换器的平均及有效电流,显著减轻了变换器的运行负担。倍压器电路巧妙地仅采用二极管桥中的两个二极管,这一设计在倍压工作模式下尤为合理,因为D2或D1的导通会分别导致C1和C2的短路,从而实现了电压的倍增效果。 功率因数校正         本节将介绍无源和有源功率因数校正的概念。详细讨论最受欢迎的拓扑设计之边界升压功率因数校正(PFC),通常,全波整流器中电容的存在会在交流输入源峰值附近产生输入电流尖峰。负载只在很短时间内从电源中获取能量,此时滤波电容重新快速充电。计算显示大有效电流主要是由这种幅度大而窄的尖峰电流产生的。 功率因数校正之所以将功率因数细分为失真与相角两部分,其背后蕴含着深刻的必要性,调整功率因数显得尤为关键。         位移因子:这一因子聚焦于输入信号间的相位差异,常以cosp(功率因数)的形式呈现。留意家用电器如洗衣机、光镇流器的铭牌,不难发现cosp值需达到一定标准,如在法国便设定为0.8。低功率因数,即cosp值偏低,意味着实际工作中产生了远超必要量的有效电流。这股“过剩”的电流在电网中流淌,迫使电力公司不得不扩建配电网络以应对。尤为值得注意的是,部分国家电力公司每年需向终端用户无偿提供超过限额的无功功率,加剧了电力负担。         失真因子:其与功率因数的紧密联系不容忽视。在全波整流器等场景下,失真因子逼近极限,而高电流失真直接导致功率因数下滑。设想一个场景,数百台未经校正的计算机在同一建筑内运行,其产生的谐波成分丰富,这些失真电流如同无形之手,引发谐振现象,不仅侵扰电动机,致其发出异响,还可能对敏感设备构成干扰,影响广泛。 谐波限制         国际委员会制定了对于4种类型的一系列谐波幅度限定标准。限定条件列在表6.2中,来反映标准中对各个阶次谐波的要求。如果THD得出的谐波成分是理想的,则直到第39阶的单个谐波的评估只能使用测量的方法,以便确定设备是否通过了测试。         无源滤波器常见于经济型的ATX电源设计中,其内置的庞大电感安装于坚固的金属底座上,显著增加了电源的整体重量。尽管如此,电感的应用也带来了电路设计的局限。相较于无电感的标准电源架构,后者能凭借滤波电容构建低阻抗路径,有效缓冲输入电压的急剧波动,从而遏制整流桥二极管电压的攀升。然而,当电感被引入整流环节,二极管桥的负荷因电感效应而加剧。面对电源中的电压尖峰,这些尖峰因失去原有的低阻抗通道而无法迅速消散。此时,滤波电容需通过电感间接获取能量,导致二极管桥输出电压急剧上升。极端情况下,这种电压激增可能触发整流器的雪崩效应,进而造成设备损坏。         填谷式无源校正器,作为解决无源校正器中庞大电感难题的创新方案,由Jim Spangler与A. Behara在文献[14]中率先提出,随后在K. Kit Sum 1997年的文献[15]中得到了详尽的完善。一个由双电容与二极管阵列精妙构建的电路。在充电阶段,电容以串联模式工作,有效降低了所需电容容量;而放电时,则转变为并联模式,通过D与Ds迅速释放能量。De则巧妙地扮演了屏障角色,防止C2通过C1路径非预期放电,确保了电路的高效稳定运行。         无源功率因数校正虽以经济高效之姿符合IEC 1000-3-2标准,然其弊端亦不容忽视:庞然大电感徒增电源之重负,体积与质量双双攀升;尽管谐波得以抑制,电流却仍滞后电压,功率因数不升反降;较之标准全波整流,输出电压略显逊色,且随输入波动而起伏不定。反观有源功率因数校正,其优势显著:能稳固维持功率因数于高位,近乎k与k'合一之境;更兼调节输出电压之能,有效减轻乃至消除下游变换器应对宽输入范围之压力。预调节器化身PFC电路核心,与dc-dc变换器携手共舞,后者则担当隔离(视需求而定)与调速作用。         升压变换器是有源功率校正中最常见的电路结构。竞争力强的拓扑包括降压变换器、SEPIC和反激式变换器。PFC电路可分为恒定导通时间边界模式和固定频率连续模式。BCM技术适合于反激的PFC,功率可达300 W。CCM模式允许在超过千瓦功率的电源中使用PFC。分析控制规律无须检测整流包络,内部有控制电路产生功率因数校正。         迟滞PFC变换器的独特电路架构,显著区别于传统设计,它摒弃了内部时钟机制。该电路的核心在于,控制器依据功率开关的运作直接调控电流的峰值与谷值。具体而言,功率开关保持开启状态,直至电感电流攀升至预设的峰值点,随后迅速切断。随着电感电流的回落,一旦触及设定的谷值门槛,功率开关便重启导通周期。为了实现与整流电压包络的紧密追踪,电感电流的波动范围(峰值至谷值)始终处于动态调整之中。然而,在接近0V的电压区间内,这种波动幅度的缩减却意外导致迟滞频率急剧攀升,进而加剧了开关过程中的能量损耗。尽管此电路以其简洁性著称,但广泛而频繁的频率变动却成为限制迟滞变换器广泛应用的瓶颈。         升压变换器在恒定导通时间和固定频率下运行,有效执行功率因数校正,但相较于BCM同类电路,其性能存在显著失真,典型的电压模式结构,该设计因恒定导通时间的特性而无需高压检测,从而简化了系统。为保持简洁,此处省略了峰值电流检测环节,但需注意,在过流情况下,该电流可能触发电源锁存器复位。         反激式拓扑在全球电源设计中占据高达80%的份额,尤其在消费市场中尤为显著。PFC电路不仅实现了变压器隔离,还传输了灵活的直流调节电压。紧随其后,非隔离的下游降压变换器迅速响应,高效完成dc-dc转换任务。在反激式变换器中,构建PFC的最简化策略是采用电压模式控制,这是一种恒定导通时间、固定频率的非连续工作模式。此类无高压检测的反激式电源设计,其低Cin值设计巧妙,有效滤除了PFC过程中产生的微分噪声,确保了电源的稳定性和纯净度。验证反激式变换器作为PFC(功率因数校正)装置效能的最直接且高效途径,莫过于采用平均模型进行评测。此模型以其极快的仿真速度著称,能够迅速洞察电路的稳定性状况。

  • 2024-09-12
  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》13、多传感器融合 SLAM

            鉴于各传感器的工作特性及其局限性,单独依赖一种或两种传感器在复杂路况下往往难以确保高精度定位。例如,激光里程计在隧道、高架等环境下易受影响,而IMU与轮速计则受限于累积误差,难以独立提供可靠位置信息。GPS在特定场景如立交桥、隧道及高楼密集区则常遭遇信号丢失问题。视觉里程计则受天气、光照及动态环境变化影响较大,其稳定性亦受挑战。当前学术界与工业界正致力于通过多传感器融合技术,实现高精度、稳定且实时的定位解决方案。多传感器融合SLAM主要分为松耦合与紧耦合两大类别,其中紧耦合方式因能更充分融合各传感器信息,成为研究重点。         在紧耦合领域,已有多种创新算法涌现。如X.Za0等人在IROS 2019上提出的LIC-Fusion算法,基于MSCKF框架实现了激光雷达、IMU与相机的紧密协作。牛津大学D.wi油团队则依托因子图框架,融合了激光里程计、视觉里程计与IMU预积分因子,实现了高精度定位。香港大学Mars实验室更是在此基础上,提出了RLIVE与R'LIVE算法,通过结合滤波与平滑优化技术,进一步提升了激光雷达、IMU与相机的融合定位精度与建图能力。为满足L4级智能驾驶等高级应用场景的需求,学者们还探索了结合高精点云地图的全局定位方法。百度团队通过误差状态卡尔曼滤波框架,实现了激光雷达、GNSS、IMU与先验点云地图的深度融合,实现了厘米级定位精度。图森未来则进一步挑战极限,尝试在无激光里程计的情况下,仅凭轮速计、IMU与先验点云地图,实现了无人物流卡车的高精度全局定位。在此背景下,特选激光雷达+IMU+视觉组合定位中的RPLIVE算法,以及图森未来在ICRA 2021上提出的基于激光雷达特征地图辅助的多传感器紧耦合定位算法进行深入探讨,以期洞悉其背后的原理与技术创新。 视觉、激光雷达、IMU融合的RLVE算法         RLVE算法,源自香港大学Man Li等人在IROS 2021的卓越贡献,是一种创新的实时传感器融合SLAM算法。该算法巧妙地将激光雷达、相机与IMU紧密集成于一个高效预处理模块中,随后通过现代优化技术实现精准定位与建图。Li团队凭借三种传感器的深度协同,使RLVE能够从容应对视觉失效及激光雷达里程计挑战,室内外测试中均展现出卓越的性能与成果。算法的核心流程清晰分为两大板块:里程计模块与因子图优化模块。里程计模块依托于先进的误差状态卡尔曼滤波框架,无缝融合激光雷达、相机与IMU数据,初步估算系统姿态,并分别针对各传感器特性进行优化输出。其独特之处在于,通过误差状态空间的迭代更新策略,将问题转化为最大化后验估计,运用高斯牛顿法高效求解。在激光雷达处理上,采用平衡特征点提取与运动补偿技术;相机端则运用快速角点提取与KLT光流跟踪,确保视觉信息的精确捕捉。为进一步提升视觉测量的精准度,因子图优化模块引入动态滑窗机制,对视觉地标、关键姿态及传感器间的时间偏差进行精细调整与优化,从而构建出更加精确与鲁棒的环境地图。RLVE解法以其创新的理念与卓越的性能,为SLAM领域树立了新的标杆。         在智能驾驶任务中,高精度要求促使我们实时结合激光雷达、相机及IMU等传感器,以确保在复杂环境中,如隧道、桥梁等GPS信号受限的区域,定位算法的精准度、实时性和鲁棒性。为了实现长距离的绝对定位,学界提出并应用了基于多传感器紧耦合的定位算法(Tightly-Coupled Multi-Sensor Localization, TCML),这一创新在RA2D1会议上得以展示。TCML算法构建于因子图优化框架之上,巧妙地将IMU数据、轮速计信息与激光雷达点云地图的融合转化为一个优化问题,利用固定延平滑(fixed-lag smoothing)技术求解。具体而言,算法中,激光雷达点云与预先构建的地图特征相匹配,实现了对车辆全局位姿的估计;同时,结合车辆运动学模型和轮速计数据,精准捕捉车辆局部时刻的相对位姿变化。两者相辅相成,共同约束车辆状态的最优估计。         图13-5清晰展示了TCML算法的整体流程,其关键传感器包括轮速编码器、IMU和激光雷达,而一张精细的激光雷达特征地图则是算法不可或缺的外部数据源。轮速编码器负责提供车辆速度的直接观测,IMU则用于计算帧间相对位姿变化,并作为系统状态的初步估计。激光点云在IMU校正运动畸变后,与地图特征精准匹配,从而得到系统位姿的精确估计。最终,TCML算法通过局部滑窗内的因子残差最小化,实现了传感器信息的紧耦合优化,采用固定间隔平滑策略,迭代提升系统位姿估计的精度,详细过程如图13-6所示。利用激光雷达、IMU与轮速计等多源传感器的紧密集成,实现长距离、高精度且鲁棒的实时定位技术。为缩减点云处理时间与计算负荷,TMFL算法巧妙地从密集点云地图中筛选稀疏特征点,并通过每帧激光点云的均匀采样策略,精简特征匹配点数量,同时确保定位精度不受损。在因子图优化框架下,该算法融合激光雷达特征、IMU预积分及轮速计速度信息,对车辆状态进行联合优化,并运用固定后平滑策略,简化优化难题,加速算法响应。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》12、激光雷达 +IMU组合定位

            激光里程计算法,仅凭激光点云估算激光雷达的运动状态,其精度显著受激光点云质量波动影响。IMU(惯性测量单元),作为广泛应用于机器人及汽车领域的传感器,集成了陀螺仪与加速度计,能精确捕捉并输出被测物体的角速度与加速度信息,进而通过积分运算推算出其在一定时间内的姿态与位置变化。然而,IMU在实际运作中易受多种干扰因素影响,尤其是加速度计的误差会随时间累积,导致导航精度下降。因此,常需借助外部信息融合策略,以强化IMU的定位精度。鉴于激光里程计依赖低频的环境感知进行定位,而IMU则通过高频的自身运动状态积分进行位姿估计,两者在功能上存在天然的互补性。众多学者因此致力于将激光里程计与IMU相结合,以实现高精度、实时性的定位。根据融合方式与原理的不同,这一领域的研究被细化为LiDAR+IMU松耦合与紧耦合两大方向。         激光雷达与IMU的松耦合定位策略,巧妙融合了激光里程计与IMU航位推算技术。两者独立运作,依托卡尔曼滤波、粒子滤波等先进框架,实现精准信息融合,最终精确输出定位结果。2019年,国助科技BXue团队创新性地提出IMU-AHFLO算法,该算法凭借点线特征或点云分布特征匹配的激光里程计,捕捉车辆在两帧点云间的位姿变化,随后,高频IMU数据携手车辆运动学方程,预测上述时刻的位姿变迁,最终,卡尔曼滤波器精准估算车辆新姿态。南昌大学的廖杰华则另辟蹊径,将LOAM算法与自适应粒子滤波技术巧妙结合,专为无人物流小车打造室内定位新方案。而Google的Cartographer算法,更是以分层优化为核心,前端运用无迹卡尔曼滤波器实现2D激光雷达与IMU数据的无缝融合,后端则聚焦于子地图构建与优化,辅以分支定界法,显著加速闭环检测,确保定位系统的高效与精准。         激光雷达与IMU的紧耦合定位技术,相较于松耦合方式,显著减少了信息损失。这一创新方法将激光雷达与IMU数据融合于同一位姿优化问题中,实现了更为精准的位姿估计。紧耦合定位策略可细化为基于滤波器与平滑优化两大流派。基于滤波器的方法,在状态更新中无缝整合多源传感器数据,如H. Sebastian等先驱者利用自适应扩展卡尔曼滤波器,成功将3D激光雷达与GPS/INS融合,赋能无人小车室外精准导航。然而,滤波器固有的线性化近似与递推机制,随时间推移易累积误差,影响长期定位精度。为克服此局限,香港科技大学机器人与多感知实验室的C. Qin团队在ICRA 2020上隆重推出LINS算法,该算法采用迭代误差状态卡尔曼滤波器,深度融合激光雷达与IMU数据,通过持续校正系统状态误差,实现了车辆实时、高精度的定位与建图,为紧耦合定位技术树立了新的里程碑。         MU-AHFLO 算法:聚焦于LDAR+IMU融合策略中极具代表性的IMU辅助高频LDAOdmery(简称MULAHFLO)算法,深入其量测与融合机制。相较于紧密耦合方案中复杂的IMU预积分与因子图等理论框架,基于EKF的长时耦合模型展现了其简洁性。为深化理解,本节将细致剖析wXur等人在MULAHFLO算法中的公式推导精髓。核心目标是融合IMU与激光雷达数据,以精准捕捉车辆的实时位姿信息。为此,首要任务是明确求解流程中不可或缺的三个坐标系定义,具体构建如图12-1清晰展示。此步骤为数据融合奠定了坚实的理论基础,确保后续处理能够精准无误地跨越不同坐标空间,实现高精度的位姿估计。         IML-AHFLO算法:聚焦于IML-AHFLO算法,深入剖析了IMU与LiDAR如何通过卡尔曼滤波框架实现松耦合定位的精妙机制。鉴于IMU与LiDAR在车辆位置计算上的原理迥异,其失效模式亦不相同,因此,二者的融合策略巧妙地弥补了各自的不足。具体而言,鉴于IMU/轮速计数据的高频特性与激光里程计的低频特性,IML-AHFLO算法巧妙地利用IMU/轮速计数据结合车辆运动状态方程,对车辆位置进行前瞻预测,并借助激光里程计的输出作为观测依据,最终通过卡尔曼更新流程,精准地估算出车辆的后验状态。然而,此松耦合策略虽原理简明且易于实现,但在高效利用IMU与LiDAR数据方面略显不足,且IMU测量误差的累积效应可能削弱算法精度,此时,IMU与LiDAR的紧耦合定位策略便显得尤为重要。         WO-SAM算法:由麻省理工学院T.Shan等人在2020年匠心独运的杰作。LIO-SAM旨在依托因子图优化框架,实现激光雷达、IMU与GPS的实时、稳定且高精度的融合定位,其开源代码已在GitHub上开放共享。为深入理解该算法,我们需先掌握因子图优化与IMU预积分技术的基础理论,随后再逐步揭开LIO-SAM算法的神秘面纱。         因子图优化:因子图,这一无向概率图的杰出代表,源自Kschischang等人在信道编码领域对Tanner图、Wiberg图等模型的深刻洞察与创新。因子图以其独特的因式分解能力,将复杂系统的全局函数拆解为多个简洁的局部函数乘积,并通过“和-积”算法清晰地勾勒出系统状态变量间的信息传递脉络。在统计推断、译码编码、实时定位等多个领域,因子图均展现出广泛的应用价值。其结构由变量节点与因子节点构成,二者通过无向边紧密相连,共同编织出系统状态的精密网络。在SLAM领域,因子图更是以其独特的优势,助力我们更高效地解析与定位复杂环境。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》11、激光里程计

            里程计,作为激光雷达导航、定位与地图构建的核心基石,通过连续追踪与匹配激光点云数据,精准估算车辆的运动轨迹。这一过程不仅深刻体现了机器人学领域的智慧结晶,更与测绘学中的点云拼接技术遥相呼应,尽管两者目标各异——前者旨在通过跨时空的点云对齐,揭示车辆姿态的微妙变迁;后者则聚焦于构建统一坐标系下的点云图景。         图11-1直观展示了这一原理的精髓:随着激光雷达随车辆穿梭,静态路标在雷达坐标系中的映射随之舞动,而正是这些动态变化的捕捉与解析,构成了激光里程计算法的核心逻辑。以特定时间窗内的运动求解为例,通过对比不同时刻同一路标在雷达坐标系下的位置变迁,反推雷达乃至车辆的移动轨迹,这一过程巧妙融合了空间旋转与平移的几何变换,最终汇聚成车辆运动轨迹的连续画卷。进一步地,基于海量路标点的数据支撑,我们得以构建一系列非线性方程,借助高效算法如非线性最小二乘法,精确求解出车辆在每个时间节点的位姿变化。这一过程循环往复,直至覆盖整个行驶周期,结合激光雷达的外部参数校准,最终绘制出车辆在真实智能驾驶场景下的精确轨迹图。在智能驾驶的广阔舞台上,点云扫描匹配技术已绽放出多样风采。依据不同的匹配策略与算法设计,该技术可细分为四大流派:原始点云直接配准、特征点引导的扫描匹配、基于点云分布特性的匹配方法,以及前沿的深度学习驱动方案。每种方法各有千秋,共同推动着智能驾驶技术的不断前行。 基于特征点匹配的LOAM算法         聚焦于LOAM算法——这一由卡内基·梅隆大学的杰出学者Andrew J. Davison与Sanjiv Singh在2014年精心打造的激光里程计与建图杰作。LOAM在KITTI数据集上的卓越表现,彰显了其非凡的实力。该算法巧妙地从点云数据中提炼出标志性的角点和平面点,         LOAM的运作流程如图11-2所示,展现了其严谨而高效的架构。在t帧时刻,系统捕获激光雷达的原始点云数据后,首先利用激光点的广义曲率特性,精准筛选出角点和平面点。随后,借助IMU/里程计数据的辅助,对帧内激光雷达的运动进行初步预估,并通过插值技术消除点云中的运动畸变。紧接着,将处理后的特征点与前一帧的特征点进行精细匹配,精确计算出两帧间的激光雷达运动变化量。这一过程中,运动信息以每秒10次的频率传递给位姿变化集成模块,确保实时性与准确性的平衡。同时,无偏差的特征点点云及运动变化量则以每秒1次的频率进入激光点云建图模块,为构建精准的点云地图提供坚实支撑。此外,LOAM算法还以每秒1次的频率执行点云帧与点云地图的匹配操作,其输出的位姿信息被送入位姿变化集成模块,对里程计输出的位姿进行校正,从而进一步提升位姿估计的鲁棒性和精确度。LOAM算法以其独特的特征点匹配策略、高效的数据处理流程以及卓越的位姿估计能力,在激光里程计与建图领域树立了新的标杆。         LOAM这一激光里程计与建图的标杆算法,其激光里程计模块精妙地从原始点云中萃取边缘与平面特征点,实现帧间特征点的精准匹配,并借助线性最小二乘优化策略,精准计算出激光雷达在连续扫描间的位姿变换。而建图环节,LOAM更是独树一帜,通过帧与点云地图或子地图与全局地图的紧密匹配,对里程计位姿估计进行精细校正,显著提升了定位精度与建图质量。LOAM算法不仅自成体系,更为后续激光SLAM及多传感器融合SLAM的演进铺就了坚实的基石,值得每一位研究者深入探索与领会。         NDT算法:基于点云正态分布特征的匹配注册,NDT(Normal-Distributions Transform)算法,由Biber与Straller在2003年针对2D点云配准提出,其独特之处在于摒弃了ICP等传统算法的点对点匹配方式。NDT首先将点云数据栅格化,随后利用概率密度函数(PDF)描绘点云的分布特性。通过匹配两帧点云间的分布信息,NDT能够高效计算出激光雷达在两帧间的位姿变换。Magnusson等人在后续研究中成功将NDT算法扩展至3D点云配准领域,实现了激光雷达的3D位姿变换。NDT算法的核心在于其概率分布表征方法,它不仅限于正态分布,任何能在局部准确反映点云结构且对异常值具有鲁棒性的PDF均可尝试。这使得NDT算法在计算开销与稳定性上相较于ICP等传统算法展现出明显优势。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》10、基于 3D 激光点云的多目标跟踪

            多目标跟踪中的检测后跟踪(Tracking-by-Detection)方法,其核心在于利用当前帧与先前帧的目标检测结果进行匹配。该方法架构由数据关联与滤波器两大模块构成。数据关联模块负责解决跨时间点的目标匹配难题,而滤波器模块则专注于目标的运动状态预估与轨迹更新。在数据关联方面,业界广泛采用的方法包括多重假设跟踪(MHT)、匈牙利算法(Hungarian Algorithm)、联合概率数据关联(JPDA)及全局最近邻(GNN)等。至于滤波器,卡尔曼滤波器与粒子滤波器则是最为常见的选择。ABJDMOT算法,作为这一领域的创新之作,巧妙地将匈牙利匹配与卡尔曼滤波器结合,以应对3D MOT挑战,其在性能上的显著提升赢得了工业界的广泛青睐。然而,ABJDMOT在4D(即加入时间维度的三维空间)匹配时,仅依赖于目标矩形框的3D重叠度,这在某些情境下可能导致前后帧间无重叠部分的目标被遗漏。为解决此问题,斯坦福大学与丰田技术研究院于2020年推出了PDMOT算法,该算法引入马氏距离作为匹配依据,结合匈牙利算法,旨在进一步提升算法性能。此外,学者们还不断探索在匹配过程中融入更多特征信息,如目标的几何尺寸、朝向、外形等,以增强匹配的准确性。例如,H.Wa等人的研究便是在此方向上的一次有益尝试。         针对多目标跟踪(MOT)领域,一些学者聚焦于改进基于轨进片段(tracklet-based)的方法,指出传统检测驱动的多目标跟踪算法过度依赖目标检测的性能,忽视了目标历史信息的有效利用。为此,他们探索了利用多帧点云序列或轨进片段,结合深度学习技术来提取目标的独特特征,旨在实现端到端的多目标跟踪解决方案。例如,在UCAI会议上,H.Wa等人提出的PC-TCNN算法便是这一思路的杰出代表。该算法创新性地从点云序列中初步生成候选轨进片段,随后对这些片段进行精细化处理,并通过将精细化的轨进与先前片段相关联,有效实现了对目标的连续追踪。相较于基于检测的3D MOT算法,此类基于轨进片段的方法往往能取得更高的跟踪精度,但在实时性方面仍有待进一步优化和提升。         在2020年的OS会议上,针对3D多目标跟踪问题,基于经典的2D图像目标跟踪算法SORT,创新性地提出了ABJDMOT算法。该算法聚焦于目标跟踪的精确性,通过采用向量匹配策略,有效对比当前帧与历史帧中目标的数据,并借助卡尔曼滤波在多维空间中精准估计目标的运动状态。ABJDMOT算法展现出卓越的性能,据统计,在多个基准测试中,其平均运行精度高达207 APPS,同时在多目标跟踪准确度(MOTA)方面亦表现优异。ABJDMOT算法的整体架构其核心流程包括五个关键步骤:首先,从目标检测模块获取当前帧(t时刻)目标的位置、大小及特征信息(A);随后,利用历史帧(t-1时刻)中各目标的运动信息,通过卡尔曼滤波预测其在当前帧的潜在状态(B);接着,通过数据关联模型,将当前帧的检测结果与卡尔曼滤波预测的目标状态进行匹配(C);对于成功匹配的目标,采用卡尔曼滤波的更新步骤,以获取其最新的运动状态估计(D)。这一过程确保了ABJDMOT算法在复杂场景下的高效与准确。         SimTrack,一种基于tracking-by-detection理念的3D多目标跟踪算法,当前在工业界占据核心地位。然而,其高度依赖即时的目标检测结果,且目标跟踪信息对检测优化的反馈不足。此外,匹配步骤复杂,需人工定制匹配规则并精细调整阈值与参数。SimTrack的运作流程,其核心在于利用多帧点云作为输入,通过基于柱状体素或普通体素的骨架网络提取特征,生成伪BEVs图像。随后,网络输出分化为三个关键分支:混合时间中心图分支用于定位目标在多帧点云序列中的首次出现位置,运动估计分支负责估算目标运动偏移,而回归分支则专注于获取目标的详细尺寸与姿态信息。在推理阶段,SimTrack凭借先前混合时间中心图中的位置信息与运动预测,预判当前各目标的可能位置,并与最新混合时间中心图进行关联,实现精准的目标跟踪与检测。SimTrack通过混合时间中心图创新性地整合了多帧点云中的目标信息,实现了目标的自动化匹配、消失目标的智能剔除与新生目标的即时检测,彻底摒弃了传统跟踪方法中的复杂启发式匹配步骤。这一创新不仅简化了跟踪流程,更为我们未来的研究与实践开辟了新的思路与方向。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》9、基于 3D 激光点云的路沿检测

            本章聚焦于基于3D激光点云技术的路沿检测,此模块在后续的道路结构剖析、行驶区域界定、路径策略规划及车辆精准定位中均占据核心地位。当前,路沿检测的技术路径主要分为两大阵营:一是依托人工精心设计的规则,二是凭借深度学习网络的智能识别。         人工规则驱动的路沿检测:在激光雷达应用的初期探索阶段,路沿检测主要依赖人工定义的规则。这一过程细致划分为四个关键步骤:特征点的精准捕捉、左右两侧特征点的科学分类、噪声点的有效剔除以及路沿轮廓的精准拟合。为了提升路沿检测的稳定性,减少帧间波动,研究者们巧妙运用了多帧点云的累加技术,并引入了滤波与跟踪机制以优化拟合曲线的参数。这些算法的核心在于利用预设的几何规律来锁定路沿特征点,如S.Peng和K.等人通过分析激光点间的高度差与坡度变化,A.Y.Hr等则着眼于线束间激光点的空间关系,而Y.Zhang等则创新性地结合了激光雷达的特定参数。在特征点分类环节,左右路沿的准确区分对于提升拟合精度至关重要。D.Zai等利用超体素与车辆行驶轨迹的结合,实现了特征点的左右分类;S.XuP则提出了least-cost path模型,尽管需手动设定参考点,限制了其实时性。而基于聚类的方法虽能自动分类,但计算复杂度较高。Y.ZhangJ提出的双层波束模型,通过识别道路走向与交叉口,有效提升了分类效率,并被G.Wang等进一步优化应用。         噪声过滤与曲线拟合:为确保路沿曲线的准确性,需对特征点进行噪声过滤。常用的方法包括基于横向距离或RANSAC算法的筛选,随后利用Kalman滤波或粒子滤波技术对拟合曲线进行平滑处理。此外,高斯过程回归以其强大的抗噪能力和优异的曲线拟合性能,在参考文献[1]和[7]中得到了成功应用,为路沿曲线的精确表达提供了新思路。         传统基于人工规则的路沿检测方法,受限于固定的特征点提取与参数设定,难以应对复杂多变的真实驾驶环境与多样的路沿形态,难以满足现代感知系统对精准度与灵活性的追求。其繁琐的多步骤流程更是制约了算法的实时性能。然而,随着深度学习在视觉与激光技术中的蓬勃兴起,一场路沿检测的革命正悄然发生。学者们纷纷探索深度学习的力量,旨在通过3D激光点云实现路沿检测的端到端解决方案。Uber的J. Lian团队在2019年CVPR会议上提出的卷积递归网络,便是这一领域的璀璨明珠,它巧妙融合高精度地图中的点云与图像信息,实现了路沿检测的自动化与智能化。         基于人工规则的 SAT-LRBD 算法:吉林大学的G.Wang团队,融合多重路沿特征点萃取规则与噪声点剔除技术,创新性地提出了SAT-LRBD算法,即一种在激光雷达数据基础上,兼顾速度与精度的道路边界检测方案。此算法在遵循人工规则的路沿检测方法中脱颖而出,展现出卓越的检测精准度。在ITTI数据集上的测试中,SAT-LRBD每帧激光点云的处理时间仅需70.5毫秒,高效而迅速。SAT-LRBD算法精准执行3D激光点云的初步分割任务,将复杂点云数据巧妙地划分为地面点集(nd)与非地面点集(off-ground),为后续处理奠定坚实基础。在此算法框架内,地面点集特别贡献于路沿候选特征点的甄选,而非地面点集则作为重要辅助,深化对道路结构的洞察,包括十字路口布局、路段识别的精准解析。整个流程精心划分为三大环节:第一步,依据预设的几何特征参数,从地面点集中精准提炼出路特征点;第二步,巧妙运用道路分割线技术,结合非地面点集信息,深化对道路架构的理解,并辅助实现精准的边界划分;第三步,融合距离滤波、RANSAC算法与迭代高斯过程,对结果进行精细打磨,确保最终输出既精确又高效。         U-AFCD算法:Y Jung及其团队在首尔大学研发的Uncertainty-Aware Fast CutDetection (U-AFCD) 算法,在ICRA 2021会议上大放异彩。该算法深度融合了深度学习网络,专注于路沿检测及其不确定性评估。Jung团队慷慨分享了精心构建的路沿数据集,位于GitHub上的YounghwaJungcurbdetecton DNN,供全球研究者共同探索。此数据集源自城区复杂环境的精心采集,利用Velodyne VLP-32C激光雷达与OXTS RT3002定位系统,共收集到详尽的5224%点云数据,并附带了鸟瞰视角下的精准路沿分割标注。U-AFCD算法的设计精妙,核心分为两大阶段:编码-解码分割网络,该阶段如同精密的筛子,精准分离出视野内清晰可见的路沿点云,为后续处理奠定坚实基础;引入前沿的条件神经过程(Conditional Neural Process, CNP),此阶段如同智慧的侦探,不仅推测出被遮挡、不可见区域的路沿轮廓,还巧妙地评估了整个检测过程的不确定性,为用户提供更加全面、可靠的决策支持。         深入研究了U-AFCD算法,该算法依托神经网络技术,在路沿分割与推断领域展现出独特优势。它巧妙运用U-Net网络,精准分割点云数据,初步勾勒出可见路沿轮廓。进而,该算法融合CNP、ANP等先进模型,不仅弥补了被遮挡、不可见路沿的空白,还巧妙评估了整体检测结果的置信度。尽管在实时性优化上尚有空间,但其开创性地采用CNP、ANP替代传统高斯过程回归或多项式拟合,为路沿检测问题提供了新颖视角,极具探索价值。         本章详尽剖析了路沿检测技术的现状,将其归结为两大流派:一是依赖人工规则的检测方法,虽在早期激光感知研究中占据主流,却面临调参繁琐、场景适应性差等瓶颈;二是依托深度学习网络的检测方法,特别是针对1D激光点云的应用,近年来备受瞩目。然而,点云级路沿标注数据集的匮乏,成为制约该领域发展的关键因素。当前研究多采取折衷方案,即将3D激光点云转换为BEV投影,再利用图像处理技术进行分割或车道线检测。基于3D激光点云的路沿检测仍是一个亟待攻克的研究难题,亟需工业界与学术界的共同努力与智慧碰撞。

  • 回复了主题帖: 《智能驾驶之激光雷达算法详解》8、基于 3D 激光点云的目标检测

     

  • 2024-09-04
  • 发表了主题帖: 《开关电源仿真与设计》-非隔离变换器

    降压变换器         降压变换器广泛应用于各类电压降低需求场景,包括白色家电的离线供电、蜂窝电话等电池驱动电路,以及局部调节器(POL调节器)等。追求更高效率时,可构建同步降压变换器;若单级电路面临大电流输出挑战,则多相降压变换器成为优选方案。         本书是以输入电压28 V/输出12V/4A的电压模式降压变换器为例,基本指标为输入电压在20~30V情况下,负载电流为4A 时,输出为12V;最大峰-峰输出电压纹波低于125 mV;开关频率为100 kHz;交流输入电流纹波峰-峰值指标为15 mA。         根据基本指标的极值可以计算出占空比的极值在40~60%之间,而通过纹波幅值可以确认LC滤波器的转角频率位置。         然后通过纹波电流最小化计算电感值。电感纹波电流的选择深刻影响着变换器的多项关键参数,这一规律不仅适用于降压变换器,同样适用于其他变换器架构。追求低纹波电流往往需要采用大电感,这在追求系统快速响应时构成挑战。然而,关于低纹波是否减少功率开关的有效损耗,业界存在分歧。特别是在同步整流技术下,这一观点尤为显著:二极管功率损耗主要受平均电流影响(尽管有效电流亦有影响,但CCM变换器中平均电压占主导地位),而MOSFET则对回路有效电流更为敏感。此外,大交流纹波会加剧输出电容的负担,缩短其寿命并引发发热问题。不过,在降压变换器中,由于电容电流的非脉动特性,这一问题相对缓和。另一方面,高纹波虽可能带来较大的磁芯损耗,但小电感设计能减少欧姆损耗,并赋予变换器更优的瞬态响应能力,这在高纹波场景下尤为明显。至于工作模式,低电感值在输出电流下降时易促使变换器进入DCM模式,但精心设计的变换器能有效管理模式转换,尤其是采用电流模式控制的变换器。综上所述,纹波电流的选择并非单一答案所能涵盖,还需综合考虑成本、尺寸、元器件选择等多重因素。         鉴于电容的低阻抗特性及其在高温环境下的稳定性能,它们成为开关电源的理想选择。值得注意的是,ESR(等效串联电阻)值随工作温度略有波动,而此值直接关系到系统零点的位置。为精确设计,首要任务是进行降压变换器的小信号响应模拟,并据此精确计算LC组件的数值。         瞬态分析可依托实际降压变换器电路实施,如安森美LM257X单片开关或先前章节探讨的通用电压模式控制器,高压侧开关(因其连接至正电源而得名,相对地,低压侧开关则连接至参考地)与续流二极管等器件。为便于分析,我们假设一理想开关,其导通电阻可调。实际应用中可选用易于操控的P沟道MOSFET或成本效益高的N沟道MOSFET,但需辅以电荷泵或自举电路以驱动。假定开关为理想状态,忽略了寄生元件的影响。续流二极管恢复时间也是非常重要的:在二极管由导通转为阻断的瞬间,因突然反向偏置,二极管会短暂短路,直至恢复阻断能力。在降压变换器中,这导致MOSFET电流曲线上出现尖锐的峰值,且随着开关频率的上升,这一峰值加剧了开关与二极管的能量损耗。值得注意的是,若采用肖特基型二极管,虽可避免恢复时间带来的损耗,但其高寄生电容却可能加重开关的负担。         二极管损耗显著影响降压变换器的性能。精确评估开关的平均功率消耗,需将开关两端的电压与通过其的电流相乘,得出瞬时功率p(t)。进而,通过在一个完整的开关周期内对瞬时功率进行平均化处理,可得出平均功率值,该值仅为理论估算,因实际中电容伴随寄生元件(尤其是非线性结电容)且SPICE模型恢复时间优化不足,均会导致偏差。为追求更为精确的功率损耗测量,实验室环境下利用示波器进行直接观测与测量显得尤为重要。不过,在此特定场景下,功率开关的主要损耗源头可归结为开关操作过程。因此,精心挑选续流二极管,对于有效降低开关过程中的功率损耗而言,具有至关重要的作用。         降压电流模式变换器,作为三阶系统运作,其特性包含一低频极点、一与输出电容ESR紧密相连的零点,以及一对位于开关频率半数之处的双极点。此零点,其位置由输出电容及其ESR共同决定,能在交叉频率点处贡献相位增益的宝贵提升。鉴于ESR易受温度与时间影响而发生变动,零点的频率亦会随之偏移,这一动态变化需予以关注。 交流分析借助电流模式PWM开关模型进行,极-零点的配置巧妙运用了k因子技术,同时也不乏单独极-零点配置的应用实例。k因子技术在放大器类型2(无论是DCM还是电流模式CCM)的补偿网络中展现出了良好的适用性。然而,对于放大器类型3的补偿网络,由于可能引发条件稳定性的问题,故不推荐采用k因子技术。         同步降压变换器通过引入同步MOSFET替代传统的续流二极管,电流模式的降压变换器实现了效率的显著提升。续流二极管虽能确保在截止时段内电流的持续流通,并维持功率开关与二极管连接点电压近乎为零的状态,但在实际应用中,这一电压并非绝对为零,尤其是在二极管不同导通条件下。电路设计中纳入了二极管的正向压降Vi及动态电阻R&的考量。这些元件的存在不可避免地会对变换器的效率产生影响,特别是在二极管正向压降与负载电压Vout相对较大时,效率损失更为显著。因此,采用同步MOSFET替换续流二极管,成为了优化变换器性能、减少能量损耗、提升整体效率的关键策略。         低成本悬浮降压变换器有些应用场合要求简单的非隔离降压变换器,并将其直接连接到电源整流电路输出。在白色家电中就是这种情况,如洗衣机,微处理器为前面板提供了智能化操控功能。在这些白色家电设计中,电流模式拓扑不一定都适用,因为电路中会出现小占空比的情况。 升压变换器         升压变换器专为需要输出电压高于输入电压的系统设计,如电池供电系统(如12V电池驱动音频放大器)、蜂窝电话(增强射频放大器偏置)或需局部高电压的电路。例如48V/2A升压变换器在汽车电池供电下的应用,其工作模式灵活跨越DCM与CCM边界,但为优化电容电流管理,轻载时自动切换至DCM模式。与降压变换器实例一样,双零点刚好放置在谐振峰处,来补偿在该点产生的严重相位滞后。有些设计者推荐把双零点放在稍低于谐振峰的位置,这样可根据仿真得到的数据,很容易测试该结果。与在降压变换器例子中所做的一样,在瞬态仿真中使用通用控制器来仿真升压变换器。         紧凑式升压变换器设计中,电解电容的布局需避免开架式适配器的堆叠方式,因空间限制尤为显著。针对便携式电话应用的升压变换器,其物理尺寸及电路板质量均受严格约束。值得注意的是,纹波的增加会促使电感值下调,并推动RHPZ向高频偏移,这为交叉频率的选择增添了灵活性,同时揭示了原电容值选择的非最优性。鉴于升压变换器在低输入、低输出电压环境下运行,引入包含导通损耗与正向压降的模型能显著提升模拟精度。 降压-升压转换器         降压-升压转换器融合了双重能力,既能提升又能降低输入电压,但其传输的电压却带有负极性,相对于地而言,这成为了其拓扑结构的一个固有局限。然而,在某些特定应用场景下,这一特性并不会构成障碍。 汽车电池供电的12V/2A降压-升压转换器专为双电源供电的音频汽车放大器量身打造,负责提供负电源,以支撑放大器的对称电源需求。这一设计旨在消除直流阻断电容的必要性,该类电容在传统单电源结构中屡见不鲜。在此场景中,我们假定放大器运行所需的正电源为+12V,该电源可由其他类型的调压器供给,而负电源则完全依赖于这款精心设计的降压-升压转换器来稳定提供。         为精确设定降压-升压变换器设计所需的电感值,需仔细分析图5.56所展示的电感电流动态变化。通过设定合理的纹波变化范围来选定电感值,确保纹波波动维持在可接受水平内。峰值电流的计算应综合考量平均电感电流与电感电流波动量(Δt值)的一半之和。值得注意的是,在降压-升压变换器的设计中,电感的平均电流并不直接等同于输入或输出电流,这一点与单独的升压或降压变换器设计存在显著差异。         除了轻负载情境,降压变换器鲜少运行于DCM模式,相比之下,升压变换器则更常设计为在DCM下工作。从降压-升压变换器的设计实例中,我们不难发现DCM模式所带来的显著优势,如更宽广的可用带宽(通过RHPZ向高频段迁移)以及在移动谐振频率处的双极点效应优化(尤其适用于电压模式控制)。然而,这些优势的取得,也伴随着电感、功率MOSFET及输出电容中流经的有效电流显著增加。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》8、基于 3D 激光点云的目标检测

            在本文中,将深入探讨3D激光雷达感知系统的核心领域——3D目标检测。随着深度学习在图像目标检测领域的显著成就,以及激光雷达技术的飞速进步,将深度学习应用于3D激光点云以实现高效目标检测已成为研究的焦点。3D激光点云的目标检测旨在从复杂的点云数据中识别出车辆、行人等对象,并精确标注其尺寸、位置及朝向等关键信息。在目标检测的初期探索中,研究者们倾向于直接从原始点云数据中提取特征,结合全局信息来识别目标。PointRCNN算法便是这一思路的杰出代表,它首先利用PointNet++网络提取逐点特征,实现初步的前景与背景分离,随后为每个前景点生成预测框,并通过二阶段网络进一步细化预测结果。而STD模型则另辟蹊径,同样采用PointNet++提取特征,但采用了一阶段检测架构,并创新性地使用球形锚框进行目标预测,结合PointsPool操作优化特征表示,同时引入IoU分支提升定位精度。然而,面对激光点云中庞大的数据量(从数十万到数百万点不等),传统的逐点特征提取与预测方法面临内存占用高、实时性差等挑战。为解决这一问题,3DSSD算法应运而生,它采用一阶段检测架构,并对PointNet++中的最远点采样(FPS)策略进行改进,提出融合特征采样策略与CGlayer网络。这一创新设计不仅显著提升了处理速度(如在KITTI数据集中实现25+ FPS的推理速度),还保证了优异的检测性能。         3D目标检测中的体素/柱状特征划分策略,通过离散化连续问题,显著降低了求解难度与时间复杂度。在后续章节中,算法通过棚格化或体素化技术,有效解决了2D与3D空间中的地面分割与点云聚类难题。特别地,VoxelNet网络由苹果公司于2017年提出,它创新性地实现了三维空间的长、宽、高三个维度的离散化,生成体素栅格,并借助轻量级的PointNet网络提取体素内特征,转化为4D张量。随后,通过3D卷积与reshape操作,将4D张量转换为2D卷积可处理的3D张量,最终结合RPN网络实现高效目标检测。海康威视在此基础上,将VoxelNet的体素划分与特征金字塔架构巧妙融合,推出了Voxel-FPN算法。为进一步提升性能,SECOND网络引入了3D稀疏卷积,而PointPillars则进一步简化,仅在长和宽维度离散化3D空间,利用柱状体素特征及鸟瞰图(BEV)视角下的3D特征张量,通过2D检测方法高效完成3D激光点云的目标检测,其出色的实时性备受学术界关注,并激发了众多改进算法的研究。此外,将高维问题降维处理也是常用的简化策略。借鉴深度图在激光点云聚类等领域的成功应用,研究者们尝试将3D激光点云投影至2.5D深度图进行物体检测。百度深度学习研究院率先探索了这一方向,通过投影与2D全卷积神经网络的结合实现目标检测。Uber则基于深度图、强度图、激光点占据图,采用anchor-free架构,推出了LaserNet网络。然而,研究指出,单纯基于深度图的3D目标检测算法精度往往不及体素和逐点方式,这主要归因于深度图特征提取与3D空间预测框回归间的信息不匹配,以及2D卷积在处理深度图时距离维度信息的缺失。针对此,RangeDet算法提出了更适配深度图的卷积策略,以克服这些挑战。         鉴于多种3D正给能方式各具优劣,探索其融合策略以创新3D目标检测算法,成为研究热点。2016年,清华大学与百度携手,将深度学习与2D卷积网络融合,开创性地提出M算法,该算法巧妙融合多视角特征,包括立方体体素抽取与视图特征,显著提升了3D目标检测的准确性。随后,MVFWa这一特征融合新路径在CVPR 2021会议上大放异彩,成为RSN算法的核心。另一方面,二阶3D目标检测方法借鉴了二阶段网络架构,首阶段粗筛潜在候选,次阶段精细调整。PoimRCNN与BSTD模型已展现不俗实力,而香港中文大学史少师团队更进一步,融合多尺度体素特征与点云精细局部信息,创新PV-RCNN算法,显著增强了检测性能。展望未来,CVPR 2021见证了LiDAR-RCNN算法的诞生,该算法在不颠覆现有框架的基础上,通过二阶段引入的精细化迷你网络,实现了检测精度的飞跃,预示着3D目标检测领域的新一轮技术革新。         前述目标检测方法多聚焦于当前点云信息,忽略了历史数据与检测结果的融合潜力。为此,Wiyme的Charies团队创新性地引入了Offboard 3D OD算法,该算法巧妙利用多点云序列,显著增强了点云的高精度自动标注能力。进一步地,香港中文大学携手Waymo及谷歌,共同研发了C-Anmi模块,旨在通过高效处理多帧激光点云数据,优化3D目标检测算法的性能。这一成果在Cm2021会议上以3D-MAN项目的形式惊艳亮相。基于多点云信息的检测策略,相较于依赖单一帧点云的方法,在检测精度上展现出了显著优势。然而,其计算复杂度也相应提升,对实时性构成了一定挑战,未来研究需致力于在保持高精度检测的同时,优化算法效率,实现更快的响应速度。         在3D目标检测领域,YOLO和CenterNet等算法虽然具有显著影响力,但仍有创新算法如CenterPoint,它们摒弃了传统的基于锚点(anchor)的方法,转而采用中心点热力图来识别目标。CenterPoint通过多任务学习框架,有效地提升了3D目标检测与多目标跟踪的性能,取得了显著成效。同样,地平线感知团队也紧跟潮流,推出了AFDet和AFDetV2两种anchor-free架构的算法,并在2021年Waymo数据集挑战赛的3D目标检测项目中脱颖而出,荣获冠军,彰显了其在该领域的领先地位。         采用注意力机制与Transformer机制革新3D目标检测技术。鉴于注意力机制与Transformer在图像及自然语言处理领域的显著进展,其引入3D激光雷达目标检测领域已成为研究焦点。华中科技大学与中国科学院自动化研究所携手推出TANet算法,该算法巧妙融合注意力机制于通点、逐通道及逐体素特征之中,并通过由粗到细的BBox回归架构,显著增强了小目标如行人的检测精度及对点云噪声的鲁棒性。与此同时,加拿大滑铁卢大学在ICCV 2021上亮相SA-De3D算法,创新性地将self-attention模块融入3D目标检测,旨在更精准地捕获环境背景信息。此外,该算法还创造性地将self-attention与2D可变形卷积结合,形成deformable self-attention模块,并成功嵌入PointPillars、SECOND、PointRCNN及PVRCNN等主流算法中,实现了检测性能的飞跃。         PointNet网络,由斯坦福大学的Charles R. Qi等学者在2017年CVPR盛会上创新推出,其核心在于运用MLP(多层感知机)架构精妙地从3D点云中抽取出局部与全局的深刻特征。这一模型不仅胜任目标分类、零件分割及语义分割等多样任务,其开源代码亦在GitHub平台上广受欢迎。尽管PointNet初衷非直接面向3D点云目标检测,其基于原始点云直接提取特征的策略却深受学界赞誉,频繁被优化并融入后续的众多3D目标检测算法中。         针对PointNet网络在捕捉激光点邻域局部特征方面的不足,推出了PointNet++网络,这一创新之作引入了层模式点集特征学习模块,为3D点云处理带来了革命性突破。该模块巧妙借鉴了2D图像中感受野传递的概念,通过空间划分策略,将点云空间细分为多个重叠的局部区域,精准捕捉每个激光点周边的细微特征。这一过程层层递进,每一层点集特征学习模块都以前一层提取的局部特征为基础,进一步提炼出更高层次的特征信息。如此循环往复,直至汇聚成整个点云的全局特征图谱。相较于PointNet,PointNet++网络在局部与全局特征的提取上展现出更为卓越的性能,其鲁棒性也显著提升。这一成果不仅拓宽了点云处理技术的应用边界,更为后续研究提供了宝贵的参考与启示。PointNet++的开源代码已在GitHub上公开,为广大开发者与研究者提供了便捷的学习与实验平台。         PointRCNN网络,由香港中文大学的史少帅等研究者精心构建,巧妙融合了原始点云特征提取与双阶段检测架构,展现出卓越的性能。其模型架构如图8-6所示,清晰划分为两个核心阶段。在第一阶段,一个精妙的子网络如同一位精准的裁判,将纷繁复杂的3D点云世界划分为前景与背景两大阵营。随后,它采取自底向上的策略,精心挑选并孕育出少量高质量的三维候选框,这些候选框犹如夜空中最亮的星,引领着后续的检测流程。对于每个候选框内的3D点云,通过ROI池化技术,进一步提炼其精华,为后续分析奠定坚实基础。进入第二阶段,另一子网络接过接力棒,将池化后的3D点云精准地转换至预设的坐标系下,这一步骤如同为点云数据换上了统一的“语言”,使得后续处理更加得心应手。在此基础上,该网络深入挖掘局部特征,并与第一阶段捕获的全局语义特征巧妙融合,形成一股强大的合力。这股力量,足以支撑起高精度bounding box的精准估计,以及置信度的可靠预测,为三维目标检测领域树立了新的标杆。 VoxelNet网络,由苹果公司的Zhou Yin与Oncel Tuzel在2017年开创性提出,引领了三维空间目标检测的新纪元。该网络通过对三维空间进行精细的体素划分与独特的特征编码,融合区域生成网络(RPN),实现了前所未有的端到端3D目标检测精度,树立了当时的性能标杆。VoxelNet不仅提升了技术边界,更开启了基于体素/柱状特征进行3D目标检测的研究新方向。这一革命性架构吸引了广泛关注,多个非官方实现版本如雨后春笋般涌现,如Tefw的RPyfoech版本(GitHub上可获取),以及OpenPCDet和MMDetection3D等框架中的官方实现,进一步推动了VoxelNet的普及与应用。从VoxelNet的网络架构图可以清晰看出,其精髓在于特征学习网络、卷积中间层与候选区域生成网络的精妙结合。巧妙地将三维空间细分为多个体素单元,并独创体素特征编码(VFE)层,有效提取各体素内激光点云的共同特征。通过层层堆叠的VFE,构建起描述物体复杂3D形状的深层次特征,这些特征以四维张量形式呈现。随后,利用先进的3D卷积层深入挖掘各体素特征的内在信息,将特征提升至更高维度。最终,通过精心设计的reshape操作,将三维特征张量送入RPN,精准生成目标检测结果,展现了VoxelNet在3D目标检测领域的卓越能力。         实时性飞跃——PointPillars 网络革新:在探索自动驾驶感知技术的征途中,VoxelNet 网络的3D卷积引入虽具开创性,却面临推理速度难以企及实时标准的挑战。2018年,重庆大学的Yan Yan勇于尝试,于VoxelNet架构之上融入3D稀疏理念,推出SECOND模型,然其3D稀疏卷积的部署难题,依旧难以跨越工业应用的门槛。正当此时,NuTonomy公司的Alex H. Lang团队携PointPillars网络横空出世,以非凡创意重塑点云处理格局。PointPillars通过对VFE的精妙改造,引入柱状特征网络(PFN),实现对原始点云的柱状体素精妙划分,并凝练成三维张量特征矩阵,这一创新使得后续处理可直接借力高效的2D卷积网络。尤为值得一提的是,PointPillars网络果断舍弃了VoxelNet的3D卷积与SECOND的3D稀疏卷积,从而在模型训练与推理速度上实现了质的飞跃。在权威KITTI数据集的测试中,其运行频率高达62Hz,不仅完美契合智能驾驶感知模块的实时性严苛要求,更展现出卓越的检测性能,迅速在工业界赢得广泛认可与应用。         RangeDet网络:经过学术界的严格测试,单纯依赖深度图进行激光目标检测的算法,其性能往往逊色于基于体素特征的目标检测算法。中国科学院的Fan Loe等学者与图森未来的王乃岩团队深入剖析了这一现象,揭示了现有基于深度图目标检测算法的两大盲区:一是激光点云的稀疏性导致深度图中物体尺度随距离显著变化,近大远小;二是特征提取局限于二维range image,而输出却需映射至三维笛卡尔坐标系,这一转换过程中特征信息难免有所损失。针对上述痛点,创新性地提出了解决方案,推出了RangeDet网络。该网络模型的设计精妙绝伦,以八通道深度图为输入,每通道分别承载激光点的距离、反射强度、伸长率、x、y、z坐标、方位角及垂向倾角等丰富信息。RangeDet网络的核心由三大板块构成:骨架网络、基于距离的金字塔特征分配层及目标检测头。首先,为解决传统2D卷积在深度图中提取距离信息的局限性,RangeDet网络独辟蹊径,引入了元卷积核。随后,在骨架网络部分,该网络巧妙融合了特征金字塔网络(FPN)的结构精髓,以灵活应对深度图中目标尺度变化的复杂挑战。紧接着,RangeDet网络依据距离条件,将金字塔各层特征精准分配给不同距离范围内的目标,实现了特征的精细化管理与高效利用。最终,这些精心提炼的特征被传递给目标检测头,用于精准预测目标在三维笛卡尔坐标系下的类别、位置及姿态,生成高精度的bounding box。RangeDet网络的问世,不仅为基于深度图的激光目标检测领域带来了全新的视角与解决方案,更为推动自动驾驶、机器人视觉等前沿技术的发展注入了强劲动力。         在前面的章节里,已深入探讨过多种基于体素划分与投影技术的3D目标检测算法。这些算法巧妙地利用点云数据,通过柱状体素划分、特征提取及BEV投影转换,成功实现了对目标的精准检测。然而,尽管它们能保留物体的物理尺寸并有效分离多数物体,但在面对稀疏的点云特征及远近距离物体点密度差异大等挑战时,尤其是在检测小目标或远处目标时,表现略显不足。与此同时,透视图视角或深度图检测方法虽能捕捉精细的特征图,却也在处理遮挡目标时面临困境,且目标尺度随距离变化的问题难以忽视。鉴于此,融合多种视角或投影图的优势,以强化检测算法的性能,已成为当前研究的焦点。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》7、深度学习基础

            随着神经生理学领域的深入探索,人类对大脑运作的奥秘有了更为透彻的理解。学者们不仅模拟了大脑中神经元的工作机制,还精心构建了神经元的基本数学模型,并以此为基础,搭建起了人工神经网络(ANN)的宏伟架构。近年来,ANN经历了几番起伏后重焕新生,其应用领域已广泛拓展至智能驾驶、安防监控、医疗健康及自然语言处理等前沿领域。本章节旨在精炼地阐述人工神经网络的基本框架与运算流程,对于已具备相关基础的读者,可直接跳转至后续章节深入学习。回溯至1943年,McCulloch与Pits共同开创了先河,提出了标志性的“M-P”神经元模型,其经典结构至今仍被沿用并视为基石。“M-P”神经元的输出特性,展现了其如何通过接收多元输入执行逻辑判断的能力。其中,sign函数作为激活函数的先驱,虽具备直观性,但其不连续性限制了模型处理复杂非线性问题的能力。为此,sigmoid函数、ReLU函数及反正切函数等非线性激活函数应运而生,它们赋予了神经元模型更强大的适应性与灵活性。人工神经网络的发展历程是科技创新与理论突破交相辉映的典范,而“M-P”神经元模型及其后续发展,则是这一壮丽篇章中不可或缺的璀璨篇章。         1958年,F. Rosenblatt基于“M-P”神经元模型,创新性地提出了感知机(Perception)的概念,并进而构建了多层感知机(Multi-Layer Perception, MLP)的框架。感知机的核心架构简洁明了,由输入层与输出层构成,其中输入层负责捕获外界信号,而输出层则运用基本神经元结构进行信息处理。此感知机在本质上与神经元模型同出一辙,但引入“层”的概念极大地促进了复杂网络结构的构建。当我们将多个感知机以层级方式堆叠时,便形成了更为强大的网络模型。该模型由输入层、隐藏层(亦称中间层或变换层)及输出层三部分精心构筑。输入层作为信息的门户,接收并传递原始数据;隐藏层则扮演关键角色,通过权重分配与激活函数的共同作用,深入挖掘并提炼输入信息的核心特征;最终,输出层基于隐藏层提炼的特征,计算出网络的最终响应。这一过程不仅定义了多层感知机模型,也为其赢得了前馈神经网络或正向传播网络的称号。依据隐藏层数量的差异,模型可细分为单隐层前馈神经网络与双隐层前馈神经网络,它们共同构成了人工神经网络的基本蓝图,对后续神经网络技术的演进产生了深远影响。正向传导与误差反向传播机制通过深入探究人工神经网络如何凭借输入信息,经由精心设计的权重网络,最终输出最优解。在此情境中,特别聚焦于第p个输入神经元与隐藏层中第q个神经元之间的权重纽带,这一关键连接驱动了信息的初步加工与传递。遵循自顶向下的逻辑顺序,设定神经元编号递增规则,便于追踪信息流的每一步进展。想象输入层的数据如同涓涓细流,滋养着隐藏层的第四位神经元,而该神经元又通过特定的权重桥梁(设为ω),与输出层的第n个神经元紧密相连。此处的ω不仅代表了数值关系,更是知识传递的使者。为了保持论述的清晰与普遍性,假定隐藏层与输出层均采用sigmoid函数作为激活机制,这一选择基于其良好的非线性映射能力和广泛的应用基础。同时,为了简化推导过程,暂时忽略各层偏置项的影响,使焦点更加集中于权重与神经元交互的核心逻辑上。正向传导过程便显得直观而有序:输入信息经过输入层,按照预设的权重分配方案,在隐藏层内经历非线性变换与整合,最终汇聚至输出层,以期望的形式展现出网络的预测或分类结果。这一过程不仅展示了神经网络处理复杂信息的强大能力,也为其后的误差反向传播与权重调整奠定了坚实基础。         卷积神经网络(CNN),专为计算机视觉而生,深度构建神经网络体系。其核心在于卷积操作,巧妙模拟大脑视觉皮层中神经元的“感受野”机制,实现神经元间的局部互连。同时,结合权重共享策略,显著降低模型参数量。CNN在处理图像数据时,既保持了图像的结构特征,又高效利用了图像的局部不变性。历经四十余载,CNN从萌芽至兴盛,历程波澜壮阔。1980年,福岛邦彦受David H.Hubel与Torsten Wiesel关于大脑视觉皮层研究的启发,首次提出融合卷积与降采样的新知机网络。1989年,LeCun引入误差反向传播机制,为CNN奠定了基本框架与训练路径。直至1998年,LeCun以LeNet网络破解文字识别难题,引领深度学习初露锋芒。然而,彼时受限于硬件技术、样本稀缺及SVM等机器学习算法的冲击,CNN并未赢得广泛关注。直至2012年,GPU并行计算技术的飞跃,Alex与Hinton等人在CUDA GPU平台上成功打造AlexNet,于ImageNet竞赛中以领先亚军约12%的卓越成绩问鼎,至此,CNN正式步入辉煌时代。 卷积操作的引入及其特性         在神经生物学中,“感受野”描绘了大脑神经元仅响应其特定支配区域的信号,而非全面反馈所有信息的特性。传统“BP”神经网络处理图像,神经元与每个像素通过权重连接的复杂过程,揭示其处理机制与大脑视觉感知的显著差异。那么,如何模仿这种高效的“感受野”机制,并同时优化模型的参数效率呢?在图像处理领域,滤波操作作为一种经典手段,以单通道图像FER为例,通过将远小于图像尺寸的滤波器(或称卷积核)WeR""与图像对应位置的像素值相乘后求和,生成新图像的像素值y,实现了图像的滤波处理。这一过程在数学上被定义为二维离散卷积,滤波器因此也被称为卷积核。学者们创新地将这一卷积过程引入神经网络,使卷积核成为可学习的权重参数。在此架构下,隐藏层神经元仅与卷积核覆盖的输入数据相连,不仅模拟了大脑视觉的“感受野”机制,还显著减少了模型参数,这正是卷积神经网络(CNN)名称的由来。以1024×1080的图像和2×2的卷积核为例,全连接网络中首个隐藏层的每个神经元需1,105,920个权重,而CNN中每个神经元仅需4个权重,极大降低了计算复杂度和存储需求。CNN的另一大创新在于权值共享。卷积核在图像上滑动计算时,其权重保持不变,这一特性进一步简化了网络训练过程,提高了模型的学习效率。蓝色矩阵代表图像,绿色矩阵为卷积核,黄色矩阵则为卷积操作后的特征图,直观展示了权值共享的效果。         卷积神经网络(CNN)以其独特的架构优势,避免了将图像简单拉伸成一维向量的繁琐步骤,从而能够有效捕捉图像中像素间的空间结构关系。借鉴经典LeNet网络的设计精髓,CNN的基本框架巧妙融合了输入层以接纳原始数据,卷积层以提取特征,池化层以减少参数与计算量,全连接层以整合全局信息,并最终通过输出层输出结果。这一结构确保了CNN在处理图像任务时的高效与精准。         在深入探讨图像卷积神经网络的学习之前,阐述计算机视觉领域的三大核心研究方向:图像分类、图像目标检测及图像分割,它们各自独具特色,紧密相连又彼此区分。图像分类,作为基石,其核心在于精准判定图像所属类别,无论是飞驰的车辆、欢笑的孩童,还是静谧的自行车,皆在其识别范畴之内。进而,图像目标检测则更上一层楼,不仅辨识目标类别,更精确捕捉其在图像中的位置坐标,常辅以边界框(Bounding Box, BBox)这一工具,细腻描绘目标尺度,实现定位与识别的双重飞跃。至于图像分割,则是以更深层次的理解为目标,依据图像的语义内容及属性特征,巧妙地将图像细分为多个富含意义的区域,每一区域均承载着独特的视觉信息与故事。经典的Transformer架构精髓是该架构精妙地融合了多头注意力机制与前向全连接网络,并巧妙地运用残差连接与层规范化(LayerNorm, LN)技术,显著增强了网络的稳健性。

  • 2024-09-01
  • 发表了主题帖: 《开关电源仿真与设计》-通用模型

            本章详尽阐述了电源仿真不可或缺的核心元件。一旦电路运行稳定,无缝切换至备选的高级模型以替代通用运算放大器模型便成为可能。调试过程可由简至繁,逐步精化模型,确保其更贴近实际工况。首要任务是构建一个由通用模型与子电路构成的工具箱,随后探索其如何协同工作,共同构建出功能全面的PWM控制器。我们的起点是内嵌式设计,因为它是模拟行为建模(ABM)的基石与灵魂。         内嵌式非线性受控源,即B元件,作为伯克利SPICE3引擎的精髓,自1986年问世以来,便以其独特的语法魅力吸引着众多用户。其设计不仅精妙,更与SPICE3仿真器的卓越兼容性相得益彰。B元件功能强大,能够灵活扮演线性或非线性电流、电压源的角色,满足多样化的电路仿真需求。         在无需详尽模拟运算放大器全部物理特性(如失调电压、偏置电流、转换速率等复杂因素)的场合,采用简洁而通用的模型往往能高效捕捉其一阶效应。此类模型以其快速的仿真能力著称,通过灵活调整参数值,能够轻松适配各种运算放大器的具体规格要求。         对于特定应用如内部参考电源,具备指定扇出数的电源设计往往超越简单地将静态电阻串联的模型范畴。扇出数,即电源在超出其调节界限前所能供应的最大电流,成为另一关键考量因素。为直观阐述这一特性,内嵌式模型成为理想之选。当参考电压与输入节点紧密相连(设想参考电源电路由e电源驱动时),直流音频敏感性(亦称电源纹波抑制)便成为评估性能的自然维度。         磁滞开关IsSpice集成SPICE核心组件,其特性深受磁滞效应影响。具体而言,当施加于其上的控制电压跃升至Vr + VH的阈值时,该开关瞬间由断路状态转变为通路状态,其电阻值也随即从RoFF切换到RoN。此处的Vr为启动电压阈值,而Va则代表了磁滞的电压范围。反之,若控制电压回落至Vr-Va水平,开关则迅速恢复至断路状态,电阻值回归RoFF。值得注意的是,此转换过程理论上瞬时完成,但实际应用中需谨防收敛性问题,建议通过引入微小时间常数等手段加以优化。         欠压锁定(UVLO)功能中的磁滞开关展现了多元化的应用潜力,尤其是在构建具备磁滞效应的比较器时。无需额外参考电压或复杂内嵌设计,仅凭磁滞开关模型,即可迅速构建UVLO电路。此电路广泛应用于PWM控制器及其他关键电路中,确保电源电压维持在稳定变换器运作所需的阈值之上。其必要性源于内部参数(诸如VoFF=8能带隙)对充足工作电压裕量的依赖,以及对MOSFET栅极偏置电压的严格要求。UVLO电路持续监测Vee电压,一旦降至预设阈值以下,即自动关闭控制器以防止不稳定运行。反之,当Vee电压回升并超越另一设定阈值时,控制器将自动重启。标准配置中,通常设定在12V时启动供电,而在约8V时则停止向MOSFET提供驱动信号,这些数值虽为离线控制器的常见设定,但实际应用中可根据需求灵活调整。         前沿消隐:开关电源,其本质为噪声伴随的变换装置,常面临尖峰干扰的挑战,源自电容充电过程、寄生元件瞬时短路及二极管受反向恢复时间影响下的突然截止等现象。在反激式架构中,主开关的闭合、原边寄生电容的放电,以及CCM模式下副边二极管的突然阻断,均会在原边电路中激发电流尖峰。此尖峰经电流检测元件捕获后送入控制器,依据控制器的工作状态,可能扰乱电流限制机制,甚至在电流模式电路中触发比较器复位。为应对此问题,传统上采用RC网络作为缓解措施,但现代设计中更倾向于前沿消隐(LEB)电路的应用。该电路在激活后,仅于数百纳秒窗口内传递检测到的电流脉冲,有效策略在于:若开关闭合时产生尖峰,LEB电路将使系统对该周期内的特定事件保持静默,待后续周期再全面恢复信息传输。         精通比较器模拟电路的设计者,鲜少单纯依赖比较器本身,而不融入磁滞机制。这一创新融入,显著增强了电路的抗干扰韧性,尤其在高开环增益环境中,确保了转换过程的精准无误与响应敏捷。通过在比较器两端巧妙配置电阻,可加速磁滞效应的显现,不过,这一过程需辅以精细计算,以精确锁定所需的磁滞量值。         逻辑门:若旨在避免重构庞大的逻辑库,转而定制专属的简易逻辑门,内嵌式方法无疑是高效之选,其执行速度远超繁琐的全功能门模拟。此外,在模型构建之际,摆脱对仿真软件内置逻辑库的依赖,转而聚焦于个性化逻辑函数的集成,更为灵活便捷。         变压器:为一个简单的双绕组变压器建模,可以用SPICE的基元k,它表示原边和副边之间的耦合比。         非稳态发生器:非稳态发生器在涉及开关周期的应用中展现其效能,而弛豫机制的生成则策略多样一种创新途径,它不仅实现了恒流源的功能,还巧妙地融入了先前阐述的磁滞比较器概念,作为替代方案。此设计中,电容首先被充电至预设的参考电压,随后通过X2控制的开关迅速放电,从而开启下一个循环周期。通过精心设计的缓冲机制,该系统能无缝集成,高效生成PWM斜坡信号。值得注意的是,RoN值在此系统中的作用至关重要,其显著提升的数值不仅优化了收敛性能,还有效减轻了因电容C通过较低RoN值放电时可能引发的种种问题,确保了系统的稳定运行与高效能输出。         通用控制器:鉴于PWM模型的全面性与复杂性,其仿真过程往往耗时较长,令人望而生畏。尽管在某些场景下,详尽的仿真确属必要,但在初期阶段,比如迅速验证电路架构或创意时,采用完整PWM模型则显得冗余。本书亮点在于引介一系列高效通用模型,并直观展示其惊人的仿真速度优势。这些模型涵盖电压模式、电流模式、推挽、半桥、双开关结构等多元化选项。         短脉冲发生器:生成与方波信号同步的短暂脉冲,如用于设置/复位锁存器或执行捕捉操作。单稳态触发器电路构建简便,其工作机制在于输入信号的反转随即经RC网络延迟。脉宽的计算利用SpiceNET的参数化功能,持续时间得以自动测算,此便捷性同样适用于CADENCE环境。反相器、与门及特定时间常数构建的单稳态触发器,在集成电路设计实践中,为了在与门输入端生成所需的传输延迟以形成此类短脉冲,常采用多个串联的反相器/缓冲器来替代RC网络。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》6、基于 3D 激光点云的聚类分割

            本章深入探索3D激光点云的聚类算法,作为机器学习中的核心任务之一,聚类旨在依据特定规则将数据划分为不同集合,促使相似数据聚合,非相似数据分离。在机器人与无人车领域,3D激光点云的聚类分割技术尤为关键,特别是在深度学习驱动的目标检测与点云分析新方法日益普及的背景下,其精确度直接关乎后续目标检测、跟踪等模块的性能。聚类分割不仅独立承担重要角色,还与3D目标检测模块相辅相成,显著降低目标遗漏的风险。聚类作为无监督学习算法的优势——无需预设类别,仅凭数据间的相似性进行划分,辅助系统判断环境状态,如障碍物识别与路径规划。鉴于多线束激光雷达生成的海量点云数据(每帧可达数万至数十万点),传统聚类算法(如DBSCAN、Mean Shift)直接处理时面临计算量大、难以满足实时性需求的挑战。因此,研究者们普遍采用降维或体素化等技术手段,以优化点云表示与存储方式,减少算法的计算负担与空间占用。本章基于现有技术分析,将相关算法归纳为三大类别:         1、 基于网格/体素的点云聚类分割:在第五章中,我们已探讨过将3D激光点云投影至2D网格以实现地面与非地面点云的分离。此类方法因技术开销小、实时性强,在机器人与无人车领域早期研究中广受欢迎。例如,DARPA城市挑战赛中的多数团队便采用了网格地图技术。Douillard等通过均值高程地图分离非地面点云后,进一步利用体素网格表示并聚类,而Himmelsbach等则结合2D栅格地图与3D体素网格的高度差信息实现聚类,均展示了良好的应用效果。         2、基于围模型的点云聚类:在图论框架下实现数据聚类划分,已成为聚类分析领域的璀璨明珠,诸多经典算法如谱聚类与受限拉普拉斯秩聚类等,均彰显了其深远影响。在此背景下,探索者们正积极将此类算法应用于3D激光点云的聚类分割难题中,力求突破。Klasing团队便是其中的佼佼者,他们巧妙地借助有向图与RBNN(Radially Bounded Nearest Neighbors)图的概念,创新性地提出了针对3D激光点云的聚类算法。该算法将点云数据映射为图G(U,E),其中U代表节点(即激光点),E则连接着满足特定距离阈值r的点对,形成边集。通过精细调控点间距离d与阈值r的关系,实现了点云中聚类结构的精准划分。而Moosmann等学者,则另辟蹊径,针对机械旋转激光雷达的扫描特性,采用无向图模型来描绘3D激光点云。在他们的无向图G(U,E)中,每个激光点均巧妙地与四个特定方向的邻域节点相连,这些节点分别来自同一线束的左右两侧,以及不同线束但偏航角相同的前后位置。这一设计不仅深刻捕捉了点云数据的空间结构特征,还为后续的聚类分析奠定了坚实基础。         3、基于深度图的点云聚类:第5章详尽阐述了深度图的精髓及其构建机制。深度图以其独特的方式,将繁复的3D激光点云凝练为直观的图像形式,其构建与索引过程既简便又高效,尤为可贵的是,它能精准保留激光点的距离精髓。正因此,基于深度图的点云聚类分割技术,在该领域内占据了举足轻重的地位。以德国波恩大学的Bogoslavskyi与Stachniss为例,他们巧妙地将3D激光点云转化为深度图后,借助高效的BFS算法,进一步推动了该领域的研究进展。 基于激光点间角度关系的聚类         德国波恩大学的Bogoslavskyi与Stachniss在2016年创新性地提出一种高效算法,该算法巧妙地将3D激光点云转化为深度图,并引入角度阈值作为约束条件,结合BFS算法在深度图领域内进行搜索,实现了点云的精准聚类分割。此算法设计精妙,无需构建复杂的三维点云树或索引,确保了高实时性处理能力。在I5 5200U 2.2GHz CPU平台上,针对32线激光点云数据,该算法展现出卓越性能,平均运行频率高达74至250Hz。作为深度图应用于点云聚类领域的先驱探索,该算法为后续研究奠定了坚实基础,并产生了深远影响。其开源代码现已发布于GitHub,供全球开发者学习与应用。Bogoslavskyi算法的核心策略精妙地融合了地面点云的精准分割与非地面点云的高效聚类。 基于扫描线分割的 SLR聚类算法         2017年,美国明尼苏达大学的Zermas与德尔福汽车公司的Izzat等人在ICRA会议上推出了创新的3D激光点云聚类算法——SLR(Scan Line Run)。该算法巧妙融合了机械旋转式激光雷达的扫描特性,专注于每条扫描线的点云数据,借鉴图像处理中的连通区域标记技术,在深度图层面逐行实施点云聚类的精细分割与智能合并。SLR算法的核心原理在于,它视深度图的每一行为激光雷达的一条独立扫描线,而每一列则映射了扫描的不同角度。Zermas等人创新性地定义了“run”概念,即将扫描线中连续且邻近的激光点视为同一集合,并赋予它们共同的类别标识。通过这一方法,算法能够沿扫描线将点云分割成多个run,并依据设定的距离阈值,跨扫描线进行run的合并,最终实现对整个激光点云的高效聚类。SLR算法作为逐线束点云聚类分割的典范,其精髓在于先通过相邻位置关系精准划分各激光线束内的聚类子集,随后借助距离条件巧妙融合不同线束间的聚类子集。然而,面对高线束激光雷达的广泛应用场景,SLR算法因需详尽计算三维空间内激光点间距离,导致计算耗时较长,实时性能受限。 深度图与DBSCAN融合下的3D点云高效聚类         韩国东国大学的M. Wen等学者在2018年创新性地提出了将深度图与DBSCAN算法相结合的方法,巧妙地将3D激光点云数据转化为2D表示形式,并借助DBSCAN算法在转换后的深度图中实施基于密度连通的聚类分析。这一策略经实验验证,相较于直接在3D空间应用DBSCAN,其计算效率实现了惊人的飞跃,速度提升高达572.4倍;即便是与基于k-d树的DBSCAN算法相比,平均计算速度也实现了约16.89倍的提升。DBSCAN(Density-Based Spatial Clustering of Applications with Noise),这一由德国慕尼黑工业大学Ester等人于1996年开创的算法,是密度聚类领域的璀璨明珠。它无需预设聚类数量,通过遍历数据集,自动识别并划分出高密度区域作为独立聚类,能够灵活捕捉任意形状的聚类结构,包括图6-11所示的复杂形态,展现了其卓越的数据处理能力。 基于多视角的点云聚类分割——MVC 算法         鉴于近年来高线束激光雷达(如速腾MI、禾赛AT128等)在量产车型中的广泛应用,其点云数据量激增,每点云包含数十万至数百万激光点,这对实时聚类算法的计算效率与复杂度构成了严峻挑战。同时,传统聚类方法受限于固定距离或角度阈值,难以精确区分远近目标,未能充分发挥高分辨率激光雷达的潜力。保守的阈值设定易导致近处障碍物欠分割与远处目标过分割。进一步地,3D激光点云转换为深度图后,目标尺度随距离变化,加剧了远处物体的分割难度。鉴于此,创新性地提出了MVC(Multi-View Clustering)算法,专为高线束激光雷达的3D点云聚类设计。MVC算法巧妙融合了BEV与FV视角的优势,实现了对高密度激光点云的高效聚类与分割。该算法遵循从粗到细的双重策略,首先在BEV视角下构建极坐标栅格,并据此对点云进行初步聚类,随后针对潜在的欠分割区域,利用深度图进行精细化的再处理。实验验证,MVC算法兼具卓越的精度与实时性,足以应对智能驾驶领域的广泛需求。可根据实际需求,进一步拓展MVC算法,如在FV阶段引入动态阈值调整,或依据激光雷达的分辨率在水平与垂直方向上设定差异化阈值,以持续提升聚类精度,优化算法性能。

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》5、基于 3D 激光点云的地面分割

            本章聚焦于地面点云分割算法,旨在为读者快速勾勒出该领域的技术脉络。基于算法原理的差异性,将3D激光点云的地面分割技术细分为以下五大类。 1、基于高程地图的地面点云分割         此类算法巧妙地将3D激光点云投影至X0Y平面,随后将平面细分为若干网格。在每个网格内,算法计算点云子集的平均高度、最大-最小高度差、最大相对高度差及高度方差等关键参数。通过将这些参数与预设阈值进行比对,算法能够区分出包含非地面点与纯粹地面点的网格。该方法计算资源需求低,不受限于激光雷达的扫描模式,且能有效应对多种地面场景。然而,其局限性在于,当网格内存在如桥梁、路牌、树木等悬空物体时,可能导致整个网格被误判为非地面区域。为此,提出了分层处理的创新方法,显著增强了地面点云分割的鲁棒性。 2、基于相邻点几何关系的地面点云分割         传统机械激光雷达凭借其固定的扫描模式,能够精确计算出激光点在不同线束及方位角下的距离与角度差异。基于这些精确数据,通过比对实际测量中相邻激光点间的距离与角度变化是否逾越预设阈值,实现了地面点与非地面点的有效区分。为进一步优化计算效率,Bogoslavskyi等及Y.Li等学者创新性地提出,结合激光雷达的扫描特性,将复杂的3D激光点云数据简化为2.5D深度图形式。深度图中,行与列分别对应激光线束的俯仰角(y)与扫描方位角(θ),而像素值则直接反映了激光点的测量距离(r)。通过深度图内相邻元素间的几何特征分析,能够高效提取出地面点集与非地面点集。 3、基于地面模型拟合的点云分割         点云分割策略,首先以地面为平面的基本假设出发,结合激光雷达位置与高度限制,初步剔除非地面点云。随后,利用RANSAC算法精确拟合地平面,通过激光点至地平面的距离阈值界定地面与非地面点。然而,鉴于真实地形多含起伏与弧度,单一平面假设易引入误差。为提升精度,现有研究提出区域化处理方法,即将点云分割为多个区域,在各区域内独立应用RANSAC进行地面拟合,并剔除异常点。另一策略则通过扇区细分与中心平面投影,将3D点云转化为2D点集,提取关键点后进行直线拟合,依据斜率与点到线距离分类地面与非地面点。更进一步,为精确刻画起伏地形,Douillard等人及Chen等学者引入了2D与3D高斯过程回归模型,在区域化基础上实施地面拟合,并采用INSAC算法剔除噪声,生成更精细的地面模型与点集。尽管这些方法显著提高了拟合精度,但多区域迭代拟合与回归的过程也相应增加了计算复杂度,影响了实时性能。 4,基于机器学习模型的地面点云分割         凭借马尔可夫随机场及条件随机场等机器学习算法在图像分割领域的深厚积淀,研究者们巧妙地将这些模型引入至3D激光点云的地面分割挑战中。3D激光点云被精细划分为多个栅格单元,每个单元依据其梯度变化与平均高度等特征,精心构建马尔可夫随机场模型。随后,通过高效的信念传播算法(BP),环境被精准划分为多个功能区域,包括可行走区、可达区、障碍物区及未知区等,实现了对复杂环境的深刻理解与精准分割。 5. 基于深度学习网络的地面点云分割         近年来,深度学习算法的蓬勃发展,尤其是卷积神经网络(CNN)的广泛应用,推动了激光感知领域的一大革新。直接利用CNN对3D激光点云实施精准语义分割,能够迅速为每一帧的激光点赋予具体类别标签,如地面、车辆、行人等,这已成为该领域的研究焦点。         atiphon 等研究者在日本名古屋大学,于2018年巧妙融合了相邻点几何关系与模型拟合的优势,创新性地提出了级联地面分割(CGS)算法。该算法首先通过激光点间距离的有效筛选,初步剔除大量非地面数据,随后将剩余点云精准划分为多个独立区域。在每个特定区域内,运用迭代RANSAC方法精细拟合地面模型,进而基于这些模型实现地面点与非地面点的高精度分割。         障碍物与地面坡度对点云数据的显著影响,Patiphon团队针对固定旋转扫描模式的激光雷达系统(如机械式激光雷达),深入剖析了其生成的激光点云特性。他们强调,点云中相邻地波间距离的变异不仅受限于激光雷达的固有参数、扫描距离及安装高度,更与地面的坡度变化紧密相连。具体而言,地面坡度平缓时,相邻激光线束间的点云间距会相应拓宽,;反之,随着地面坡度陡增,这些间距则显著缩短。尤为值得注意的是,当激光雷达遭遇垂直障碍物时,同一方位角下相邻线束间的激光点间距会进一步压缩。         基于马尔可夫随机场的地面点云精准分割,马尔可夫随机场(Markov Random Field, MRF),作为早期视觉处理的利器,已成功涉足边缘检测、立体匹配、图像细分及复原等多个领域,硕果累累。日本丰田工业大学的Guo与Sato等学者,巧妙地将MRF在图像分割中的精髓应用于3D激光点云数据的处理中,创新性地提出了G2DRR(Graph-based 2D Road         Representation)算法,专注于路面识别,并依托Velodyne HDL-64e激光雷达进行了实证检验。马尔可夫随机场的精心构建与信念的高效传播,G2DRR算法首先施展其独特魅力,将繁复的3D激光点云轻盈地投射至水平面,随后将这些点云精心划分为细密的网格体系。在此基础上,算法作出一个关键性假设:每个网格的归属类别,深受其邻近网格的影响,而与远方网格则保持相对独立。这一精妙设定,使得整张网格地图自然而然地蜕变为一座马尔可夫随机场,并通过无向图G=(V,E)这一数学语言得以优雅表达。         在过去的三十年间,基于高程地图的地面点云分割网格地图技术已成为机器人导航、路径规划、障碍物检测与跟踪等多个领域的核心工具。Elfes的占用栅格地图与Bares的高程地图作为该技术中的佼佼者,展现了广泛的应用潜力。占用栅格地图巧妙地将复杂的3D环境简化为规则的2D网格系统,不仅明确了占用、空闲、未知三种环境状态,还通过概率值精准刻画了各网格被物体占据的可能性,为机器人提供了清晰的环境认知框架。而高程地图,作为一种创新的2.5D网格表示法,在保留二维网格简洁性的同时,融入了高度信息的丰富层次,包括平均高度、最大/最小高度及高度方差等关键参数。这一特性使得高程地图在保持较低计算与存储负担的同时,能够精准实现3D激光点云中的地面模型构建与地面点精准分割。

  • 回复了主题帖: 《开关电源仿真与设计》-反馈和控制环

    qwqwqw2088 发表于 2024-9-1 09:04 看起来这本书可以读读,注重理论与实践相结合比较紧密 很实用,不过说实话接受起来会有点困难,前后联系的很紧密,专业表达很多

  • 发表了主题帖: 《智能驾驶之激光雷达算法详解》4、LiDAR-Camera 的外参标定

            在智能驾驶领域,由于相机数据与激光雷达数据间的高度互补性,两者的数据融合成为了研究热点。而实现高质量融合的关键之一,便是对二者进行精确的外参标定。本章将深入探讨3D激光雷达与2D相机(L-C)之间的外参标定方法。根据标定时的传感器运动状态,L-C标定可分为静态标定与动态标定;依据对标定物的需求,则可分为有标定物和无标定物(即自标定)两种方式。实时性与算法运行状态的差异,又将标定算法划分为离线标定与在线标定。在有标定物的场景中,常利用棋盘格、二维码标定板等快速在激光雷达坐标系与视觉坐标系中定位特征点,建立传感器间联系。在无标定物的情况下,自标定算法通过提取环境中的线特征、面特征等,利用特征匹配估计L-C外参。利用点云中的3D区域与图像中2D区域的对应关系也是一种有效的自标定方法。在车辆动态行驶过程中进行在线L-C外参标定,则面临更高挑战。业内主要通过最大化点云与图像的配准信息来估计标定参数,并构建非线性优化问题求解外参。根据信息提取方式的不同,研究主要分为边缘配准、互信息、分割等方向。当激光雷达与相机无重合视场时,通过分析运动轨迹并结合手眼模型,同样可求解L-C外参。Huang等人进一步应用了Gauss-Helmert等方法优化标定过程。         ILCC算法创新性地利用棋盘格标定板,通过Velodyne 32线激光雷达与Ladybug 3全景相机验证。ILCC算法精髓在于高效利用棋盘格信息,不局限于传统LCC的四个顶点,而是精准捕捉稀疏激光点云与图像中的棋盘格黑白交点,构建独特的匹配关系。通过结合棋盘格尺寸、栅格大小、激光反射强度与颜色对比,构建并优化损失函数,精确定位交点的三维坐标。随后,从全景图像中提取对应二维坐标,形成完整的3D-2D特征点匹配体系。ILCC算法首先运用UpnP算法快速获取初值,再依托LMU617算法的非线性优化能力,精确计算出最终的外参估计值。 特征交点提取, 点云分割在获取原始的3D激光点云后,ILCC算法将首先对其进行聚类划分。nCC算法结合平面度、激光点分布、边尺寸约束筛选棋盘格点云,棋盘路检测通过激光点个数、坐标值初步过滤标定板点集。根据标定板尺寸和激光雷达分辨率估算竖直标定板激光点个数。ILCC算法通过聚类的平面度特征和主成分分析方法筛选出平面特征的点云聚类。根据聚类的边界尺寸进一步筛选出符合条件的平面点集。ILCC算法通过分析点云分布的均匀性来筛选出标定板对应的点云簇。在获取棋盘格标定板对应的 3D 激光点云后,ILCC 算法基于点云的强度信息估计棋盘格黑白交点所处的位置。         无标定物的L-C静态标定——PESC算法,由香港大学机械工程学院的C. Yuan等学者在2021年创新提出,该算法巧妙融合Livox AVIA半固态激光雷达与RGB相机技术,开创性地开发了Pixel-level Extrinsic Self-Calibration(PESC)像素级激光-视觉外参联合标定新方法。此算法突破传统依赖标定板的限制,通过捕捉并解析周边环境的自然边缘线等普适特征,在视觉与激光坐标系间建立精确的特征映射,实现传感器间外参的自主标定。其官方实现代码已开源至GitHub,便于学术研究与工业应用。PESC算法精心构建三大核心模块:(一)边缘特征提取:高效识别并提取图像与点云中的关键边缘信息;(二)特征关联匹配:精准匹配视觉与激光数据中的对应特征点,构建跨模态的关联桥梁;(三)非线性优化外参求解:基于强大的优化算法,精确计算并优化传感器间的外部参数。在边缘特征提取环节,PESC算法避免了传统方法中常见的零值映射问题。即便在摄像机视角覆盖而激光雷达因遮挡无法观测的复杂场景下,PESC依然能够稳健工作,通过智能算法筛选有效特征,确保标定过程的准确性与鲁棒性。这一创新不仅简化了标定流程,还显著提升了标定精度,为自动驾驶、机器人导航等领域提供了强有力的技术支持。         L-C动态在线标定新突破——AOCCL算法:斯坦福大学的Levinson与Thrun在2013年开创性地提出了AOCCL算法,实现了无需标定板的相机与激光雷达的自动在线标定(Automatic Online Calibration of Cameras and Lasers)。AOCCL算法的核心逻辑精妙而直接:在精确的外参标定下,激光雷达点云中深度突变的边缘特征,映射至图像平面后,应精准对应图像中的边缘轮廓。此算法不仅能在车辆行驶中实时追踪相机与激光雷达的外参变动,亦能在静态条件下,利用多帧点云与图像数据完成外参标定,展现了极高的灵活性与实用性。值得注意的是,实施动态标定时,确保激光雷达与相机的时钟同步至关重要,同时,为消除车辆运动对激光点云的潜在干扰,还需采用特定方法来校正运动畸变。在特征处理层面,AOCCL算法巧妙地在图像与点云世界中并行抽取边缘特征。对于图像部分,算法通过两大步骤精准定位边缘特征像素点:首先,将图像序列(I1至In)转换为灰度图E*,其中E*的每个像素值由原图对应像素与其8邻域点间绝对偏差的最大值确定,这一转换极大地凸显了图像中的边缘信息,为后续的特征匹配奠定了坚实基础。

最近访客

< 1/2 >

统计信息

已有36人来访过

  • 芯积分:423
  • 好友:--
  • 主题:20
  • 回复:36

留言

你需要登录后才可以留言 登录 | 注册


现在还没有留言