语音识别时,人说一句“Hello”,尽管发音很标准,但是由于有停顿、换气或是其他原因,音频信息中的“H”音很容易对不上文本信息中的“H”。这就需要预处理对齐问题,但是用人工的方法手动对齐比较音频信息和文本信息,需要耗费大量的人力财力。CTC就是处理这一类对齐问题而生的技术。

Read more »

PointRCNN是第一个仅仅使用原始点云数据的两阶段3D目标检测方法,效果非常惊艳,实现思路也相当牛逼。非常推荐做3D视觉的同学学习一下。

Read more »

Spatial Propagation是有效的refinement手段,最早诞生于SPN论文中,对于语义分割的结果优化效果很明显,尤其是分割的边界部分效果比原来提高不少。后来被CSPN这篇文章继续推广,实验证明对于深度补全和双目深度估计任务performance提升也很有帮助。

本文包括:

  • SPN简介
  • CSPN简介与解释
  • CSPN的各种应用

如有问题请在评论区留言,或是用邮件与我交流讨论。

Read more »

有关双目深度估计系列论文,以及在伪点云上的应用,包括:

  • PSMNet
  • GA-Net
  • Pseudo Lidar
  • Pseudo Lidar++

全部内容还是PowerPoint图片,还是可能会加载缓慢~

Read more »

梳理一下最近看的有关PointNet系列论文,包括:

  • 点云数据格式
  • PointNet
  • PointNet++
  • Frustum PointNet

全部内容均为PowerPoint图片,加载缓慢敬请等待~

Read more »
0%