Loading...
表格OCR任务,隶属于Document Analysis and Recognition领域,相关顶会有ICDAR。本文主要记录在Github上开源的个人项目Hyper-Table-OCR的整个开发历程,如标题所说,Hyper-Table-OCR的创新点主要在为有表格线的表格OCR识别与重建提供了流水线,我们将全过程分为:预处理,包括四点透视变换(可选)与表格角度调整(可选);表格检测(可选...
概述在解决传统目标检测问题时,我们可以用卷积神经网络对锚框预测偏移量的方式实现BoundingBox级别的目标检测,但在可靠性要求更高的场景(如自动驾驶)...
之前我们学习了如何用MLP实现手写数字识别并达到了95%左右的准确率。在介绍卷积神经网络之前,我简单地了解了一下k-NN也就是大部分人耳熟能详的K最近邻算法。像往常一样,本文注重对算法思想的理解而不会纠结于数理公式的推导。本文及其系列图表信息大都来自Stanford CS231n系列课程,也算作我的听课笔记吧。算法原理我们知道,逻辑回归是一个分类器,K最近邻算法也是。所谓最近邻,就是采用多数...
之前用OpenCV实现了《德国心脏病》桌游的卡片识别,但效果并不是很好:视频流识别时对光线条件的要求极其苛刻,基本上是被机器玩而不是玩机器了。这让我有点恼...