Loading...
表格OCR任务,隶属于Document Analysis and Recognition领域,相关顶会有ICDAR。本文主要记录在Github上开源的个人项目Hyper-Table-OCR的整个开发历程,如标题所说,Hyper-Table-OCR的创新点主要在为有表格线的表格OCR识别与重建提供了流水线,我们将全过程分为:预处理,包括四点透视变换(可选)与表格角度调整(可选);表格检测(可选...
在不少热门的深度学习应用子领域中,开源工作者们往往会为研究者们提供通用的pipeline与抽象化工具,这能让研究者们更关注与模型的效果(雾...更高效地调...
概述在解决传统目标检测问题时,我们可以用卷积神经网络对锚框预测偏移量的方式实现BoundingBox级别的目标检测,但在可靠性要求更高的场景(如自动驾驶),我们希望对网络能对给定图像的任一像素赋予含义,这也是全卷积网络可以解决一个问题——语义分割。传统CNN结构面对语义分割任务,遇到的第一个问题就是:Conv Block实现的全部是down-sampling方法,最后使用全连接层给出图片的o...
之前用OpenCV实现了《德国心脏病》桌游的卡片识别,但效果并不是很好:视频流识别时对光线条件的要求极其苛刻,基本上是被机器玩而不是玩机器了。这让我有点恼...
引言这个想法最早是源自学长(手动@赵俊哲学长)带我们入坑的桌游《德国心脏病》(Halli-Galli-Game),在引入项目之前不妨稍稍了解一下其简单的游戏规则。(内心OS:原来还有这么有趣的桌游)游戏规则参与游戏的所有玩家都会被平均分得一定数量的卡牌,每张牌上会出现不同种类和数量的水果。所有玩家不能注视自己的牌,而应随机地从自己的牌中抽取一张卡牌放在桌面上的指定位置,依次进行。当所有可见卡...