Loading...
趁着ChatGPT官方API release的热度没消散,分享一下个人(穷逼)自用的快速迭代黑盒LLM工具包。Background在OpenAI所有开放的language completion API中,code-davinci系列是唯一可在Beta阶段免费使用的。但OpenAI在CODEX系列API上施加了很严格的频率限制,官方描述为20 requests/min和40000 tokens...
报错:Default process group has not been initialized, please make sure to call i...
表格OCR任务,隶属于Document Analysis and Recognition领域,相关顶会有ICDAR。本文主要记录在Github上开源的个人项目Hyper-Table-OCR的整个开发历程,如标题所说,Hyper-Table-OCR的创新点主要在为有表格线的表格OCR识别与重建提供了流水线,我们将全过程分为:预处理,包括四点透视变换(可选)与表格角度调整(可选);表格检测(可选...
单元测试对开发任何项目都是一个好习惯,在Python开发中我们经常使用标准库中的unittest及第三方的单元测试框架pytest完成单元测试工作。这里记...
在不少热门的深度学习应用子领域中,开源工作者们往往会为研究者们提供通用的pipeline与抽象化工具,这能让研究者们更关注与模型的效果(雾...更高效地调参!)而不是与工程上的细节死扣。实际上,PyTorch官方提供了Ignite这样的高级API,可以通过类似事件驱动编程的形式来调整训练、推理、数据集加载等过程的流水线。当然,对更细分的领域,Ignite的抽象化程度可能就不如其余的库了,其中...