Loading...
趁着ChatGPT官方API release的热度没消散,分享一下个人(穷逼)自用的快速迭代黑盒LLM工具包。Background在OpenAI所有开放的language completion API中,code-davinci系列是唯一可在Beta阶段免费使用的。但OpenAI在CODEX系列API上施加了很严格的频率限制,官方描述为20 requests/min和40000 tokens...
使用PyTorch炼丹的过程中,我们最怕的就是在DataLoader里debug,原因无他:多进程驱动的DataLoader很难给出清晰的tracebac...
表格OCR任务,隶属于Document Analysis and Recognition领域,相关顶会有ICDAR。本文主要记录在Github上开源的个人项目Hyper-Table-OCR的整个开发历程,如标题所说,Hyper-Table-OCR的创新点主要在为有表格线的表格OCR识别与重建提供了流水线,我们将全过程分为:预处理,包括四点透视变换(可选)与表格角度调整(可选);表格检测(可选...
去年年中写了个自动打新可转债的脚本,大家伙反响不错,隔三差五就能多几颗星星,还有不少人在评论跟issue里与我互动。半年过去,这段脚本大概又给我带来了几百...
在不少热门的深度学习应用子领域中,开源工作者们往往会为研究者们提供通用的pipeline与抽象化工具,这能让研究者们更关注与模型的效果(雾...更高效地调参!)而不是与工程上的细节死扣。实际上,PyTorch官方提供了Ignite这样的高级API,可以通过类似事件驱动编程的形式来调整训练、推理、数据集加载等过程的流水线。当然,对更细分的领域,Ignite的抽象化程度可能就不如其余的库了,其中...