开源AI 数据源解析工具,之前是闭源商业化产品,最近开源,在 RAG 场景对表格数据、PDF 等解析准确率非常高
LlamaParse是一个由LlamaIndex创建的API,旨在高效地解析和表示文件,以便使用LlamaIndex框架进行高效的检索和上下文增强。它直接与LlamaIndex集成。免费计划每天最多处理1000页,付费计划每周免费7000页加上每额外页0.3美分。
要开始使用,首先需要登录获取API密钥。确保安装了最新版本的LlamaIndex。如果从v0.9.X版本升级,建议先卸载旧版本,然后按照迁移指南操作,并强制重新安装最新版本。
接下来,安装包:pip install llama-parse
。之后,可以运行代码来解析第一个PDF文件,包括同步和异步加载数据的方法,以及如何直接解析文件对象或将其作为默认PDF加载器集成到SimpleDirectoryReader
中。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容