0
做系统性文献综述的人,常被一个痛点折磨:论文数据分散在各处,爬取又触反爬机制。ScholarAPI 想解决的就是这个——它把 3000 多万篇开放获取论文的元数据、全文和 PDF 打包成 REST API,直接调用。
这个定位很清晰:不做终端产品,只当基础设施。研究者做文献监控工具、机构建知识库、创业公司搞科研 AI,都能拿它当数据层。相比自己维护爬虫池,合规风险和维护成本都低一档。
开放获取(Open Access)论文的边界正在扩大。ScholarAPI 的 3000 万+ 量级,覆盖的主要是这十年 OA 运动积累的存量。对工具开发者来说,这省下了最脏最累的活:清洗格式混乱的 PDF、对齐不同数据库的字段、处理版本控制。
不过限制也明显。非 OA 论文仍被付费墙挡住,而很多高影响力期刊恰恰不在开放获取之列。工具能覆盖的广度,最终取决于上游版权格局的变化。