网页解析
深度抓取网页转Markdown
限时免费
0次调用
想要将复杂的网页转换为结构清晰的Markdown?这个接口采用异步处理模式,特别适合处理大型网页、复杂网站或需要长时间处理的转换任务。
POST
uapis.cn
/api/v1/web/tomarkdown/async
查询参数
1
url
string
required
需要转换的网页URL。URL必须经过编码。
功能概述
本API目前处于限时免费阶段,我们鼓励开发者集成和测试。未来,它将转为付费API,为用户提供更稳定和强大的服务。
UAPI Pro平台推出的异步网页转Markdown API能够将任意网页URL转换为结构清晰、格式优美的Markdown文本。提交任务后立即返回任务ID,不会阻塞客户端等待。您可以通过任务ID实时查询转换进度和处理状态,支持长达60秒的处理时间,轻松应对大型网站、需要JS渲染的单页应用等复杂页面。任务结果会缓存30分钟,期间可重复查询,过期任务自动清理无需手动管理。
此API采用先进算法,自动识别并抓取网页主体内容,精准剔除广告、导航栏、页眉页脚等无关元素。完美保留原文的格式,包括标题、列表、代码块、表格、引用、图片等,并输出为兼容性强的GitHub Flavored Markdown (GFM) 格式。同时会自动解析并提取文章标题、作者、发布日期、站点名称等关键元数据,并将其格式化为标准的YAML Front Matter,方便后续处理和CMS集成。
使用流程
调用本接口提交URL转换任务后,会立即获得一个唯一的任务ID。随后使用任务ID调用查询接口,获取任务状态和进度。任务完成后,从查询接口的响应中获取Markdown内容。
查询参数
url
stringrequired
需要转换的网页URL。URL必须经过编码。
响应
202 /
任务已提交成功,返回任务ID
400 / 错误的请求
请求参数错误