网页解析
深度抓取网页信息
限时免费
0次调用
UAPI Pro平台推出的一款商业级内容处理API。它能够将任意网页URL转换为结构清晰、格式优美的Markdown文本。此API旨在为开发者、内容创作者和数据分析师提供一个强大而高效的工具,自动化地从网页中提取核心内容并进行格式化。
GET
uapis.cn
/api/v1/web/tomarkdown
查询参数
1
url
string
required
需要转换的网页URL。URL必须经过编码。
核心特性
本API目前处于限时免费阶段,我们鼓励开发者集成和测试。未来,它将转为付费API,为用户提供更稳定和强大的服务。
- 智能内容提取: 采用先进算法,自动识别并抓取网页主体内容,精准剔除广告、导航栏、页眉页脚等无关元素。
- 高质量Markdown转换: 完美保留原文的格式,包括标题、列表、代码块、表格、引用、图片等,并输出为兼容性强的GitHub Flavored Markdown (GFM) 格式。
- 元数据提取: 自动解析并提取文章标题、作者、发布日期、站点名称等关键元数据,并将其格式化为标准的YAML Front Matter,方便后续处理和CMS集成。
- 动态/静态页面自适应: API能够智能判断目标页面的技术类型。对于JS动态渲染的复杂页面(如SPA应用),它会自动启用浏览器渲染引擎进行深度抓取;对于静态页面,则采用轻量级方式快速获取,从而在保证内容完整性的同时,兼顾了处理速度和成本效益。
查询参数
url
stringrequired
需要转换的网页URL。URL必须经过编码。
响应
200 / 请求成功
成功响应
400 / 错误的请求
请求参数错误
401 / 未经授权
认证失败
500 / 服务器内部错误
服务器内部错误