OMNI-ARTICLE-MARKDOWN(1)

NAME

omni-article-markdown墨探 - 轻松将网页文章转换为 Markdown 格式的 CLI 工具。 Turn any web article into clean Markdown via CLI

SYNOPSIS

$pip install omni-article-markdown

INFO

95 stars
11 forks
0 views

DESCRIPTION

墨探 - 轻松将网页文章转换为 Markdown 格式的 CLI 工具。 Turn any web article into clean Markdown via CLI

README

墨探 (omni-article-markdown)

PyPI Python License PyPI Downloads Docker Pulls Stars

轻松将网页文章(博客、新闻、文档等)转换为 Markdown 格式。

简介

墨探的开发初衷,是为了解决一个问题:如何将来自互联网上各种不同网站的文章内容,精准且高效地转换成统一的Markdown格式。

众所周知,万维网上的网站设计风格迥异,其HTML结构也呈现出千差万别的特点。这种多样性给自动化内容提取和格式转换带来了巨大的困难。要实现一个能够适应各种复杂HTML结构的通用解决方案,并非易事。

我的想法是:从特定的网站开始适配,以点到面,逐步抽取出通用的解决方案,最后尽可能多的覆盖更多网站。

功能介绍

以下是一些网站示例,大家可以自己测试下效果。

站点链接备注
Mediumlink
csdnlink
掘金link
公众号link
网易link
简书link
Towards Data Sciencelink
Quantamagazinelink
Cloudflare博客link
阿里云开发者社区link
微软技术文档link
InfoQlink
博客园link
思否link
开源中国link
Forbeslink
少数派link
语雀link
腾讯云开发者社区link
人人都是产品经理link
Jetbrains博客link
Claude文档link
Anthropiclink
Meta博客link
Android Developers Bloglink
Spring Bloglink
Hackernoonlink
领英博客link
华尔街见闻link
苹果开发者文档link
百家号link
Snowflake 技术博客link
知乎专栏link
今日头条link
X Articleslink
飞书link
Freediumlink已失效

安装方式

方式一:pip(推荐)

pip install omni-article-markdown

安装完成后即可使用:

mdcli --help

基本用法

仅转换

mdcli https://example.com

保存到当前目录

mdcli https://example.com -s

保存到指定路径

mdcli https://example.com -s /home/user/

架构说明

墨探主要分为三个模块:

  • Reader 模块的功能是读取整个网页内容
  • Extractor 模块的功能是提取正文内容,清理无用数据
  • Parser 模块的功能是将 HTML 转换为 Markdown

贡献与反馈

赞助

如果你觉得墨探对你有帮助,可以给我家猫咪买点罐头 ❤️

https://yuzhi.tech/sponsor

License

MIT License

SEE ALSO

clihub4/8/2026OMNI-ARTICLE-MARKDOWN(1)