项目名称:墨探
项目功能:网页转Markdown
项目简介:
一款将网页文章(如博客、新闻、文档等)转换为Markdown格式的工具。可以通过命令行工具快速转换网页内容,并支持将结果保存为文件或输出至标准输出。
墨探的开发初衷,是为了解决一个问题:如何将来自互联网上各种不同网站的文章内容,精准且高效地转换成统一的Markdown格式。
众所周知,万维网上的网站设计风格迥异,其HTML结构也呈现出千差万别的特点。这种多样性给自动化内容提取和格式转换带来了巨大的困难。要实现一个能够适应各种复杂HTML结构的通用解决方案,并非易事。
从特定的网站开始适配,以点到面,逐步抽取出通用的解决方案,最后尽可能多的覆盖更多网站。
功能介绍
- 支持大部分 html 元素转换
- 部分页面支持katex公式转换(示例:https://quantum.country/qcvc)
- 部分页面支持github gist(示例:https://towardsdatascience.com/hands-on-multi-agent-llm-restaurant-simulation-with-python-and-openai)
- 支持保存成文件或输出至
stdout - 支持突破某些网站的防爬虫策略(需安装插件)


直达链接:https://github.com/caol64/omni-article-markdown
扫码访问小程序中的本文


发表回复
要发表评论,您必须先登录。