将HTML网页转换为Markdown格式的工具及方法
2023/6/18 1:22:51
本文主要是介绍将HTML网页转换为Markdown格式的工具及方法,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
保存博客文章
早期在markdown语法还没有推出来之前,编写blog是在网页上或olw写的,也就是文章是保存在对方的主机上。
最近计划把我在博客园的一些早期html文章转换成markdown的文件,因为md更好地保存,经过实践之后,我保留这两个工具。
PS. 也尝试过python的脚本版本,但运行时会有报错,就省心地选用了相对稳定的工具。
我尝试的几种脚本 放在 html2md,本文提到的这两个工具是我推荐使用的。
最近更新
本文章写于2020年8月,但是最近2023年6月,我发现了一个更加好用的浏览器插件,支持把网页内容下载保存为markdown文件
edge扩展地址:MarkDownload - Markdown Web Clipper - Microsoft Edge Addons
那么现在我就直接使用edge的扩展,更加方便了。
html2md
地址:https://github.com/TruthHun/html2md
需要下载一个exe,在windows上使用,批量转换脚本如下:
@echo on for /r %%i in (*.html) do html2md.exe %%~pi%%~ni.html %%~pi%%~ni.md pause
这个工具转换出来的html更加简洁,我目前是使用这个脚本进行转换
pandoc
pandoc文档:https://pandoc.org/installing.html
使用方法:
安装 pandoc,并配置环境变量,在dos下使用下列语句转换格式。
pandoc text.html -o text.markdown
pandoc转换出来的html保留了原来的很多内容,比如一些特定的div #,比如这样子的
::: {.content}
::: {#outer_postBodyPS}
::: {#postBodyPS}
这篇关于将HTML网页转换为Markdown格式的工具及方法的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-05-30毕设私活神器
- 2024-05-30html
- 2024-05-09一定要避坑:关于微信H5分享,温馨提示你不要再踩坑了!!!
- 2024-05-09本地项目放到公网访问!炒鸡煎蛋!
- 2024-04-07金融企业区域集中库的设计构想和测试验证
- 2024-03-11前端CSS的工程化——掌握Sass这四大特性就够了
- 2024-02-21h5关联css样式(html怎么和css关联)-icode9专业技术文章分享
- 2024-02-07Firefox禁止远程字体加速网页加载及图标字体补充安装
- 2024-02-07一个菜鸡前端的3年总结-「2023」
- 2024-01-18最火前端Web组态软件(可视化)