使用Python開發(fā)Markdown兼容公式格式轉換工具
更新時間:2025年05月04日 09:16:47 作者:灝瀚星空
在技術寫作中我們經常遇到公式格式問題,例如MathML無法顯示,LaTeX格式錯亂等,所以本文我們將使用Python開發(fā)Markdown兼容公式格式轉換工具,有需要的小伙伴可以了解下
一、工具背景
在技術寫作中經常遇到公式格式問題:MathML無法顯示、LaTeX格式錯亂…
本工具實現以下核心功能:
- 自動轉換MathML到KaTeX
- 標準化LaTeX公式格式
- 保留原文其他內容
- 圖形化操作界面
工具效果演示
二、環(huán)境配置(Windows 10/11)
1. 創(chuàng)建conda環(huán)境
# 打開PowerShell執(zhí)行 conda create -n formula_tool python=3.8 conda activate formula_tool pip install tk lxml pyinstaller
2. 獲取XSLT轉換文件
# 下載MathML轉LaTeX的XSLT文件 Invoke-WebRequest -Uri "https://raw.githubusercontent.com/ronaldo1967/MathML-to-LaTeX/master/mathml2tex.xsl" -OutFile mathml2tex.xsl
三、完整Python代碼(帶GUI)
# formula_converter_gui.py import tkinter as tk from tkinter import scrolledtext, filedialog import re from lxml import etree import os class FormulaConverterGUI: def __init__(self, master): self.master = master master.title("公式格式轉換工具 v1.0") master.geometry("800x600") # 界面組件 self.create_widgets() self.xslt_path = "mathml2tex.xsl" def create_widgets(self): # 輸入框 self.input_label = tk.Label(self.master, text="輸入內容:") self.input_label.pack(pady=5) self.input_text = scrolledtext.ScrolledText(self.master, wrap=tk.WORD, height=15) self.input_text.pack(fill=tk.BOTH, expand=True, padx=10) # 操作按鈕 self.button_frame = tk.Frame(self.master) self.button_frame.pack(pady=10) self.convert_btn = tk.Button(self.button_frame, text="轉換公式", command=self.convert) self.convert_btn.pack(side=tk.LEFT, padx=5) self.clear_btn = tk.Button(self.button_frame, text="清空內容", command=self.clear) self.clear_btn.pack(side=tk.LEFT, padx=5) self.save_btn = tk.Button(self.button_frame, text="保存結果", command=self.save_file) self.save_btn.pack(side=tk.LEFT, padx=5) # 輸出框 self.output_label = tk.Label(self.master, text="轉換結果:") self.output_label.pack(pady=5) self.output_text = scrolledtext.ScrolledText(self.master, wrap=tk.WORD, height=15) self.output_text.pack(fill=tk.BOTH, expand=True, padx=10) # 狀態(tài)欄 self.status_bar = tk.Label(self.master, text="就緒", bd=1, relief=tk.SUNKEN, anchor=tk.W) self.status_bar.pack(side=tk.BOTTOM, fill=tk.X) def convert(self): content = self.input_text.get("1.0", tk.END) converted = self.process_content(content) self.output_text.delete("1.0", tk.END) self.output_text.insert(tk.END, converted) self.status_bar.config(text="轉換完成") def process_content(self, content): patterns = { 'latex_block': re.compile(r'\$\$(.*?)\$\$', re.DOTALL), 'latex_inline': re.compile(r'\$(.*?)\$'), 'mathml': re.compile(r'<math.*?>(.*?)</math>', re.DOTALL) } # 處理塊級公式 content = patterns['latex_block'].sub( lambda m: f'$$\n{m.group(1).strip()}\n$$', content ) # 處理行內公式 content = patterns['latex_inline'].sub( lambda m: f'${m.group(1).strip()}$', content ) # 處理MathML mathml_matches = patterns['mathml'].finditer(content) for match in mathml_matches: try: tex = self.mathml_to_tex(match.group(0)) content = content.replace(match.group(0), f'$$ {tex} $$') except Exception as e: self.status_bar.config(text=f"轉換失敗:{str(e)}") return content def mathml_to_tex(self, mathml_str): xslt = etree.parse(self.xslt_path) transform = etree.XSLT(xslt) doc = etree.fromstring(mathml_str) result = transform(doc) return str(result).strip() def clear(self): self.input_text.delete("1.0", tk.END) self.output_text.delete("1.0", tk.END) self.status_bar.config(text="已清空") def save_file(self): file_path = filedialog.asksaveasfilename( defaultextension=".md", filetypes=[("Markdown文件", "*.md"), ("所有文件", "*.*")] ) if file_path: with open(file_path, 'w', encoding='utf-8') as f: f.write(self.output_text.get("1.0", tk.END)) self.status_bar.config(text=f"文件已保存至:{file_path}") if __name__ == "__main__": root = tk.Tk() app = FormulaConverterGUI(root) root.mainloop()
四、核心功能解析
1. MathML轉換原理
def mathml_to_tex(mathml_str): xslt = etree.parse("mathml2tex.xsl") transform = etree.XSLT(xslt) return str(transform(etree.fromstring(mathml_str)))
2. 正則匹配引擎
# 塊級公式匹配 re.compile(r'\$\$(.*?)\$\$', re.DOTALL) # 行內公式匹配 re.compile(r'\$(.*?)\$')
五、工具使用說明
1. 界面操作流程
粘貼或輸入包含公式的內容
點擊"轉換公式"按鈕
查看右側轉換結果
使用"保存結果"導出Markdown文件
2. 支持格式示例
原始格式 | 轉換后格式 |
---|---|
<math>...</math> | $$ x = \frac{-b}{2a} $$ |
\Gamma(z)... | $$\Gamma(z)...$$ |
$E=mc^2$ | $E=mc^2$ |
到此這篇關于使用Python開發(fā)Markdown兼容公式格式轉換工具的文章就介紹到這了,更多相關Python Markdown格式轉換內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
使用Python處理Excel文件并將數據存儲到PostgreSQL的方法
在日常工作中,我們經常會遇到需要處理大量文件并將數據存儲至數據庫或整合到一個文件的需求,本文將向大家展示如何使用Python處理Excel文件并將數據存儲到PostgreSQL數據庫中,需要的朋友可以參考下2024-01-01