動態

詳情 返回 返回

pyparsing 與 regex 結合表達漢字等Unicode字符(qbit) - 動態 詳情

前言

  • 技術棧
python      3.11.8
pyparsing   3.2.1
regex       2024.11.6

測試案例

  • 測試代碼
# encoding: utf-8
# author: qbit
# date: 2025-02-05
# summary: 使用 pyparsing 和 sympy 化簡與或非邏輯表達式

import pyparsing as pp
import regex
# greet = pp.Word(pp.alphas) + "," + pp.Regex(r'\p{Han}+') + "!"
# 上面一句會報錯,因為 pyparsing 默認使用的內置 re 庫不支持 Unicode 正則
greet = pp.Word(pp.alphas) + "," + pp.Regex(regex.compile(r'\p{Han}+')) + "!"
hello = "Hello, 中國!"
print(hello, "->", greet.parseString(hello))
  • 測試輸出
Hello, 中國! -> ['Hello', ',', '中國', '!']

相關閲讀

  • pyparsing.Regex 官方文檔
  • 使用 pyparsing 和 sympy 化簡或非邏輯表達式
本文出自 qbit snap
user avatar codexiaosheng 頭像 zengjingaiguodekaomianbao 頭像 xiaohuzideboluo_cvmeub 頭像 lintp 頭像 yeshifu 頭像 aizuiyoujie 頭像 zailushang_5bdab5b6eaf7d 頭像
點贊 7 用戶, 點贊了這篇動態!
點贊

Add a new 評論

Some HTML is okay.