博客 / 詳情

返回

本地使用PaddleOCR進行圖片識別獲得文字(返回JSON)

優點

✅ 識別率高,支持繁簡中文和手寫識別
✅ 支持角度檢測,避免文字方向影響識別效果
✅ 還能識別表格、票據等複雜場景

方法

pip install paddleocr
pip install paddlepaddle

(如果你有 GPU,可以安裝 paddlepaddle-gpu 以加速識別)

使用示例

from paddleocr import PaddleOCR

ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # 使用中文模型,支持角度校正
result = ocr.ocr("example.png", cls=True)  # 識別圖像
for line in result:
    print(line)  # 輸出識別結果

指定GPU加速

from paddleocr import PaddleOCR

# 初始化 OCR,強制使用 GPU(如果有多張 GPU,可以設置 use_gpu=0, 1, 2...)
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0) 

# 讀取圖片並識別
result = ocr.ocr("example.png", cls=True)

# 輸出識別結果
for line in result:
    print(line)

返回JSON

import json
from paddleocr import PaddleOCR

# 初始化 OCR,使用 GPU
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0)

# 讀取圖片並識別
result = ocr.ocr("example.png", cls=True)

# 處理結果,提取文字信息
output_data = []
for line in result:
    for word_info in line:
        text = word_info[1][0]  # 獲取識別的文本
        confidence = word_info[1][1]  # 獲取置信度
        output_data.append({"text": text, "confidence": confidence})

# 轉換為 JSON 格式
json_output = json.dumps(output_data, ensure_ascii=False, indent=4)

# 輸出 JSON 結果
print(json_output)

識別效果
image.png

user avatar gaoming13 頭像 pugongyingxiangyanghua 頭像 yihan123 頭像 elastic_computing 頭像 jyeontu 頭像 fedl 頭像 ni_5e1946a1c2171 頭像 zhuoooo 頭像 lllllxt 頭像 haiyangzhilan 頭像 hellotech 頭像 ishy 頭像
12 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.