GitHub - tianchiguaixia/medical_ocr_streamlit: 该项目主要是为了识别图片里面的表格数据，并将表格数据抽取处理，导出成csv的文件。整个项目会使用streamlit进行部署和展示。使用的技术：paddleocr，PPStructure，streamlit

医学图片的ocr识别

该项目主要使用百度的paddleocr对医学图片进行识别。利用PPStructure对识别的内容进行结构化，最终将结构化的内容保存成csv文件。整个项目通过streamlit进行前端的展示。

├── AI-医学图片OCR.py  # 前端展示
├── ocr
│   ├── __init__.py  # 初始化
│   ├── ocr.py       # ocr识别
│   └── utils.py     # 一些工具函数
├── ocr_utils.py     # 一些工具函数

streamlit run  AI-医学图片OCR.py

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
img		img
ocr		ocr
AI-医学图片OCR.py		AI-医学图片OCR.py
README.md		README.md
ocr_utils.py		ocr_utils.py
requirements.txt		requirements.txt