add a new model for 'Laws' (#290)
### What problem does this PR solve? Issue link:#289 ### Type of change - [x] New Feature (non-breaking change which adds functionality)
This commit is contained in:
parent
923cbe488e
commit
243de6ac90
@ -172,8 +172,9 @@ $ docker compose up -d
|
|||||||
|
|
||||||
## 🆕 Latest Features
|
## 🆕 Latest Features
|
||||||
|
|
||||||
- Support [Ollama](./docs/ollama.md) for local LLM deployment.
|
- 2023-04-10 Add a new layout recognize model for method 'Laws'.
|
||||||
- Support Chinese UI.
|
- 2023-04-08 Support [Ollama](./docs/ollama.md) for local LLM deployment.
|
||||||
|
- 2023-04-07 Support Chinese UI.
|
||||||
|
|
||||||
## 📜 Roadmap
|
## 📜 Roadmap
|
||||||
|
|
||||||
|
|||||||
@ -171,9 +171,9 @@ $ docker compose up -d
|
|||||||
```
|
```
|
||||||
|
|
||||||
## 🆕 最新の新機能
|
## 🆕 最新の新機能
|
||||||
|
- 2023-04-10 メソッド「Laws」に新しいレイアウト認識モデルを追加します。
|
||||||
- [Ollama](./docs/ollama.md) を使用した大規模モデルのローカライズされたデプロイメントをサポートします。
|
- 2023-04-08 [Ollama](./docs/ollama.md) を使用した大規模モデルのローカライズされたデプロイメントをサポートします。
|
||||||
- 中国語インターフェースをサポートします。
|
- 2023-04-07 中国語インターフェースをサポートします。
|
||||||
|
|
||||||
## 📜 ロードマップ
|
## 📜 ロードマップ
|
||||||
|
|
||||||
|
|||||||
@ -172,8 +172,9 @@ $ docker compose up -d
|
|||||||
|
|
||||||
## 🆕 最近新特性
|
## 🆕 最近新特性
|
||||||
|
|
||||||
- 支持用 [Ollama](./docs/ollama.md) 对大模型进行本地化部署。
|
- 2023-04-10 为‘Laws’版面分析增加了模型。
|
||||||
- 支持中文界面。
|
- 2023-04-08 支持用 [Ollama](./docs/ollama.md) 对大模型进行本地化部署。
|
||||||
|
- 2023-04-07 支持中文界面。
|
||||||
|
|
||||||
## 📜 路线图
|
## 📜 路线图
|
||||||
|
|
||||||
|
|||||||
@ -14,6 +14,8 @@ import copy
|
|||||||
import re
|
import re
|
||||||
from io import BytesIO
|
from io import BytesIO
|
||||||
from docx import Document
|
from docx import Document
|
||||||
|
|
||||||
|
from api.db import ParserType
|
||||||
from rag.nlp import bullets_category, is_english, tokenize, remove_contents_table, hierarchical_merge, \
|
from rag.nlp import bullets_category, is_english, tokenize, remove_contents_table, hierarchical_merge, \
|
||||||
make_colon_as_title, add_positions, tokenize_chunks
|
make_colon_as_title, add_positions, tokenize_chunks
|
||||||
from rag.nlp import huqie
|
from rag.nlp import huqie
|
||||||
@ -23,7 +25,8 @@ from rag.settings import cron_logger
|
|||||||
|
|
||||||
class Docx(DocxParser):
|
class Docx(DocxParser):
|
||||||
def __init__(self):
|
def __init__(self):
|
||||||
pass
|
self.model_speciess = ParserType.LAWS.value
|
||||||
|
super().__init__()
|
||||||
|
|
||||||
def __clean(self, line):
|
def __clean(self, line):
|
||||||
line = re.sub(r"\u3000", " ", line).strip()
|
line = re.sub(r"\u3000", " ", line).strip()
|
||||||
|
|||||||
Loading…
x
Reference in New Issue
Block a user