AI 文字辨識及擷取 (OCR)

高準確度、可客製化的完整 OCR 方案。支援雲端及離線部署,彈性貼合不同需求。

為何選擇我們

一流準確度

可支援手寫字

應用廣泛

支援各種文件,雲端、API 及離線部署

AI 落地經驗豐富

深得信賴的 AI 方案夥伴

運作流程

Image
  1. 1

    文件預處理 (Document Pre-processing)

    自動因應掃瞄文件進行預處理,包括角度校正 (Orientation adjustment)、對比度調整 (Contrast adjustment)、雜訊修正 (image noise cancelling)、偏移校正 (Deskewing) 等

  2. 2

    以先進 AI OCR 識別文字

    利用經超過 10,000,000 條英語、5,000,000 條中文手寫字數據訓練的先進 AI OCR 識別文字,經驗證手寫字辨識準確度高達 85%,打印字更可達 99%

  3. 3

    抽取所需資料

    根據文件種類以位置、標題、命名實體辨識 (Named Entity Recognition, NER) 及生成式 AI (Generative AI) 提取結構化 (Structured)、半結構化 (Semi-structured) 及非結構化 (Non-structured) 資料。

  4. 4

    多種格式輸出資料

    以下載 CSV、API 接駁或儲存至數據庫等方式輸出資料

應用案例

電梯事故通知書 OCR 電子化系統
Lift & Escalator Incident Form OCR

Datax 打造 AI OCR 電梯事故通知電子化系統,實現文件自動電子化、分類及資料提取。系統整合自家研發 OCR 技術,提取資料同時提供信賴水平 (Confidence level) 和邏輯檢查警示 (Logic checking alert) ,支持數據庫存儲、CSV 和 API 輸出,大幅減少 80% 資料處理時間。

✏️ 手寫字、電腦字 (handwritings and typed content)
🅰️ 繁體中文、簡體中文、英文、數字、標點符號
📄 表格 (結構化文件 Sturctured document)
💻 在地伺服器部署 (On-premise deployment on a server)

image image
image image

職位申請書 OCR 電子化系統
Job Application Form OCR

Datax 為政府部門開發「職位申請書 AI OCR 電子化系統」,將每年超過萬份申請書以 OCR 數位化及資料提取。系統可應對多樣性的手寫文檔,簡化資料校對,存儲及生成 Excel 報告,助員工節省 85% 資料處理時間。

✏️ 手寫字、電腦字 (handwritings and typed content)
🅰️ 繁體中文、簡體中文、英文、數字、標點符號
📄 表格 (結構化文件 Sturctured document)
💻 私有雲端部署 (Private cloud deployment)

手提滅火設備掃瞄應用程式
Portable Equipment Image OCR

由客戶與 Datax 合作開發,利用 AI OCR 技術,公眾只需拍攝一張照片,就可以搜索已獲批准的手提滅火設備。系統利用先進的 AI OCR 模型識別圖像上的文字並提取關鍵信息,如手提滅火設備的型號和製造商,再將符合的設備信息顯示給用戶,幫助用戶自行在家居購買和維護手提滅火設備。

✏️ 電腦字 (Typed content)
🅰️ 繁體中文、簡體中文、英文、數字、標點符號
📄 產品圖片 (非結構化文件 Non-sturctured document)
💻 雲端部署 (Cloud deployment)

image
image image

發票、收據 AI 電子化系統
Invoice & Receipt OCR

在商業的繁忙世界中,各種形式的發票、收據等商業和採購文件的處理,往往成為公司最大的痛點。Datax 的發票、收據 AI 電子化系統,融合AI OCR 及 GPT-4 生成式 AI 技術,實現從各類文檔自動提取資料。生成式 AI 可以利用其龐大的預訓練數據和知識,令系統無需訓練即可從半結構化和非結構化文件中提取資料,客戶不需再花時間設定文件樣板。

系統具有極大的彈性,能夠靈活地處理各種格式,甚至是全新未見過的文件,能大幅提升處理效率與準確性,助企業聚焦核心業務。

✏️ 手寫字、電腦字 (handwritings and typed content)
🅰️ 繁體中文、簡體中文、英文、數字、標點符號
📄 發票、收據、訂單等 (半結構化文件 Semi-sturctured document)
💻 雲端部署 (Cloud deployment)

貸款協議 AI 資料提取系統
Loan Agreement Info Extraction

Datax 的先進 AI OCR 技術將掃描的貸款協議和合約電子化,再根據不同的資料欄位,使用位置、標題及命名實體辨識 (Named Entity Recognition, NER) 來提取出結構化和半結構化的數據。系統亦可根據貸款協議上對不同資料的定義,即時調整需要提取的數據。例如,它能辨識不同的日期,以及被提及的公司,令整個流程得以全面自動化,大幅降低了人力成本,也避免了由於人為錯誤而導致的風險。

✏️ 電腦字 (Typed content)
🅰️ 繁體中文、英文、數字、標點符號
📄 貸款協議、合約 (半結構化文件 Semi-sturctured document)
💻 在地及雲端部署 (On-premise and cloud deployment)

image