隨著信息技術(shù)的迅猛發(fā)展,光學(xué)字符識別(OCR)技術(shù)在各行各業(yè)中的應(yīng)用日益廣泛。為滿足企業(yè)對于信息抽取精度、版式覆蓋全面性、迭代速度與靈活度的不斷提升的需求,合合信息基于深度學(xué)習(xí)算法和能力,對其文字識別訓(xùn)練平臺進行了優(yōu)化升級,為企業(yè)提供低代碼、自動化的一站式OCR開發(fā)解決方案。
合合信息文字識別訓(xùn)練平臺是面向零基礎(chǔ)的開發(fā)者或?qū)嶋H業(yè)務(wù)人員的全流程一站式OCR開發(fā)平臺。針對文本檢測、文字識別、文檔分類、信息抽取等任務(wù),基于先進的深度學(xué)習(xí)算法,提供了集模型創(chuàng)建、數(shù)據(jù)標注、模型訓(xùn)練、模型測試、模型部署于一體的機器學(xué)習(xí)服務(wù)。
用戶僅需通過簡單的框選和點擊操作,即可在Textin Studio的可視化界面中迅速完成模型的創(chuàng)建、數(shù)據(jù)標注、訓(xùn)練、測試以及部署,有效解決了定制化識別開發(fā)門檻高、周期長的問題。
值得一提的是,合合信息文字識別訓(xùn)練平臺內(nèi)置了五大預(yù)訓(xùn)練算法模型,包括信息抽取(錨點)、信息抽取(K-V)、信息抽取(NLP)、信息抽取(長文本)以及分類識別。這些模型能夠靈活應(yīng)對固定版式、半固定版式、不固定版式的單頁與多頁文檔的信息抽取與分類需求,不僅提升了識別的準確性,還降低了模型訓(xùn)練的難度。
此外,平臺還具備數(shù)據(jù)回流功能。通過搭建數(shù)據(jù)回流交換平臺,平臺能夠連接業(yè)務(wù)平臺與文字識別訓(xùn)練平臺,將實際業(yè)務(wù)中產(chǎn)生的標注信息數(shù)據(jù)進行整合、統(tǒng)計后回流至訓(xùn)練平臺,從而不斷提升模型的識別準確率,實現(xiàn)真正的智能化和終身自主學(xué)習(xí)。
在數(shù)據(jù)標注環(huán)節(jié),合合信息文字識別訓(xùn)練平臺也展現(xiàn)出了其獨特的創(chuàng)新。通過系統(tǒng)自動標注數(shù)據(jù),人工僅需進行復(fù)核,極大地降低了數(shù)據(jù)標注的耗時與人力成本。同時,當(dāng)訓(xùn)練數(shù)據(jù)不足時,平臺還能基于模板和語料知識庫自動生成海量虛擬訓(xùn)練數(shù)據(jù),從而快速擴充訓(xùn)練集,提升模型訓(xùn)練效果。
某上市城商行已通過私有化部署該平臺,成功實現(xiàn)了身份證、駕駛證、發(fā)票等多種證照票據(jù)的自動識別,滿足了多業(yè)務(wù)場景的需求。同時,通過搭建數(shù)據(jù)回流交換平臺,該行實現(xiàn)了對OCR服務(wù)的統(tǒng)一管理,提升了審核效率。
(新媒體責(zé)編:wa12)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權(quán)轉(zhuǎn)載應(yīng)在授權(quán)范圍內(nèi)使用,并注明來源。
2、部分內(nèi)容轉(zhuǎn)自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3、如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。電話:010-67683008
人民交通24小時值班手機:17801261553 商務(wù)合作:010-67683008轉(zhuǎn)602 E-mail:zzs@rmjtzz.com
Copyright 人民交通雜志 All Rights Reserved 版權(quán)所有 復(fù)制必究 百度統(tǒng)計 地址:北京市豐臺區(qū)南三環(huán)東路6號A座四層
增值電信業(yè)務(wù)經(jīng)營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務(wù)所 李大偉
京公網(wǎng)安備 11010602130064號 京ICP備18014261號-2 廣播電視節(jié)目制作經(jīng)營許可證:(京)字第16597號