▌
주요기능
문서내 텍스트 추출
MS Office, PDF, HWP, 이미지, 메타데이터 추출
개인정보 검사, 문서 무결성 검사
Callback 기능(API) 제공
빠른 속도와 안정성
빠른 추출을 위한 멀티쓰레딩 지원
대용량 파일 텍스트 추출 안정성(메모리 사용량 절감▼)
경쟁 제품대비 주요 포맷 추출 속도 평균 36% ▲
멀티 OS 및 플랫폼 지원
Windows 계열 32, 64bit
Linux/Unix 계열 HP-UX, Solaris, AIX
MAC OS 지원
다양한 포맷 추출
Office 문서, hwp, hwpx, pdf, html, xml 지원
압축파일 지원(zip, alz, tar, gzip, egg, 7z, rar)
기타 : mge, eml 외 다수 지원
▌
작동방식
○ Docu-Parser 작동방식
– Docu-Parser는 다양한 문서파일들 내 컨텐츠를 Full Text로 추출하는 모듈입니다.
– 텍스트, 이미지, 문서 속성정보 등을 추출하여 다양한 솔루션과 연계를 지원합니다.
▌
적용분야
개인정보 보호솔루션
PC, 서버, 홈페이지 등 다양한 개인정보 검사를 위해 텍스트 추출 모듈 적용
정보유출방지 솔루션(DLP, DRM)
DLP, DRM 솔루션 검사를 위해 텍스트 추출 모듈 적용
검색엔진 솔루션
색인 DB 생성, 텍스트 미리보기 기능에 텍스트 추출 모듈 적용
메일 솔루션
메일 송/수신 시 스팸 메일 체크, 개인정보 검사 등을 위해 텍스트 추출 모듈 적용
그룹웨어 솔루션(CMS, KMS 등)
CMS, KMS 등에 다양한 형태로 활용 가능