PPT에서 Java의 텍스트 추출

몇 줄의 Java 코드로 PPT에서 텍스트를 추출합니다.


무료 평가판 다운로드

PPT 파일 Java API에서 텍스트를 추출하는 방법은 무엇입니까?

GroupDocs.Parser for Java는 텍스트, 이미지 및 메타데이터 추출기 API로, 원시, 구조화 및 형식화된 텍스트를 구문 분석하는 기능으로 비즈니스 애플리케이션을 구축하는 데 도움이 되는 50개 이상의 인기 있는 문서 유형을 지원합니다. 또한 사전 정의된 템플릿을 사용하여 문서 구문 분석을 지원하고 송장 및 기타 일반 문서에서 복잡한 데이터를 빠르고 정확하게 추출할 수 있습니다. GroupDocs.Parser for Java을 사용하면 Word 처리 문서, Excel 스프레드시트, PowerPoint 프레젠테이션, OneNote, PDF 파일 및 ZIP 아카이브를 포함하여 널리 사용되는 모든 형식의 비밀번호로 보호된 파일에서 텍스트 및 메타데이터를 추출할 수 있습니다.

GroupDocs.Parser API는 파일 텍스트 추출 기능이 필요한 기업 솔루션에 적합한 선택입니다. 이러한 API는 Java runtime: J2SE 6.0 and above를 포함한 모든 주요 운영 체제 및 플랫폼에서 잘 지원됩니다.

Java의 PPT에서 텍스트 추출

GroupDocs.Parser for Java를 사용하면 Java 개발자가 몇 가지 간단한 단계를 구현하여 PPT 파일에서 텍스트를 쉽게 추출할 수 있습니다.

  • 초기 문서에 대한 Parser 개체를 인스턴스화합니다.
  • getText 메서드를 호출하고 TextReader 개체;
  • 판독기가 null이 아닌지 확인합니다(문서에 대해 텍스트 추출이 지원됨).
  • 독자로부터 텍스트를 읽습니다.

Java 예제 코드를 사용하여 PPT 파일에서 텍스트를 추출하는 방법

// GroupDocs.Parser API를 사용하여 PPT 파일에서 텍스트 추출
// Parser 클래스의 인스턴스 생성
try (Parser parser = new Parser(filePath)) {
    // 텍스트를 리더기로 추출
    try (TextReader reader = parser.getText()) {
        // 문서에서 텍스트 인쇄
        // 텍스트 추출이 지원되지 않는 경우 판독기는 null입니다.
        System.out.println(reader == null ? "텍스트 추출은 지원되지 않습니다." : reader.readToEnd());
    }
}

시스템 요구 사항

GroupDocs.Parser for Java API는 모든 주요 플랫폼 및 운영 체제에서 지원됩니다. 아래 코드를 실행하기 전에 시스템에 다음 필수 구성 요소가 설치되어 있는지 확인하십시오.

  • 운영 체제: Microsoft Windows, Linux, MacOS
  • 개발 환경: NetBeans, Intellij IDEA, Eclipse, etc.
  • 프레임워크
  • Maven에서 GroupDocs.Parser for Java의 최신 버전을 다운로드하세요.

GroupDocs.Parser for Java를 사용하는 이유

  • 지원되는 모든 문서에서 일반 텍스트 추출 지원
  • 사용자 정의 템플릿을 통한 문서 분석
  • 구조화된 텍스트 추출을 완벽하게 지원
  • 키워드 및 정규 표현식을 통한 텍스트 검색
  • 형식이 지정된 텍스트, 메타데이터, 이미지, 컨테이너 및 첨부 파일 추출
  • 지원되는 일부 문서 형식의 목차 추출
  • PDF 문서에서 양식 데이터 구문 분석
  • 문서에서 하이퍼링크 추출

라이브 데모 - PPT 온라인에서 텍스트 추출

지금 바로 GroupDocs.Parser Live Demos 웹사이트를 방문하여 PPT 파일에서 텍스트를 추출하세요. 라이브 데모에는 다음과 같은 이점이 있습니다.

API를 다운로드할 필요가 없습니다

코드를 작성할 필요가 없습니다.

소스파일만 올려주세요

파일 저장을 위한 다운로드 링크 받기

다른 문서 형식에서 텍스트 추출

Java 파일 형식 및 이미지에 대한 문서 구문 분석 및 텍스트 추출 API. 아래에 설명된 대로 널리 사용되는 일부 파일 형식에 대한 데이터를 추출합니다.

TEX

(LaTeX Source Document)

VDX

(The 7th Guest Video File)

VSDM

(Visio Macro-Enabled Drawing)

VSDX

(Visio Drawing)

VSSM

(Visio Macro-Enabled Stencil File)

VSSX

(Visio Stencil File)

VSTM

(Visio Macro-Enabled Drawing Template)

VSTX

(Visio Drawing Template)

VSX

(Visio Stencil XML File)

VTX

(Anim8or 3D Model)

XLAM

(Excel Macro-Enabled Add-In)

XLS

(Microsoft Excel Spreadsheet (Legacy))

XLSB

(Excel Binary Workbook)

XLSM

(Macro-enabled Spreadsheet)

XLSX

(Open XML Workbook)

XLT

(Excel 97 - 2003 Template)

Back to top
 한국인