GroupDocs.Parser for .NET は、C#、ASP.NET、その他の .NET テクノロジーを使用して開発されたビジネス アプリケーション用のテキスト、メタデータ、画像抽出 API です。サポートされている形式のファイルからの生の、書式設定および構造化されたテキストとメタデータの抽出をサポートします。 GroupDocs.Parser for .NET を通じて、アプリケーションは、Word 処理ドキュメント、Excel スプレッドシート、PowerPoint プレゼンテーション、OneNote、PDF ファイル、ZIP アーカイブなどの一般的な形式のパスワードで保護されたドキュメントの解析を実行することもできます。 。
GroupDocs.Parser API は、ファイル テキスト抽出機能を必要とする企業ソリューションに最適です。これらの API は、Frameworks: .NET Framework, .NET Standard, .NET Core, Mono を含むすべての主要なオペレーティング システムおよびプラットフォームで十分にサポートされています。
GroupDocs.Parser for .NET を使用すると、C# 開発者は、いくつかの簡単な手順を実装することで、PDF ファイルからテキストを簡単に抽出できます。
// GroupDocs.Parser API を使用して PDF ファイルからテキストを抽出します
// Parserクラスのインスタンスを作成する
using (Parser parser = new Parser(filePath)) {
// テキストをリーダーに抽出する
using (TextReader reader = parser.GetText()) {
// ドキュメントからテキストを印刷する
// テキスト抽出がサポートされていない場合、リーダーは null になります
Console.WriteLine(reader == null ? "テキスト抽出はサポートされていません" : reader.ReadToEnd());
}
}
GroupDocs.Parser for .NET API は、すべての主要なプラットフォームとオペレーティング システムでサポートされています。以下のコードを実行する前に、次の前提条件がシステムにインストールされていることを確認してください。
GroupDocs.Parser ライブ デモ Web サイトにアクセスして、今すぐ PDF ファイルからテキストを抽出します。 ライブデモには次のようなメリットがあります。
APIをダウンロードする必要はありません
コードを書く必要はありません
ソースファイルをアップロードするだけです
ファイルを保存するためのダウンロードリンクを取得する
.NET ファイル形式と画像のドキュメント解析とテキスト抽出 API。以下に示すように、いくつかの一般的なファイル形式のデータを抽出します。
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)
(Visio Stencil XML File)
(Anim8or 3D Model)
(Excel Macro-Enabled Add-In)
(Microsoft Excel Spreadsheet (Legacy))