C#でDOCXファイルからメタデータを抽出する

読む&さまざまなドキュメント、画像、音声、音声からメタデータ情報を抽出します。 GroupDocs.Metadata for .NET APIを使用したビデオ形式.


無料トライアルをダウンロード

GroupDocs.Metadata for .NET APIについて

GroupDocs.Metadata for .NETは、メタデータ管理および操作機能の高度なセットを提供し、開発者が画像やドキュメント形式からメタデータ情報を簡単に読み取り、編集、削除、検索、比較、置換、およびエクスポートできるようにします。外部ソフトウェアを使用せずに。 PDF、Word、Excel、PowerPoint、Outlook、OneNote、Visio、Project、AutoCAD、Archive、Multimediaのファイル形式からメタデータの詳細を抽出し、サポートされているメタデータ操作を真の柔軟性で実行します。

C#でのDOCXメタデータ抽出の手順

GroupDocs.Metadataを使用すると、.NET開発者は、いくつかの簡単な手順を実行することで、アプリケーション内からDOCXファイルからメタデータ情報を簡単に読み取って抽出できます。

  • メタデータクラスのインスタンスを使用してDOCXをロードします。
  • すべてのメタデータプロパティを調べるための述語を作成します。
  • 述語をFindPropertiesメソッドに渡します。
  • 見つかったプロパティを繰り返し処理します。

システム要求

GroupDocs.Metadata for .NET APIは、すべての主要なプラットフォームとオペレーティングシステムでサポートされています。以下のコードを実行する前に、システムに次の前提条件がインストールされていることを確認してください。

  • オペレーティングシステム:Microsoft Windows、Linux、MacOS
  • 開発環境:Visual Studio、Xamarin、MonoDevelop
  • フレームワーク:.NET Framework、.NET Standard、.NET Core、Mono
  • NuGetから最新バージョンのGroupDocs.Metadatafor.NETをダウンロードします。

using (var metadata = new GroupDocs.Metadata.Metadata("input.docx"))
{
	//特定のカテゴリに分類されるすべてのメタデータプロパティを抽出します
	var properties = metadata.FindProperties(
		p => p.Tags.Any(t => t.Category == GroupDocs.Metadata.Tagging.Tags.Content));

	//すべてのプロパティを繰り返して表示します
	foreach (var property in properties)
	{
		Console.WriteLine("{0} = {1}", property.Name, property.Value);
	}

	//特定のタイプと値を持つすべてのプロパティを抽出します
	var year = DateTime.Today.Year;
	properties = metadata.FindProperties(
		p => p.Value.Type == GroupDocs.Metadata.Common.MetadataPropertyType.DateTime &&
		p.Value.ToStruct(DateTime.MinValue).Year == year);

	//年の値が現在の年と等しいすべての日時プロパティを表示します
	foreach (var property in properties)
	{
		Console.WriteLine("{0} = {1}", property.Name, property.Value);
	}

	//指定された正規表現に一致する名前を持つすべてのプロパティを抽出します
	const string pattern = "^author|company|(.+date.*)$";
	var regex = new System.Text.RegularExpressions.Regex(pattern,
		System.Text.RegularExpressions.RegexOptions.IgnoreCase);
	properties = metadata.FindProperties(p => regex.IsMatch(p.Name));

	//名前が次のパターンに一致するプロパティを表示します
	foreach (var property in properties)
	{
		Console.WriteLine("{0} = {1}", property.Name, property.Value);
	}
}

メタデータ抽出ライブデモ

GroupDocs.Metadataライブデモサイトにアクセスして、DOCXファイルのメタデータ情報を今すぐ取得してください。
ライブデモには次の利点があります

APIをダウンロードする必要はありません

コードを書く必要はありません

ソースファイルをアップロードするだけです

ファイルを保存するためのダウンロードリンクを取得する

DOCXファイル形式について

DOCXは、MicrosoftWord文書でよく知られている形式です。 2007年からMicrosoftOffice2007のリリースで導入されたこの新しいドキュメント形式の構造は、プレーンバイナリからXMLファイルとバイナリファイルの組み合わせに変更されました。 Docxファイルは、Word 2007およびラテラルバージョンで開くことができますが、DOCファイル拡張子をサポートする以前のバージョンのMSWordでは開くことができません。

続きを読む DOCXファイル形式について
Back to top
 日本