このハウツー チュートリアルでは、C# で HTML を Text に変換するための段階的なプロセスについて説明します。このガイドでは、ドキュメント コンバーター ライブラリをセットアップするための詳細な情報、ドキュメント変換を実行するための段階的な手順、C# で HTML をプレーン テキストに変換する 機能のサンプル コードを提供します。ここでは、C# を使用して HTML をテキストに変換するための実際の例とともに、詳細な手順を示します。
C# で HTML をテキストに変換する手順
- C# HTML をプレーン テキスト機能に実装するために、.NET プロジェクトの NuGet から GroupDocs.Conversion for .NET パッケージをインストールします。
- GroupDocs.Conversion 名前空間への参照を追加して、HTML をテキストに変換します
- Converter クラスをインスタンス化し、入力 HTML ファイルをそのコンストラクターに渡します
- WordProcessingConvertOptions クラスを初期化し、テキスト ドキュメントをカスタマイズするためのパラメータを定義します
- 最後に、Convert メソッドを呼び出して、HTML をテキストとして保存します。
上記のポイントにより、HTML C# からプレーン テキストを取得 機能を簡単かつ迅速に実装できます。 NuGet Web サイトから必要なパッケージをインストールし、3 ~ 4 行のコードを記述し、いくつかの API 呼び出しを使用してドキュメントの変換を完了するだけです。さらに、これらの手順は追加のサードパーティ ツールを必要とせず、MS Windows、Linux、Mac OS などの任意のオペレーティング システムに実装できます。
C# で HTML をテキストに変換するコード
上記の例は、前のセクションで定義した手順に従って HTML をプレーン テキスト C# に変換する 機能を実装することによって開発されました。ご覧のとおり、入力 HTML ドキュメントを読み込むために Converter クラスを使用し、WordProcessingConvertOptions オブジェクトを使用して出力ファイル形式を設定しました。最後に、Convert メソッドを呼び出して、結果のファイルをディスクに保存しました。
C# の HTML からプレーン テキストを取得する機能を実装するためのドキュメント変換プロセスに集中しました。最近、C# で PDF を CSV に変更する記事を公開しました。詳細については、C#を使用してPDFをCSVに変換する方法 ガイドをご覧ください。