石井景都

Generation

generate functionMon, 17 Apr 2023

PDFファイルの全ページをエッジ検出して、切り取り。

// 拡張メソッド public static void ExtractTextAndImages(this PdfDocument document, string filename, string outputPath) { // ページ全体を切り取り document.ExtractTextAndImagesByPage(filename, outputPath, (i) => true); } // ページごとに指定する public static void ExtractTextAndImagesByPage(this PdfDocument document, string filename, string outputPath, Func<int, bool> isExtractPage) { for (int i = 0; i < document.NumberOfPages; i++) { var page = document.GetPage(i); if (isExtractPage(i)) { // 文字列の抽出 var text = page.ExtractText(); // 画像の抽出 page.ExtractImages(filename, outputPath, i); } } } //

Questions about programming?Chat with your personal AI assistant