C# - pdf dosyası ayrıştırıp metin dosyasına dönüştürmek

"Converting PDF to Text in C#"

Pdf dosyasını nasıl ayrıştırır, metin dosyası haline getiririm diye bakınırken, yukarıdaki başlığa sahip yazıyı buldum. Kaynak kodu, ve gerekli kütüphaneyi indirip yönergeleri de izledim ama belirtilen kütüphanelerin versiyonları değiştiği için uyumsuzluk oluştu ve kod çalışmadı.

Biraz uğraştırdı ama şu adımları izleyerek çalıştırdım en sonunda:

1) pdf2text_src.zip i ac.
2) PDFBox-0.7.2.zip i ac.
3) PDFBox-0.7.2\bin icerisindeki IKVM.GNU.Classpath.dll, IKVM.Runtime.dll ve PDFBox-0.7.2.dll yi pdf2text_src\src icerisine kopyala.
4) Pdf2Text.sln projesini aç ve eksik olan iki referans dosyasını sil.
5) Pdf2Text.sln projesine, IKVM.GNU.Classpath.dll ve PDFBox-0.7.2.dll dosyalarını ekle.
6) projeyi derle
7) pdf2text_src\src\bin\Debug klasöründe oluşan Pdf2Text.exe yi kontrol et.
8) komut satırından "PDF2TEXT input_filename(PDF) output_filename(text)" komutunu çalıştır. (Örn. Pdf2Text.exe c:\fatura.pdf c:\ftr.txt)

İşimi görecek sanırım :)

Hiç yorum yok: