La conversione da PDF a HTML

C’è un .dll posso usare che utilizza un file PDF come input HTML e file di uscita?
Voglio convertire da PDF a HTML. Il mio collega dice che è molto difficile andare passo passo, ottenendo testo/font/immagine/margini/link etc. dal PDF e quindi la creazione di nuovi file HTML con lo stesso contenuto. Lui dice che è quasi impossibile. Quindi stavo pensando se c’è qualche dll che posso usare come riferimento per fare che?

  • E ‘ complicato, certo, ma perché la vuoi?
  • ci sono diverse html to pdf converter strumenti per il quale i fornitori offrono, ma non ho visto nessuno da pdf a html. Non so la versione completa è in grado di esportare in html si dovrebbe controllare questo fuori prima e vedere i risultati. Poi forse si può capire alcuni processi batch di utilizzo di acrobat todo esso. Solo un’idea…
  • Una ricerca sul web per “convertire da pdf a html” raccoglierà molte soluzioni possibili. COSÌ non è un buon posto per proposte di prodotti, quindi voto per chiudere come “non costruttivo”.
  • copia il contenuto pdf in word e poi salva come html.
  • Vedere questo post per un avvio di base sul testo di estrazione con iTextSharp stackoverflow.com/questions/6882098/…
  • Queste fanatici stanno andando a distruggere COSÌ… vorrei capire questa domanda per essere chiuso come duplicato, in quanto è stato chiesto un paio di volte, ma non costruttivo? davvero??? Ci sono migliaia di domande come questa (e peggio) in MODO che è stato considerato valido. Hai intenzione di chiudere subito tutte le richieste per le biblioteche che risolvere il problema X?
  • Qui è un vecchio duplicato di questa domanda: stackoverflow.com/questions/1638937/…



3 Replies
  1. 11

    Scrittura di un programma per farlo non è assolutamente banale. Se non riesci a trovare qualsiasi .Libreria di rete per fare questo (non ho potuto, almeno non gratis), vorrei solo scarica questo e di richiamarla a livello di codice per ottenere il mio html.

    Se si ha il tempo di ricambio e/o PDFToHtml non produce output accettabile per voi, si potrebbe utilizzare iText per scrivere il programma in se stessi. E ‘ molto maturo, libero pdf library. Io l’ho usato in passato per manipolare i Pdf (unire, creare, ecc).

    AGGIORNAMENTO

    Come indicato nel commento di Incertezza, il PDFSharp biblioteca offre un ambiente più rilassato di licenza (MIT) rispetto ai Commerciali o di licenza AGPL offerti da iText. Tenere questo in mente quando si sceglie la vostra libreria. Non ho utilizzato il PDFSharp biblioteca di me e non so come si confronta in termini di funzionalità.

    • Se qualcuno fa questo, è meglio usare pdfsharp, ha la migliore licenza.
    • Sul PDFSharp FAQ essi dichiarano che la loro raccolta non convertire da PDF a HTML e non hanno piani per il supporto. pdfsharp.net/wiki/…
  2. 8

    È possibile scaricare questo tool gratuito: PDFToHTML

    Poi nel tuo programma il fork di un nuovo processo ed eseguire il file eseguibile passando il file PDF. Ho appena provato ora e sembra funzionare bene.

  3. 6

    Se non ti dispiace pagare, Aspose offre una soluzione molto buona, che possiamo utilizzare all’interno della mia azienda.

    http://www.aspose.com/categories/.net-components/aspose.pdf-for-.net/key-features.aspx

    • Noi, troppo. Inoltre, recentemente il prodotto Guglia si presentò, fornendo strumenti simili per Aspose.
    • aspose non funziona come facilmente come la pubblicità e il codice html risultante è davvero male, in più se avete bisogno di in memoria di conversione non è necessario per la conversione di doc in primo luogo poi doc in html

Lascia un commento