1. ホーム
  2. pdf

[解決済み] PDFファイルの構造?[クローズド]

2023-08-02 16:38:30

質問

小さなプロジェクトで、私はpdfファイルを解析し、それらの特定の部分(文字の単純な連鎖)を取らなければなりません。私はこれを行うためにpythonを使用したいと思い、私はいくつかの方法で私が望むことを行うことができるいくつかのライブラリを見つけました。

しかし、今、いくつかの調査の後、私はpdfファイルの本当の構造が何であるか疑問に思っています。誰か、オンラインのどこかに仕様またはいくつかの説明があることを知っていますか?adobe でリンクを見つけましたが、それはデッド リンクのようです :(

どのように解決するのですか?

Adobeの参考資料へのリンクはこちらです。

http://www.adobe.com/devnet/pdf/pdf_reference.html

しかし、PDFはあくまでプレゼンテーションであって、構造ではないことを知っておく必要があります。解析は容易ではありません。