ALERT!!! С 1.01.2025 без подписки на Маркет отвалятся: телефония, почти все приложения, rest api, вебхуки! ->

Pdf парсер на php

Задача:
проверить, можно ли распарсить файл резюме pdf с hh
https://github.com/smalot/pdfparser/tree/master - библиотека
function requireFilesOfFolder($dir)
{
    foreach (new DirectoryIterator($dir) as $fileInfo) {
        if (!$fileInfo->isDot()) {
            if ($fileInfo->isDir()) {
                requireFilesOfFolder($fileInfo->getPathname());
            } else {
                require_once $fileInfo->getPathname();
            }
        }
    }
}

$rootFolder = 'Smalot/PdfParser'; //путь до библиотеки, у меня лежит в той же папке, что и скрипт

// Manually require files, which can't be loaded automatically that easily.
require_once $rootFolder.'/Element.php';
require_once $rootFolder.'/PDFObject.php';
require_once $rootFolder.'/Font.php';
require_once $rootFolder.'/Page.php';
require_once $rootFolder.'/Element/ElementString.php';
require_once $rootFolder.'/Encoding/AbstractEncoding.php';

/*
 * Load the rest of PDFParser files from /src/Smalot/PDFParser
 * Dont worry, it wont load files multiple times.
 */
requireFilesOfFolder($rootFolder);



$parser = new \Smalot\PdfParser\Parser();

$pdf = $parser->parseFile('resume.pdf');
$text = $pdf->getText();
echo $text;
echo "<hr>";
$i = 1;
foreach($pdf->getPages() as $page){
   echo "<h2>Страница ".$i."</h2>";
   $data = $page->getDataTm();
   echo "<pre>";
   print_r($data);
   echo "</pre>";
   echo "<hr>";
   $i++;
}
Что-то выводит,
можно дальше попробовать с этим работать