Задача: проверить, можно ли распарсить файл резюме pdf с hh |
function requireFilesOfFolder($dir) { foreach (new DirectoryIterator($dir) as $fileInfo) { if (!$fileInfo->isDot()) { if ($fileInfo->isDir()) { requireFilesOfFolder($fileInfo->getPathname()); } else { require_once $fileInfo->getPathname(); } } } } $rootFolder = 'Smalot/PdfParser'; //путь до библиотеки, у меня лежит в той же папке, что и скрипт // Manually require files, which can't be loaded automatically that easily. require_once $rootFolder.'/Element.php'; require_once $rootFolder.'/PDFObject.php'; require_once $rootFolder.'/Font.php'; require_once $rootFolder.'/Page.php'; require_once $rootFolder.'/Element/ElementString.php'; require_once $rootFolder.'/Encoding/AbstractEncoding.php'; /* * Load the rest of PDFParser files from /src/Smalot/PDFParser * Dont worry, it wont load files multiple times. */ requireFilesOfFolder($rootFolder); |
$parser = new \Smalot\PdfParser\Parser(); $pdf = $parser->parseFile('resume.pdf'); $text = $pdf->getText(); echo $text; echo "<hr>"; $i = 1; foreach($pdf->getPages() as $page){ echo "<h2>Страница ".$i."</h2>"; $data = $page->getDataTm(); echo "<pre>"; print_r($data); echo "</pre>"; echo "<hr>"; $i++; } |
можно дальше попробовать с этим работать