| Задача: проверить, можно ли распарсить файл резюме pdf с hh |
function requireFilesOfFolder($dir)
{
foreach (new DirectoryIterator($dir) as $fileInfo) {
if (!$fileInfo->isDot()) {
if ($fileInfo->isDir()) {
requireFilesOfFolder($fileInfo->getPathname());
} else {
require_once $fileInfo->getPathname();
}
}
}
}
$rootFolder = 'Smalot/PdfParser'; //путь до библиотеки, у меня лежит в той же папке, что и скрипт
// Manually require files, which can't be loaded automatically that easily.
require_once $rootFolder.'/Element.php';
require_once $rootFolder.'/PDFObject.php';
require_once $rootFolder.'/Font.php';
require_once $rootFolder.'/Page.php';
require_once $rootFolder.'/Element/ElementString.php';
require_once $rootFolder.'/Encoding/AbstractEncoding.php';
/*
* Load the rest of PDFParser files from /src/Smalot/PDFParser
* Dont worry, it wont load files multiple times.
*/
requireFilesOfFolder($rootFolder);
|
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('resume.pdf');
$text = $pdf->getText();
echo $text;
echo "<hr>";
$i = 1;
foreach($pdf->getPages() as $page){
echo "<h2>Страница ".$i."</h2>";
$data = $page->getDataTm();
echo "<pre>";
print_r($data);
echo "</pre>";
echo "<hr>";
$i++;
} |
можно дальше попробовать с этим работать