Парсер урлов со страницы

Сегодня понадобилось пересобрать со страницы написал парсерок. В принципе это один из этапов работы большого парсера который собирает сначало все со страницы потом парсит контент по этим ссылкам. Мне было в данной ситуации не надо, а надо было просто собрать поэтому я прикрутил к парсеру форму для ввода исходных данных и сделал вывод ссылок прямо на экран браузера. Вот собственно сам код:

<?php
if (isset($_POST['url'])) {
$url=$_POST['url'];
if (isset($_POST['nachalo']) and $_POST['nachalo']!==») {$start=stripslashes($_POST['nachalo']);} else{$start=’<html>’;}
if (isset($_POST['konec']) and $_POST['konec']!==») {$end=stripslashes($_POST['konec']);} else {$end=’</html>’;}
if (isset($_POST['zamena1']) and $_POST['zamena1']!==») $zamena1=$_POST['zamena1'];
if (isset($_POST['zamena2']) and $_POST['zamena2']!==») $zamena2=$_POST['zamena2'];

$content=file_get_contents($url);
$start=strpos($content,$start);
$content=substr($content,$start);
$end=strpos($content,$end);
$content=substr($content,0,$end);

$content=str_replace(‘»‘,»’,$content);
preg_match_all(‘/href=’.*?’/',$content,$pattern);
$c_pattern=count($pattern[0]);
for ($i=0;$i<$c_pattern;$i++){
$links = $pattern[0][$i];
$links=substr($links,6,-1);
$links=str_replace($zamena1,$zamena2,$links);
echo $links.’<br>’; flush(); //// выводим ссылки
}
}else{
echo ‘
<html>
<meta http-equiv=»content-type» content=»text/html; charset=utf-8″>
<title>Парсер УРЛ</title>
<body><center><form method=»post» enctype=»multipart/form-data» action=»">
<label>Вставьте УРЛ с http:// : <input name=»url» style=»width: 160px; value=»Вставьте url для парсинга»></input></label>
<p>Начало парсинга: <input type=»text» name=»nachalo» style=»width: 160px;»></p>
<p>Конец парсинга: <input type=»text» name=»konec» style=»width: 160px;»></p>
<p>Заменить: <input type=»text» name=»zamena1″ style=»width: 160px;»><br>
на: <input type=»text» name=»zamena2″ style=»width: 160px;»></p>
<input type=»submit» value=»Поехали!»>
</form></center></body></html>’;
}
?>

Может конечно код не идеален -  ХЗ, ну я не ГУРУ PHP, а так самоучка :) . Скрипт выполнил поставленную перед ним задачу, а это главное для меня.

Leave a Reply

You must be logged in to post a comment.