Подведите мышь к ссылке

 


$xhe_host ="127.0.0.1:7010";

// The following code is required to properly run XWeb Human Emulator
require("../../Templates/xweb_human_emulator.php");

// //////////////////////// настройки скрипта /////////////////////////
// файл с данными для скрипта
$keys = file("data/keys.txt");
// файл с результатами
$file_res="res/email.txt";

// глубина прохода в поисковые результаты
$cnt_pages = 10;
// текущая страница
$crnt_page =1;

// скрипт работает в режим отладки
$dbg = true;

// //////////////////////// дополнительные модули ///////////////
// функции
require_once("functions.php");

// /////////////////////// скрипт ///////////////////////////////////////////

debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт запустили");

// кол-во
for($ii=0;$ii {
// получить запрос
$key = trim($keys[$ii]);

// перейти на гугль
$browser->navigate("google.com");

// задаём слово в поиск
$input->set_value_by_name("q",$key);
$input->click_by_name("q");
// нажмём пробел для отключения всплывшей подсказки
$keyboard->send_key(32,true);

// нажать enter
$keyboard->send_key(13,true);

// ждём
sleep(3);

// обнулим перед следующим проходом
$crnt_page=1;

while(true)
{
// получим все ссылки на сайты заключённые в тэгах
$sites=$webpage->get_body_inter_prefix_all("","");
$sites=explode("
",$sites);
// пройдёмся по всем полученным ссылкам
for($i=0;$i {
// переходим на сайт
$site=str_replace("","",trim($sites[$i]));
$site=str_replace("
","",$site);
if($site=="")
continue;
// вывод в панель отладки
//debug_mess("ссылка на сайт : ".$site);

// открыть и сделать активным новый браузер
$browser->set_count(2);
$browser->set_active_browser(1,true);

// переходим на сайт
$browser->navigate($site);
sleep(1);
// перейти на контакты
$anchor->click_by_inner_text("контакты");
$anchor->click_by_inner_text("Контакты");
$anchor->click_by_inner_text("О нас");
$anchor->click_by_inner_text("о нас");
sleep(2);
// ищем все email на странице
preg_match_all('#[\w\d.-_]+@([\w\d.-_]+\.)+[a-zA-Z]{2,6}#i', $webpage->get_source(), $matches);

// пройдёмся по полученным результатам
foreach ($matches[0] as $key=>$value)
{
//debug_mess("мыло: ".$value);
// уберём лишнее
$str_mail=str_replace(">","",$value);
$str_mail=str_replace("<","",$str_mail);
$str_mail=str_replace("mailto:","",$str_mail);
$str_mail=str_replace("/","",$str_mail);
$str_mail=str_replace("mail:","",$str_mail);

// запишем в файл
$textfile->add_string_to_file($file_res,trim($str_mail)."\n",60) ;
}

// закрываем и переходим обратно
$browser->set_active_browser(0,true);
$browser->close_all_tabs();

// убрать дубликаты из файла
dedupe($file_res);
}

// не перешли на следующую страницу
if(!next_page($crnt_page))
break;
}

}

debug_mess(date("\[ d.m.y H:i:s\] ")." скрипт закончил работу
");

// Quit
$app->quit();
?>