Парсим буржуйский поисковик от Майкрософт =)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 |
function bing($query, $pages = 1) { $curl = curl_init(); for ($page = 0; $page < $pages; $page++) { curl_setopt_array($curl, array( CURLOPT_URL => 'http://bing.com/search?q=' . urlencode($query) . '&go=Submit&qs=n&pq=' . urlencode($query) . '&sc=0-0&sp=-1&sk=&cvid=cf31c2de13794d18ba48555ec1704d53&first=11&FORM=PERE', CURLOPT_RETURNTRANSFER => true, CURLOPT_USERAGENT => "Mozilla/4.0 (compatible;)", CURLOPT_HEADER => false, CURLOPT_VERBOSE => true, CURLOPT_FOLLOWLOCATION => true, CURLOPT_TIMEOUT => 60, )); $html = curl_exec($curl); preg_match_all('/<li class="b_algo"><h2><a href="(.+)".+>(.+)<\/a><\/h2>.+<p>(.+)<\/p>/Uims', $html, $ok); for ($i = 0; $i < count($ok[0]); $i++) { $serp[] = array( 'url' => trim(html_entity_decode($ok[1][$i])) , 'title' => trim(html_entity_decode(strip_tags($ok[2][$i]))) , 'description' => trim(html_entity_decode(strip_tags($ok[3][$i]))) ); } } curl_close($curl); return $serp; } |
Получаемый результат:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
array (size=10) 0 => array (size=3) 'url' => string 'http://vin.auto.ru/' (length=19) 'title' => string 'Проверка VIN-кода автомобиля на ...' (length=59) 'description' => string 'Проверка вин-кода автомобиля на наличие залоговых обязательств в банках. Легкий поиск ...' (length=162) 1 => array (size=3) 'url' => string 'http://gramota.ru/' (length=18) 'title' => string 'ГРАМОТА.РУ – справочно ...' (length=46) 'description' => string 'Проверка слова: Примеры запросов: чес*ный, проф*ес*ор, ветрен*ый и т. п. Во Владивостоке ...' (length=159) 2 => array (size=3) 'url' => string 'http://www.perevodspell.ru/speller.htm' (length=38) 'title' => string 'Бесплатная проверка орфографии ...' (length=62) 'description' => string 'Проверка орфографии онлайн, проверка текстов на ошибки, сервис проверки правописания ...' (length=161) ... 8 => array (size=3) 'url' => string 'http://bugaga.net.ru/orfografija/' (length=33) 'title' => string 'Проверка орфографии онлайн ...' (length=54) 'description' => string 'Проверка орфографии онлайн предназначена для быстрого нахождения правильного написания ...' (length=168) 9 => array (size=3) 'url' => string 'http://shtrafy-gibdd.ru/' (length=24) 'title' => string 'Штрафы ГИБДД | Онлайн проверка и ...' (length=62) 'description' => string 'Штрафы ГИБДД Сервис создан для того, чтобы вы могли узнать о своих штрафах, получать ...' (length=157) |