![]() |
Импорт и публикация информации с других сайтов
Доброе утро,
Задача (аналог киноафишы для сайта): Импортировать с других сайтом информацию вида: - название кинотеатра - фильмы которые там идут - время и дата сеансов Аналог afisha.ru Желательно, чтобы с этими данными можно было манипулировать: 1. в конце рецензии давать список кинотеатров разбитый по дням, с указанием сеансов http://msk.afisha.ru/cinema/movie/?id=7312341 (внизу страницы) 2. в списке кинотеатров показывать что идет в конкрентном кинотеатре http://msk.afisha.ru/cinema/schedule/place/?id=5572518 p.s. буду очень длагодарен, фактически впорос стоит - как это сделано на афише.ру. Если есть куда более интересные варианты - будет интересно услышать. Заранее спасибо |
Не понял вопроса ваще... Как это сделать?
- Сделать это можно руцями на пхп... перл... асп... да мало ли на чем... Кто это может сделать? - Люди Бесплатно или нет? - В зависимости от того к кому обратитесь... |
Цитата:
У Вас, как я понял, такой базы в наличии не имеется, и единственный способ - это "грабить" постоянно обновляемые обзоры с других веб-сайтов. Технология: 1) Ручками. Особо знаний для этого не требуется (разве что основы html). (+) Простота реализации. (-) Очень большой объем работы ежедневно. 2) Попробовать автоматизировать этот процесс. Для этого пишется программа на языке, работающем на стороне сервера (perl, php, asp) которая: • ежедневно (по расписанию) скачивает страницы с нужной вам информацией • производит его разбор (парсит), вырезая из html кода необходимые данные • сохраняет полученную информации в Вашу БД После этого можно спокойно формировать нужные страницы на основе полученных извне данных. (+) этот процесс можно полностью автоматизировать (-) незначительные изменения в структуре того сайта, откуда вы будете брать информацию могут привести к тому, что система перестанет работать. Нужно будет оперативно переписываать код. (-) написание этой программы требует некоторых знаний (php, опыта работы с регулярными выражениями) , которых, как всегда не хватает... :-))) P.S. Парсинг - "разбор". Получение чего-то меньшего из чего-то большого и дальнейшие монипуляции с ним. |
Благодарю за то, что ответили.
Понимаете, я не думаю, что афиша.ру руками собирает информацию о сеансах, даже если у них большой штат это не удобно... Интересно, откуда у них эта автоматически обновляемая информация, понять бы это и тогда уже подумать о конкретной реализации. То есть пока попробую перефразировать вопрос: не как... а откуда вытаскивать информацию (откуда это может брать афиша.ру) Заранеее спасибо |
Цитата:
Цитата:
|
Цитата:
Цитата:
|
Вообше, если на етой афише используются wебсервисы, то мона ето тоже както испольсовать ...
|
интересный вопрос. не знаю точно, как поступает афиша, но думаю, они просто покупают эту информацию. узнать у кого - это бы мне и самому очень хотелось.
думаю, что происходит это аналогично тому, как публикуется программа телепередач - платишь централизованно агентству либо за неразобранный доковский файл, либо за подготовленный в xml, и постишь его к себе на сайт. так делают и mail.ru и другие серьёзные партнёры. мне кажется, с кинотеатрами должна быть похожая ситуация. очень хотелось бы узнать, у кого именно покупается эта информация. пока же, за неимением такого источника, успешно реализована автоматическая грабилка афиши, примерно такая, о которой шла речь в начале ветки :) на самом деле, не нужно ежедневно собирать информацию, а раз в неделю. дополнительно, афиша просто мониторится на предмет изменений, и когда таковые обнаруживаются, стягиваются в собственную базу. а уж там что с этим делать - дело техники. |
Часовой пояс GMT +4, время: 15:19. |
Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.