imho.ws |
![]() |
![]() |
![]() |
# 1 |
Guest
Сообщения: n/a
|
Импорт и публикация информации с других сайтов
Доброе утро,
Задача (аналог киноафишы для сайта): Импортировать с других сайтом информацию вида: - название кинотеатра - фильмы которые там идут - время и дата сеансов Аналог afisha.ru Желательно, чтобы с этими данными можно было манипулировать: 1. в конце рецензии давать список кинотеатров разбитый по дням, с указанием сеансов http://msk.afisha.ru/cinema/movie/?id=7312341 (внизу страницы) 2. в списке кинотеатров показывать что идет в конкрентном кинотеатре http://msk.afisha.ru/cinema/schedule/place/?id=5572518 p.s. буду очень длагодарен, фактически впорос стоит - как это сделано на афише.ру. Если есть куда более интересные варианты - будет интересно услышать. Заранее спасибо |
![]() |
# 2 |
Junior Member
Регистрация: 17.08.2003
Адрес: Украина
Сообщения: 150
![]() ![]() ![]() ![]() |
Не понял вопроса ваще... Как это сделать?
- Сделать это можно руцями на пхп... перл... асп... да мало ли на чем... Кто это может сделать? - Люди Бесплатно или нет? - В зависимости от того к кому обратитесь...
__________________
His name is spelled A-P-O-C, with a C - not APOK, because it originates from the word 'apocalypse'... |
![]() |
![]() |
# 3 | |
Advanced Member
Регистрация: 21.04.2005
Адрес: град Москва
Сообщения: 431
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Цитата:
У Вас, как я понял, такой базы в наличии не имеется, и единственный способ - это "грабить" постоянно обновляемые обзоры с других веб-сайтов. Технология: 1) Ручками. Особо знаний для этого не требуется (разве что основы html). (+) Простота реализации. (-) Очень большой объем работы ежедневно. 2) Попробовать автоматизировать этот процесс. Для этого пишется программа на языке, работающем на стороне сервера (perl, php, asp) которая: • ежедневно (по расписанию) скачивает страницы с нужной вам информацией • производит его разбор (парсит), вырезая из html кода необходимые данные • сохраняет полученную информации в Вашу БД После этого можно спокойно формировать нужные страницы на основе полученных извне данных. (+) этот процесс можно полностью автоматизировать (-) незначительные изменения в структуре того сайта, откуда вы будете брать информацию могут привести к тому, что система перестанет работать. Нужно будет оперативно переписываать код. (-) написание этой программы требует некоторых знаний (php, опыта работы с регулярными выражениями) , которых, как всегда не хватает... :-))) P.S. Парсинг - "разбор". Получение чего-то меньшего из чего-то большого и дальнейшие монипуляции с ним. |
|
![]() |
![]() |
# 4 |
Guest
Сообщения: n/a
|
Благодарю за то, что ответили.
Понимаете, я не думаю, что афиша.ру руками собирает информацию о сеансах, даже если у них большой штат это не удобно... Интересно, откуда у них эта автоматически обновляемая информация, понять бы это и тогда уже подумать о конкретной реализации. То есть пока попробую перефразировать вопрос: не как... а откуда вытаскивать информацию (откуда это может брать афиша.ру) Заранеее спасибо |
![]() |
# 5 | ||
мод
IMHO Кодер-200(6,7,8) Регистрация: 29.03.2003
Адрес: Saint-Petersburg, Russia
Пол: Male
Сообщения: 2 734
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Цитата:
Цитата:
__________________
Я делаю Линукс! Присоединяйтесь к свободным людям! Связаться со мной всегда можно по джабберу: Hubbitus@jabber.ru Pahan-Hubbitus. |
||
![]() |
![]() |
# 6 | ||
Advanced Member
Регистрация: 21.04.2005
Адрес: град Москва
Сообщения: 431
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Цитата:
Цитата:
|
||
![]() |
![]() |
# 8 |
Guest
Сообщения: n/a
|
интересный вопрос. не знаю точно, как поступает афиша, но думаю, они просто покупают эту информацию. узнать у кого - это бы мне и самому очень хотелось.
думаю, что происходит это аналогично тому, как публикуется программа телепередач - платишь централизованно агентству либо за неразобранный доковский файл, либо за подготовленный в xml, и постишь его к себе на сайт. так делают и mail.ru и другие серьёзные партнёры. мне кажется, с кинотеатрами должна быть похожая ситуация. очень хотелось бы узнать, у кого именно покупается эта информация. пока же, за неимением такого источника, успешно реализована автоматическая грабилка афиши, примерно такая, о которой шла речь в начале ветки ![]() |