IMHO.WS

IMHO.WS (http://www.imho.ws/index.php)
-   Веб-программирование (http://www.imho.ws/forumdisplay.php?f=29)
-   -   Импорт и публикация информации с других сайтов (http://www.imho.ws/showthread.php?t=95705)

Blind_impulse 11.11.2005 09:46

Импорт и публикация информации с других сайтов
 
Доброе утро,

Задача (аналог киноафишы для сайта):

Импортировать с других сайтом информацию вида:

- название кинотеатра
- фильмы которые там идут
- время и дата сеансов

Аналог afisha.ru

Желательно, чтобы с этими данными можно было манипулировать:

1. в конце рецензии давать список кинотеатров разбитый по дням, с указанием сеансов

http://msk.afisha.ru/cinema/movie/?id=7312341 (внизу страницы)

2. в списке кинотеатров показывать что идет в конкрентном кинотеатре

http://msk.afisha.ru/cinema/schedule/place/?id=5572518

p.s. буду очень длагодарен, фактически впорос стоит - как это сделано на афише.ру. Если есть куда более интересные варианты - будет интересно услышать.

Заранее спасибо

apoc 11.11.2005 11:08

Не понял вопроса ваще... Как это сделать?
- Сделать это можно руцями на пхп... перл... асп... да мало ли на чем...
Кто это может сделать?
- Люди
Бесплатно или нет?
- В зависимости от того к кому обратитесь...

Trotil 11.11.2005 14:20

Цитата:

Сообщение от Blind_impulse
p.s. буду очень длагодарен, фактически впорос стоит - как это сделано на афише.ру.
Заранее спасибо

У них есть наверняка база данных, которая регулярно овновляется... Далее подсредством php строится запрос к БД, формируется html страница и выводится конечному пользователю.
У Вас, как я понял, такой базы в наличии не имеется, и единственный способ - это "грабить" постоянно обновляемые обзоры с других веб-сайтов.
Технология:
1) Ручками. Особо знаний для этого не требуется (разве что основы html).
(+) Простота реализации.
(-) Очень большой объем работы ежедневно.
2) Попробовать автоматизировать этот процесс. Для этого пишется программа на языке, работающем на стороне сервера (perl, php, asp) которая:
• ежедневно (по расписанию) скачивает страницы с нужной вам информацией
• производит его разбор (парсит), вырезая из html кода необходимые данные
• сохраняет полученную информации в Вашу БД
После этого можно спокойно формировать нужные страницы на основе полученных извне данных.
(+) этот процесс можно полностью автоматизировать
(-) незначительные изменения в структуре того сайта, откуда вы будете брать информацию могут привести к тому, что система перестанет работать. Нужно будет оперативно переписываать код.
(-) написание этой программы требует некоторых знаний (php, опыта работы с регулярными выражениями) , которых, как всегда не хватает... :-)))

P.S. Парсинг - "разбор". Получение чего-то меньшего из чего-то большого и дальнейшие монипуляции с ним.

Blind_impulse 11.11.2005 14:42

Благодарю за то, что ответили.

Понимаете, я не думаю, что афиша.ру руками собирает информацию о сеансах, даже если у них большой штат это не удобно...

Интересно, откуда у них эта автоматически обновляемая информация, понять бы это и тогда уже подумать о конкретной реализации.

То есть пока попробую перефразировать вопрос:

не как... а откуда вытаскивать информацию (откуда это может брать афиша.ру)

Заранеее спасибо

Hubbitus 11.11.2005 16:16

Цитата:

Blind_impulse:
не как... а откуда вытаскивать информацию
Ну саим же и отвечаете вобщем-то: вытаскивайте с
Цитата:

Blind_impulse:
афиша.ру

Trotil 11.11.2005 17:18

Цитата:

Сообщение от Blind_impulse
(откуда это может брать афиша.ру)
Заранеее спасибо

Вряд ли вы сможете использовать те же способы, что и афиша.ру... Напишите им письмо, сделайте предложение о сотрудничестве, тогда вы получите доступ к базе... Если это серьезный проект и вы готовы вложить большие деньги в него. Просто так доступ никто не даст.
Цитата:

Сообщение от Blind_impulse
а откуда вытаскивать информацию

В случае нелегального использования информации - только способ, описанный выше.

aoxyz_30330 11.11.2005 23:38

Вообше, если на етой афише используются wебсервисы, то мона ето тоже както испольсовать ...

Cimmerian 18.11.2005 11:03

интересный вопрос. не знаю точно, как поступает афиша, но думаю, они просто покупают эту информацию. узнать у кого - это бы мне и самому очень хотелось.
думаю, что происходит это аналогично тому, как публикуется программа телепередач - платишь централизованно агентству либо за неразобранный доковский файл, либо за подготовленный в xml, и постишь его к себе на сайт. так делают и mail.ru и другие серьёзные партнёры.
мне кажется, с кинотеатрами должна быть похожая ситуация.
очень хотелось бы узнать, у кого именно покупается эта информация.
пока же, за неимением такого источника, успешно реализована автоматическая грабилка афиши, примерно такая, о которой шла речь в начале ветки :) на самом деле, не нужно ежедневно собирать информацию, а раз в неделю. дополнительно, афиша просто мониторится на предмет изменений, и когда таковые обнаруживаются, стягиваются в собственную базу. а уж там что с этим делать - дело техники.


Часовой пояс GMT +4, время: 15:19.

Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.