imho.ws
IMHO.WS  

Вернуться   IMHO.WS > Веб-мастеру > Веб-программирование
Опции темы
Старый 11.11.2005, 09:46     # 1
Blind_impulse
Guest
 
Сообщения: n/a

Импорт и публикация информации с других сайтов

Доброе утро,

Задача (аналог киноафишы для сайта):

Импортировать с других сайтом информацию вида:

- название кинотеатра
- фильмы которые там идут
- время и дата сеансов

Аналог afisha.ru

Желательно, чтобы с этими данными можно было манипулировать:

1. в конце рецензии давать список кинотеатров разбитый по дням, с указанием сеансов

http://msk.afisha.ru/cinema/movie/?id=7312341 (внизу страницы)

2. в списке кинотеатров показывать что идет в конкрентном кинотеатре

http://msk.afisha.ru/cinema/schedule/place/?id=5572518

p.s. буду очень длагодарен, фактически впорос стоит - как это сделано на афише.ру. Если есть куда более интересные варианты - будет интересно услышать.

Заранее спасибо
 
Старый 11.11.2005, 11:08     # 2
apoc
Junior Member
 
Аватар для apoc
 
Регистрация: 17.08.2003
Адрес: Украина
Сообщения: 150

apoc Реально крут(а)apoc Реально крут(а)apoc Реально крут(а)apoc Реально крут(а)
Не понял вопроса ваще... Как это сделать?
- Сделать это можно руцями на пхп... перл... асп... да мало ли на чем...
Кто это может сделать?
- Люди
Бесплатно или нет?
- В зависимости от того к кому обратитесь...
__________________
His name is spelled A-P-O-C, with a C - not APOK, because it originates from the word 'apocalypse'...
apoc вне форума  
Старый 11.11.2005, 14:20     # 3
Trotil
Advanced Member
 
Аватар для Trotil
 
Регистрация: 21.04.2005
Адрес: град Москва
Сообщения: 431

Trotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собой
Цитата:
Сообщение от Blind_impulse
p.s. буду очень длагодарен, фактически впорос стоит - как это сделано на афише.ру.
Заранее спасибо
У них есть наверняка база данных, которая регулярно овновляется... Далее подсредством php строится запрос к БД, формируется html страница и выводится конечному пользователю.
У Вас, как я понял, такой базы в наличии не имеется, и единственный способ - это "грабить" постоянно обновляемые обзоры с других веб-сайтов.
Технология:
1) Ручками. Особо знаний для этого не требуется (разве что основы html).
(+) Простота реализации.
(-) Очень большой объем работы ежедневно.
2) Попробовать автоматизировать этот процесс. Для этого пишется программа на языке, работающем на стороне сервера (perl, php, asp) которая:
• ежедневно (по расписанию) скачивает страницы с нужной вам информацией
• производит его разбор (парсит), вырезая из html кода необходимые данные
• сохраняет полученную информации в Вашу БД
После этого можно спокойно формировать нужные страницы на основе полученных извне данных.
(+) этот процесс можно полностью автоматизировать
(-) незначительные изменения в структуре того сайта, откуда вы будете брать информацию могут привести к тому, что система перестанет работать. Нужно будет оперативно переписываать код.
(-) написание этой программы требует некоторых знаний (php, опыта работы с регулярными выражениями) , которых, как всегда не хватает... :-)))

P.S. Парсинг - "разбор". Получение чего-то меньшего из чего-то большого и дальнейшие монипуляции с ним.
Trotil вне форума  
Старый 11.11.2005, 14:42     # 4
Blind_impulse
Guest
 
Сообщения: n/a

Благодарю за то, что ответили.

Понимаете, я не думаю, что афиша.ру руками собирает информацию о сеансах, даже если у них большой штат это не удобно...

Интересно, откуда у них эта автоматически обновляемая информация, понять бы это и тогда уже подумать о конкретной реализации.

То есть пока попробую перефразировать вопрос:

не как... а откуда вытаскивать информацию (откуда это может брать афиша.ру)

Заранеее спасибо
 
Старый 11.11.2005, 16:16     # 5
Hubbitus
мод
IMHO Кодер-200(6,7,8)
 
Регистрация: 29.03.2003
Адрес: Saint-Petersburg, Russia
Пол: Male
Сообщения: 2 734

Hubbitus Бог с наворотамиHubbitus Бог с наворотами
Hubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотамиHubbitus Бог с наворотами
Цитата:
Blind_impulse:
не как... а откуда вытаскивать информацию
Ну саим же и отвечаете вобщем-то: вытаскивайте с
Цитата:
Blind_impulse:
афиша.ру
__________________
Я делаю Линукс! Присоединяйтесь к свободным людям!

Связаться со мной всегда можно по джабберу: Hubbitus@jabber.ru
Pahan-Hubbitus.
Hubbitus вне форума  
Старый 11.11.2005, 17:18     # 6
Trotil
Advanced Member
 
Аватар для Trotil
 
Регистрация: 21.04.2005
Адрес: град Москва
Сообщения: 431

Trotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собойTrotil Имеются все основания чтобы гордиться собой
Цитата:
Сообщение от Blind_impulse
(откуда это может брать афиша.ру)
Заранеее спасибо
Вряд ли вы сможете использовать те же способы, что и афиша.ру... Напишите им письмо, сделайте предложение о сотрудничестве, тогда вы получите доступ к базе... Если это серьезный проект и вы готовы вложить большие деньги в него. Просто так доступ никто не даст.
Цитата:
Сообщение от Blind_impulse
а откуда вытаскивать информацию
В случае нелегального использования информации - только способ, описанный выше.
Trotil вне форума  
Старый 11.11.2005, 23:38     # 7
aoxyz_30330
Junior Member
 
Аватар для aoxyz_30330
 
Регистрация: 22.05.2004
Сообщения: 112

aoxyz_30330 Мелкий засранец
Вообше, если на етой афише используются wебсервисы, то мона ето тоже както испольсовать ...
aoxyz_30330 вне форума  
Старый 18.11.2005, 11:03     # 8
Cimmerian
Guest
 
Сообщения: n/a

интересный вопрос. не знаю точно, как поступает афиша, но думаю, они просто покупают эту информацию. узнать у кого - это бы мне и самому очень хотелось.
думаю, что происходит это аналогично тому, как публикуется программа телепередач - платишь централизованно агентству либо за неразобранный доковский файл, либо за подготовленный в xml, и постишь его к себе на сайт. так делают и mail.ru и другие серьёзные партнёры.
мне кажется, с кинотеатрами должна быть похожая ситуация.
очень хотелось бы узнать, у кого именно покупается эта информация.
пока же, за неимением такого источника, успешно реализована автоматическая грабилка афиши, примерно такая, о которой шла речь в начале ветки на самом деле, не нужно ежедневно собирать информацию, а раз в неделю. дополнительно, афиша просто мониторится на предмет изменений, и когда таковые обнаруживаются, стягиваются в собственную базу. а уж там что с этим делать - дело техники.
 

Опции темы

Ваши права в разделе
Вы НЕ можете создавать новые темы
Вы не можете отвечать в темах.
Вы НЕ можете прикреплять вложения
Вы НЕ можете редактировать свои сообщения

BB код Вкл.
Смайлы Вкл.
[IMG] код Выкл.
HTML код Выкл.

Быстрый переход


Часовой пояс GMT +4, время: 15:17.




Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.