XPath  
Автор Сообщение

0
Сообщение XPath

Пацаны, ломаю голову пол дня. Впервые в жизни взялся парсить страницу поэтому много вопросов. 

/html/body[@id='main_page']/div[@id='full']/div[@id='content']/div[@class='clear']/div[@class='center']/div[@class='in']/div[2]/div[1]/div/div

Этот запрос выдает мне строку такого вида:

<a href="zashoder">Заходер<br> Борис Владимирович</a><br> <span>1918-2000</span><br> <span style='font-size:8pt;'> стихов: 85 </span>

Отсюда мне нужно выдернуть:

zashoder

Заходер Борис Владимирович

Со вторым проблем не возникает, но до первого никак не могу добраться. Стоит мне добавить к первому запросу /a:

/html/body[@id='main_page']/div[@id='full']/div[@id='content']/div[@class='clear']/div[@class='center']/div[@class='in']/div[2]/div[1]/div/div/a

И он выдает только:

Заходер<br> Борис Владимирович

 

HALP!



12 апр 2014, 11:05
Профиль Skype

0
Сообщение XPath

/html/body[@id='main_page']/div[@id='full']/div[@id='content']/div[@class='clear']/div[@class='center']/div[@class='in']/div[2]/div[1]/div/div/a

для Заходер<br> Борис Владимирович

/html/body[@id='main_page']/div[@id='full']/div[@id='content']/div[@class='clear']/div[@class='center']/div[@class='in']/div[2]/div[1]/div/div/a@href

для zashoder

 



12 апр 2014, 11:20
Профиль WWW

0
Сообщение XPath

Не поверишь:

/html/body[@id='main_page']/div[@id='full']/div[@id='content']/div[@class='clear']/div[@class='center']/div[@class='in']/div[2]/div[1]/div/div/a@[href]

Выдает:

Заходер Борис Владимирович

Никак не могу понять почему.

В свою очередь:

/html/body[@id='main_page']/div[@id='full']/div[@id='content']/div[@class='clear']/div[@class='center']/div[@class='in']/div[2]/div[1]/div/div/a[@href='zashoder']

Тоже возвращает:

Заходер Борис Владимирович


http://ru-poetry.ru/ Вот собственно сайт который пытаюсь распарсить.



12 апр 2014, 11:42
Профиль Skype

0
Сообщение XPath

проще заюзать http://simplehtmldom.sourceforge.net/

строится DOM и дальше JQuery like селекторы



12 апр 2014, 12:43
Профиль

0
Сообщение XPath

croshim писал(а):

проще заюзать http://simplehtmldom.sourceforge.net/

строится DOM и дальше JQuery like селекторы

Я пишу на C#



12 апр 2014, 12:54
Профиль Skype

0
Сообщение XPath

почему бы не использовать http://htmlagilitypack.codeplex.com/ ?

 

Или это селениум?



12 апр 2014, 13:03
Профиль

1
Сообщение XPath

Попробуй

//div[@style='margin-left:75px']/a/@href

для всех таких элементов,

или

(//div[@style='margin-left:75px']/a/@href)[44]

конкретно для Заходера.



12 апр 2014, 14:20
Профиль

0
Сообщение XPath

Lieksu писал(а):

Попробуй

//div[@style='margin-left:75px']/a/@href

для всех таких элементов,

или

(//div[@style='margin-left:75px']/a/@href)[44]

конкретно для Заходера.

как ни странно запрос работает корректно везде кроме моего компилятора :D буду думать почему, но все равно спасибо

 



12 апр 2014, 14:53
Профиль Skype

0
Сообщение XPath

Добрался до решения, запрос помог, всем спасибо :drink



12 апр 2014, 16:24
Профиль Skype
Начать новую тему Ответить на тему


Перейти:  

На сайте использованы материалы, принадлежащие Blizzard Entertainment. Копирование материалов возможно только c разрешения портала. В противном случае это будет называться уже другим словом.
Рейтинг@Mail.ru