打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
使用HtmlAgility和ScrapySharp 读取Select中Option的文本值 | 大想...

ScrapySharp 对HtmlAgility的功能进行了扩展, 应用类似JQuery一样的方式通过css selector来选择html里面的元素。个人认为这样操作封装了HtmlAgility使用上的细节,而且显得更加的面向对象,更加的直观和简便。

比如对于这样的一段html:

1
2
3
4
5
6
7
8
9
<select id='someid'>
<option selected value='0'>所有地区</option>
<option value='1' >广东省</option>
<option value='2' >广西省</option>
<option value='3' >北京</option>
<option value='4' >上海</option>
<option value='5' >福建省</option>
<option value='6' >江西省</option>
</select>

使用HtmlAgility来获取value以及对应的文本值的写法可以是这样的:

1
2
3
4
5
6
7
8
9
10
                HtmlWeb web = new HtmlWeb();
                web.OverrideEncoding = System.Text.Encoding.Default;
                HtmlDocument doc = web.Load(url);
                HtmlNodeCollection nc = doc.DocumentNode.SelectNodes('//select[@id=\'someid\']/option');
                foreach (HtmlNode n in nc)
                {
                    Console.WriteLine(n.Attributes['value'].Value);
                    Console.WriteLine(n.NextSibling.InnerText);
                }

而使用ScrapySharp则可以是这样做:

1
2
3
4
5
6
7
8
9
10
                ScrapingBrowser Browser = new ScrapingBrowser();
                WebPage PageResult = Browser.NavigateToPage(new Uri(url));
                var searchDropdownBox = PageResult.Html.CssSelect('#someid').First();
                var options = searchDropdownBox.CssSelect('option');
                foreach (var option in options)
                {
                    string value = option.GetAttributeValue('value');
                    string text = option.NextSibling.InnerText;
                }

喜欢哪种方式那是因人而异了。

不过这里要注意的是, 要获取option的文本需要用到NextSibling.InnerText。 对于不熟悉的朋友可能要折腾一阵子。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
JS获取下拉列表(select)选中项的值和文本
为Html 的Select 加一个提示语和输入方法
js获取select下拉列表域中的option的value值和文本值
JavaScript innerText与innerHtml与value的区别
图灵社区
获取下拉列表选中项的值和文本
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服